本文将深入探讨OK Computer模式如何在Word、PPT和Excel等Office三大件中实现更智能的工作流程,以及它如何推动AI从“助手”向“执行者”的转变。通过具体案例和实际操作,我们将看到AI在办公自动化领域的巨大潜力和未来发展方向。
过去一年,AI一直向“更智能的助手”方向发展——帮我们整理文档、搜集信息、写代码,进步飞快。我们眼见AI在各个领域展现出惊人的智力,文字、图片、视频、音乐,仿佛任何人类技能都可以学习并复刻。
我开始期待,AI何时能完全接管我的工作:替我写文档、回飞书消息、参加各种会议,甚至处理繁琐但又不得不做的日常任务。但现实是,除了编程类工作,对大部分职业来说,AI目前在工作中还是以copilot的身份在发挥作用,即由人类制定方向,AI 执行拆分后的子任务。由于缺乏真实的上下文和工作环境,AI没有像人一样针对一件事的完整记忆,也无法突破对话框限制像我们一样使用各种工具,所以结果只能差强人意。
但最近,kimi最新发布的ok computer模式让我看到了新的突破口,我们距离“AI真正替人类在办公桌前处理琐碎事务”又近了一步。这场变革将从Office三大件:Word、PPT、Excel开始。
原理:虚拟电脑赋能AI
上面提到,AI全流程接管工作的重要制约,是AI缺少我们日常使用的工具。我们也看到,厂商们持续在给AI配上各种各样的工具,比如代码生成、网络搜索、PPT制作等等,来增强能力边界。而ok computer采取的是更加彻底的做法,直接给AI配了一台虚拟的电脑。这样一来,AI就可以像人类一样,随时安装和使用各种软件,自由切换任务,极大提升了工具的丰富性和组合能力。
这听起来好像区别不大。下面我们用office三大件分别找场景来看一下,虚拟机模式到底有何优势。
PPT:1:1 还原真人工作流
如果你尝试过让AI 助手帮你做 PPT,你大概会得到这样一份作品:
我这里的指令,是要求AI做一份黑神话武器集主题的PPT,要求尽可能还原游戏的真实调性,每个武器一页。而上面这份显然不是特别合格,你可以看到不管是调性、目录中的内容事实、配图都有点一言难尽。
背后的原因是,目前厂商提供的PPT 能力其实就是机械套模板的过程。套模版不是问题,我以前做PPT也要套模板,问题在于套的过于死板。而同样的任务,我们交给OK computer试一下。
可以看到kimi开始打开电脑,并制定任务。注意这里的任务处理流程,不是机械收集信息然后套模版,而是和真人一样,分析整体风格、找信息列表、找配图,然后合成PPT。最终结果如下:
显然,ok computer的产出完爆了上面那份。更准确的信息,更适配的风格,还完成了真实配图。同样的事情如果让我来做,我不觉得我能做得更好。
虚拟机模式下,AI有更加完整的决策权以及工具使用能力,所以它可以向人一样的去一个信息源一个信息源搜索对比,找到所需的信息、图片,然后把这些信息整合成最终的PPT。这个过程中,AI还可以用代码来丰富样式…是的,首页这一P是通过代码写的布局,这就有点作弊了…
Excel:专业调查员级别的处理
这也是ok computer的统治区。Ok computer支持上传最大1,000,000行的Excel交给他做处理,他会自己使用各种工具来做数据分析并给出结论。如果你经常需要用到Excel的各种公式,或者经常需要频繁去学习如何变换表格结构、如何清洗数据、各种Excel使用小窍门… 忘掉那些吧。直接把任务丢给AI,你友好的网上邻居会帮你把活干好,然后把成品的文件发给你。
另外,因为在虚拟机中AI拥有完全的操作权限,你大可以将几件事情交给他一起做。先深度收集信息,然后把信息整理成Excel里,然后再把信息清洗后做数据分析,最后再把数据分析的结果可视化…连自己准备源数据的功夫都省了。
话不多说,开机干活。
经过一系列干活步骤,最终 kimi 提供了一个html和一些中间汇报材料给我们。中间具体编写的脚本什么的我们就不看了,这也是人机协作的未来趋势——异步汇报化,所有的任务都应当被延时完成,完成后提供过程步骤,有需要才查证。
打开html,里面包含了对数据的分析以及中间一些关键波动的解释,此外,网站中也附了原始数据excel的下载地址,方便追溯过程。但是,如果所有的信息已经通过一页网页完整诠释了,那我们还要Excel 有什么用呢?
word:中文语境下最强的deep research
再说Word。OpenAI发布DeepResearch已经很久了,后续grok、claude各家也纷纷提供了相应的能力。但不知道你有没有发现,他们的 deep research 越来越倾向于节约成本,用十几分钟甚至几分钟就匆匆交差,像极了应付作业的大学生。实测下来,kimi就是当下中文语境最强的DeepResearch工具。
下面这篇文档是我用一句话生成的,让他帮我去调研搜集出国申学校的相关资料。这个过程执行了大概一个小时,然后交付了这一份 2w字的文档。不夸张地说,同样一份文档如果找教培机构会收几千块钱。
那deep research和ok computer的区别是什么呢?我个人认为,前者勉强算是后者的能力子集,因为获取信息写文档的过程,往往只需要查找、浏览、整理这三个步骤,所以他不需要那么多的工具,只需要配备搜索和浏览器使用就可以完成任务。而“勉强”的点则在于,kimi应该是针对 deep research的场景做了额外的训练,以增强其信息搜集的完备程度。这也是其最出彩的点。
最后
对了,上一篇中我们提到过如何将kimi接入Claude code让他来操作你的电脑。但如果完全没有技术背景、也不想了解终端等工具的使用,那ok computer就是你最好的选择。官方给 AI 配的电脑,和让 AI 操作我们的电脑,本质上是没有区别的。所以上篇中我们提到的所有事情,在ok computer模式下也是可用的,也包括让他去各种网站搜集信息,基于你的偏好筛选赚钱商机并把商机做成一个网页交给你审阅的过程。
今天的AI,终于迈出了“替我干活”的那一步。过去我们总说AI是助手,永远隔着一道屏障帮你“参考”。而OK Computer这样的模式,第一次让AI有机会坐到办公桌前,去执行完整的任务流。当然,它离“完全接管我的工作”还有距离——它没法了解电脑外的事情,不管是面对面的信息还是其他的人情世故。但在执行层面上,AI已经能帮我完成越来越多“我知道该怎么做但懒得做”的部分。
AI替代人类的过程不会是一瞬间的革命,而是一场漫长的交班:我们交出重复、机械的部分,AI逐步接手,直到有一天,它不再需要等我们的指令。也许那时,我们终于能有时间去做点真正属于人的事——思考、判断、创造。
作者【紫兆】,微信公众号:【于惊雷】