AI软件:系统重量级选手

An icon of a key

我上面列出了四个聊天AI重量级选手:ChatGPT, Claude.ai, Microsoft Copilot 和 Google Gemini。

它们的工作方式大致相同,结果也相似。那么哪个最好呢?这个问题会把你带进一个兔子洞。这有点像问哪个城镇提供最好的海滩度假,或者哪个SUV对家庭最好。在这些问题上有很多细微差别,也有大量的自豪感和偏见过滤我们的回答。

对于这种看似简单但极其复杂的软件也是如此。有人认为Claude在语言处理上更有技巧,而ChatGPT在软件代码方面更好。Microsoft Copilot与Microsoft软件套件集成。Google Gemini可以接入Gmail、Google Maps和YouTube。有些差异是有意义的;很多都是细微的。而且每次软件更新时都会不断变化。

An icon of a key

“最好的”软件在一段时间内不会得到解决。如果你尝试足够多的可用工具,你会找到一些最喜欢的。

有两大顶级AI软件。第一个可以称为基础软件,比如ChatGPT及其竞争对手(聊天AI)。这是大多数人今天体验AI的方式。

下一个层级是所有其他软件,它们提供了一个基本上是通往基础软件的窗口。初次接触AI聊天的新手大多不会遇到这些软件,尽管它们并不稀有或晦涩。有些人熟悉Jasper(营销软件)或Perplexity(搜索)。如果没有ChatGPT及其同类,这些软件根本不会存在。

请记住,Adobe、Microsoft、Grammarly、Zoom等主流软件现在都集成了AI工具,但这与从头开始基于聊天机器人界面构建的软件不同。(其他如Otter(转录)在ChatGPT之前就存在,但现在也融入了大型语言模型技术。)

下面我们将看看专门针对出版业的软件,这些软件利用了生成式AI的能力。

软件范式

很久以前,软件是代码,只有工程师才明白它是如何工作的。个人计算机之所以成功,除了它们相对低廉的成本外,还有就是相对容易使用的软件。我们对此并不多加思考,这一切只是围绕在我们身边。

但请考虑一下Microsoft Word,我可以肯定地假设本书99%的读者都在使用它。教一个人如何在Word中写一段文字大约需要10分钟。然后你可以教他们如何创建粗体文本、斜体字以及如何更改基本字体,比如从Calibri改为Arial或Times Roman。接着,如何保存文件和打印文件。如何查找和替换。

然后你就让他们自己去探索。

几年后你会发现他们仍然用空格和制表符来格式化他们的Word段落。并且仍然忘记保存他们的文件,或搞不清他们保存了哪个版本,有时不得不从头重写文本。但他们“知道如何使用Word”。

Word有数百个功能,但用户有三分之一的时间只使用5个命令:粘贴、保存、复制、撤销和加粗。需要几周的培训才能真正学会Word的高级功能;这些功能可以帮助出版商节省数百小时的时间。但大多数人从未这样做。自1985年以来,我一直在使用Word,近四十年了,我从未参加过课程。我甚至不知道自己不知道如何充分利用这款软件的全部功能。

我之所以这样说,是因为这有助于你理解为什么AI软件与任何你曾经使用过的软件都如此不同。它没有附带手册,甚至没有快速入门指南。它只有一个空白屏幕和一个问题:“我能帮你做什么?”

一个对话式AI界面上的欢迎消息,向Thaddeus询问它能提供什么帮助。

没有菜单栏,没有按钮可按,没有键盘快捷键。你提出一个问题,开始聊天,你会得到一些答案。

一个对话式AI界面,用户输入询问如何解释新一代对话式AI与传统工具如Microsoft Word或Excel的区别。

Claude的回答

“使用像我这样的现代对话式AI与传统工具如Microsoft Word或Excel之间有几个关键区别:

“1. 自然语言互动:使用对话式AI,你可以用日常语言来传达你的意图,而不必学习和导航复杂的菜单和功能。你只需以对话的方式解释你想要完成的事情。

“2. 上下文理解:AI助手能够保持上下文并理解对话的流畅性,从而允许更自然的来回对话。传统软件在命令之间没有上下文意识。

“3. 适应性:AI可以动态适应并响应各种请求,而传统工具则限于预定义的功能集。一个AI助手可以在一个界面内帮助进行写作、分析、数学、编码、创意等。”

这很有用,但我想要一些更容易理解的东西。所以我问:

一个对话式AI界面上的用户查询,要求为非技术背景的人提供简单解释。

Claude

“这里有一个简单的方法,可以向没有技术背景的人解释区别:

“将传统软件如Microsoft Word或Excel比作工具,比如锤子或计算器。它有一组固定的功能,你需要学习如何正确使用它以获得你想要的结果。

“另一方面,想象一下现代的对话式AI就像一个聪明的助手,就像一个知识渊博的同事或朋友。你可以用简单的英语与它交谈,它能理解你想做什么。它可以帮你完成各种任务,从写作到数学再到提出创意。

“你不需要学习任何特殊的命令或技巧——只需自然地与它聊天。它会根据你的需求调整,并记住你对话的上下文。随着时间的推移,它会了解你和你的偏好。

“因此,传统软件就像一个静态工具,而对话式AI更像一个智能伙伴,你可以自然地与之互动来完成任务。这是一种更灵活、更个性化、更高效的工作方式。”

嗯。这还不是我想要的。所以我继续了对话:

对话式AI回复建议避免使用技术术语和非技术人员可能无法理解的参考资料。

Claude

“当然,让我试着不用技术术语来解释:

“想象一下你在和一个知识渊博且热心帮助你的朋友交谈。你可以用简单的英语告诉他们你想做什么,无论是写论文、解决数学问题还是为项目头脑风暴。

“你不需要学习和记住一大堆具体的步骤或命令,你只需用自己的话解释你的需求。你的朋友理解上下文,并根据你已经讨论的内容调整他们的帮助。

“这是一种互动的对话,你可以问问题、澄清事情并获得建议。你和这个朋友交流得越多,他们就越能理解你的独特需求和沟通风格。

“现在,想象一下如果你能和一个计算机程序有同样类型的帮助、简单的互动。这就是你可能听说过的新型软件的基本概念。

“不同于旧式软件,你必须学习和使用它的固定功能,这种新软件更像一个知识渊博的朋友。你可以用对话的方式与它交流,它会根据你的自然对话流程来帮助你。

“因此,这是一种更智能、更个性化、更简单的方式,通过像与人交谈一样,与计算机上的各种任务进行互动。这是与旧的、更僵化的软件风格的关键区别。”

总结:我试图通过这些例子做两件事。一是提供一个非常简单的实例,说明聊天机器人软件为何与我们以前使用的任何软件都如此不同。另一个是展示一个聊天如何演变。这不仅仅是一个问题和一个答案。这是一个对话。这是突破的一个重要部分。

聊天AI某种程度上是实习生和知识丰富的顾问的结合。你不能假设它们知道你的意思。你需要解释你想要什么,为什么想要,以及如何能最有帮助。

三种AI软件

An icon of a key

大致来说,今天有三种AI软件可用。第一种是AI基础平台,比如ChatGPT,核心的AI技术。第二种是,暂且称之为,AI附加组件,建立在核心平台上的新软件。你可能没听过很多这些工具,比如Jasper或Rewind。

我的第三类是现有产品中新增AI工具的软件。例如,微软套件的软件在Word、Excel和PowerPoint中加入了新的AI工具。Adobe在Photoshop和Acrobat中增加了AI技术。Grammarly正在围绕新一代LLM技术进行重建。它大致上还是同一个产品,只是增加了AI。

显然,你今天使用的几乎所有软件很快都将融入AI功能。你需要自己评估这些工具是否真的有用,还是只是AI的装饰。

我更感兴趣的是那些从头开始构建的新工具,提供只有AI才能产生的价值。这是下一代软件。