AIソフトウェア:システムの重量級

An icon of a key

先に挙げた4つのChat AI重量級:ChatGPT、Claude.ai、Microsoft Copilot、Google Gemini。

これらはほぼ同じように機能し、似たような結果を提供します。では、どれが一番良いのでしょうか?それを問うと、まるでどの町が最高のビーチバケーションを提供するか、どのSUVが家族向けに最適かを尋ねるようなものです。問題には多くの微妙なニュアンスがあり、私たちの回答には多くのプライドや偏見がフィルタリングされています。

この一見シンプルながら非常に複雑なソフトウェアも同様です。Claudeが言語に関する微妙なスキルを持っていると主張する人もいれば、ChatGPTがソフトウェアコードに優れていると言う人もいます。Microsoft CopilotはMicrosoftのソフトウェアスイートと統合されています。Google GeminiはGmail、Google Maps、YouTubeに接続できます。これらの違いのいくつかは意味がありますが、多くはわずかです。そして、それらは新しいソフトウェアリリースごとに絶えず変わります。

An icon of a key

‘最高の’ ソフトウェアは当分の間、決定されないでしょう。利用可能なツールを十分に試してみれば、お気に入りが見つかるでしょう。

AIソフトウェアには2つのトップティアがあります。1つ目は、ChatGPTやその競合他社(Chat AI)のような基盤ソフトウェアです。これがほとんどの人が今日AIを体験する方法です。

次のティアは、基盤ソフトウェアを実質的に窓口として提供するその他のソフトウェアです。AIチャットの新参者はこのソフトウェアに出会ったことがないかもしれませんが、それは珍しいものではありません。Jasper(マーケティングソフトウェア)やPerplexity(検索)に馴染みがある人もいます。このソフトウェアは、ChatGPTやその仲間がなければ存在し得ません。

Adobe、Microsoft、Grammarly、Zoomなどの主流ソフトウェアにはAIツールが組み込まれていますが、これはチャットボットインターフェースに基づいてゼロから構築されたソフトウェアとは異なります。(Otter(トランスクリプション)のように、ChatGPT以前から存在しているが、大規模言語モデル技術が組み込まれているものもあります。)

以下では、生成AIの能力を活用した出版専用のソフトウェアを見ていきます。

ソフトウェアのパラダイム

かつて、ソフトウェアはコードであり、それがどのように動作するかを理解していたのはエンジニアだけでした。パーソナルコンピュータが成功した理由は、その比較的低価格に加えて、(比較的)使いやすいソフトウェアがあったからです。これらについてあまり考えることはありません。それはただ私たちを取り巻いているのです。

しかし、Microsoft Wordについて考えてみてください。この本の読者の99%が使用していると安全に仮定できるプログラムです。Wordでテキストの段落を書く方法を教えるのに約10分かかります。その後、太字テキストの作成方法、イタリックの作成方法、基本フォントの変更方法、たとえばCalibriからArialやTimes Romanへの変更方法を教えます。次に、ファイルの保存方法と印刷方法、検索と置換の方法を教えます。

そして、彼らを放っておきます。

数年後、彼らがまだスペースとタブでWordの段落をフォーマットしていることがわかります。そしてまだファイルの保存を忘れていたり、保存したバージョンについて混乱していたり、時にはテキストを最初から作り直さなければならないこともあります。しかし、彼らは「Wordの使い方を知っている」と言います。

Wordには何百もの機能がありますが、ユーザーが3分の1の時間しか使わないコマンドは5つしかありません:貼り付け、保存、コピー、元に戻す、太字です。Wordの高度な機能を適切に学ぶには数週間のトレーニングが必要です。出版社が何百時間も節約できる機能もあります。しかし、ほとんどの人はそれをしません。私は1985年から、ほぼ40年間Wordを使っていますが、コースを受けたことはありません。ソフトウェアの完全な力を引き出す方法について何も知らないことさえ知りません。

私はこの話を続けていますが、それはAIソフトウェアがこれまでに扱ったどのソフトウェアとも非常に異なる理由を理解するための助けになるからです。マニュアルも、クイックスタートガイドさえも付属していません。表示されるのは空白の画面と一つの質問だけです:「何をお手伝いできますか?」

タデウスに向けられた会話型AIインターフェースのウェルカムメッセージが、どのようにサポートできるかを尋ねている。

メニューバーも、押すボタンも、キーボードショートカットもありません。質問をしたり、チャットを始めたりすると、いくつかの答えが返ってきます。

会話型AIインターフェースで、新世代の会話型AIとMicrosoft WordやExcelのような従来のツールの違いを説明する方法を尋ねるユーザー入力。

Claudeの回答:

「私のような最新の会話型AIとMicrosoft WordやExcelのような従来のツールを使うことには、いくつかの重要な違いがあります:

「1. 自然言語インタラクション: 会話型AIでは、複雑なメニューや機能を学びナビゲートする必要はなく、日常の言葉を使って意図を伝えることができます。会話形式でやりたいことを説明するだけで済みます。

「2. コンテクスト理解: AIアシスタントは会話の流れを理解し、コンテクストを維持します。これにより、より自然なやり取りが可能になります。従来のソフトウェアはコマンドごとにコンテクストを持ちません。

「3. 適応性: AIは様々なリクエストに動的に対応できるのに対し、従来のツールはあらかじめ定義された機能に制限されています。AIアシスタントは執筆、分析、数学、コーディング、アイデアの創出など、単一のインターフェースで様々なタスクを手助けできます。」

それは役に立ちましたが、もっと簡単に理解できるものが欲しかったので、次のように尋ねました:

非技術的なオーディエンスに対する簡単な説明を求めるユーザークエリ。

Claude:

「技術的な背景を持たない人に違いを説明するための簡単な方法は次の通りです:

「伝統的なソフトウェアであるMicrosoft WordやExcelを、ハンマーや電卓のようなツールと考えてください。それは固定された機能のセットを持ち、望む結果を得るためには正しく使い方を学ぶ必要があります。

「一方、最新の会話型AIを知識豊富な同僚や友人のようなスマートアシスタントと考えてください。普通の英語を使って話しかけるだけで、それがあなたのやりたいことを理解します。それは執筆から数学、アイデアの創出まで、あらゆるタスクを手助けしてくれます。

「特別なコマンドや技術を学ぶ必要はありません。自然にチャットするだけです。それはあなたのニーズに適応し、会話のコンテクストを覚えます。時間が経つにつれて、それはあなたとあなたの好みを理解するようになります。

「従来のソフトウェアが使うための静的なツールであるのに対し、会話型AIは自然にやり取りしながら物事を進めるインテリジェントなパートナーのようなものです。それはより柔軟で、個人に合わせた効率的な作業方法です。」

うーん。私が望んでいたものとは少し違います。そこで、会話を続けました:

技術用語や非技術者が理解できないリファレンスを避けるよう助言する会話型AIの応答。

Claude:

「わかりました。技術用語を使わずにもう一度試してみます:

「想像してみてください。非常に知識豊富で助けたがりの友人と話しているとします。エッセイを書いたり、数学の問題を解決したり、プロジェクトのアイデアをブレインストーミングしたりすることについて、ただ普通の英語で話しかけるだけです。

「特定の手順やコマンドを学んで覚える必要はなく、自分の言葉で何が必要かを説明するだけです。その友人はコンテクストを理解し、これまで話し合った内容に基づいて助けを適応させます。

「それは、質問をしたり、物事を明確にしたり、アドバイスを求めたりすることができる、行ったり来たりの会話です。そして、この友人と話せば話すほど、彼らはあなたの独自のニーズやコミュニケーションスタイルをよりよく理解します。

「さて、もしその同じ種類の役立つ、簡単なやり取りをコンピュータプログラムとできたらどうでしょう。それが、あなたが耳にするかもしれない新しいタイプのソフトウェアの基本的なアイデアです。

「古いスタイルのソフトウェアの代わりに、決まった機能のセットがあり、それを正しく使う方法を学ばなければならないこの新しいソフトウェアは、知識豊富な友人のようなものです。普通に会話するだけで、あなたの話の自然な流れに基づいて、どのように助けるかを理解します。

「つまり、コンピュータ上のさまざまなタスクを人と話すように話すだけで助けてもらうための、よりスマートで、よりパーソナルで、より簡単な方法です。これが、古くて厳格なスタイルのソフトウェアとの大きな違いです。」

要約:これらの例を使って2つのことをしようとしていました。1つは、チャットボットソフトウェアがこれまでに使ったどのソフトウェアとも異なる理由を簡単に示すこと。そしてもう1つは、1つのチャットがどのように進化するかを示すことです。それは単なる1つの質問と1つの答えではありません。それは会話です。これが大きなブレークスルーの一部です。

チャットAIは、インターンと知識豊富なコンサルタントの組み合わせのようなものです。彼らがあなたの意味を理解しているとは限りません。あなたが何を望んでいるのか、なぜそれを望んでいるのか、そして彼らがどのように最も役立つかを説明する必要があります。

3種類のAIソフトウェア

An icon of a key

大まかに言えば、現在利用可能なAIソフトウェアには3種類あります。1つ目は、ChatGPTのようなAI基盤プラットフォーム、コアAI技術です。2つ目は、AI追加機能と呼べるもので、コアプラットフォームの上に新たに構築されたソフトウェアです。これらの多くは聞いたことがないでしょう。例えば、JasperやRewindのようなツールです。

私の3つ目のカテゴリーは、既存の製品にAIツールが追加されたソフトウェアです。例えば、マイクロソフトスイートのソフトウェアには、Word、Excel、PowerPointに新しいAIツールが搭載されています。アドビはフォトショップやアクロバットにAI技術を追加しました。グラマリーは、新しい世代のLLMベースの技術を中心に再構築されています。ほとんど同じ製品ですが、AIが追加されています。

現在使用しているほぼすべてのソフトウェアが、すぐにAI機能を組み込むことが明らかになっています。これらのツールが本当に役立つかどうかを自分で評価する必要があります。

私は、AIによってのみ生み出される価値を提供するためにゼロから構築された新しいツールにもっと興味があります。それが次世代のソフトウェアです。