Програмне забезпечення AI: Головні системи

An icon of a key

Я перерахував вище чотири головні системи Chat AI: ChatGPT, Claude.ai, Microsoft Copilot і Google Gemini.

Вони працюють більш-менш однаково і дають подібні результати. Тож яка з них найкраща? Це питання заводить вас у кролячу нору. Це трохи схоже на питання, яке місто пропонує найкращий пляжний відпочинок, або який позашляховик найкращий для сімей. Є величезна кількість нюансів у цих питаннях і велика кількість гордості та упереджень, що впливають на наші відповіді.

Так само і з цим, здавалося б, простим, але надзвичайно складним програмним забезпеченням. Люди стверджують, що Claude має більш тонкі навички роботи з мовою, а ChatGPT краще працює з програмним кодом. Microsoft Copilot інтегрується з пакетом програмного забезпечення Microsoft. Google Gemini може підключатися до Gmail, Google Maps і YouTube. Деякі з відмінностей мають значення; багато - незначні. І вони постійно змінюються з кожним новим випуском програмного забезпечення.

An icon of a key

«Найкраще» програмне забезпечення не буде визначено ще деякий час. Якщо ви експериментуєте з достатньою кількістю доступних інструментів, ви оберете деякі улюблені.

Є два верхніх рівні програмного забезпечення AI. Перший - це те, що можна назвати основним програмним забезпеченням, програмним забезпеченням, таким як ChatGPT та його конкуренти (Chat AI). Так більшість людей сьогодні взаємодіє з AI.

Наступний рівень - це все інше програмне забезпечення, яке забезпечує, по суті, вікно в основне програмне забезпечення. Новачки в чатах з ШІ здебільшого не стикалися з цим програмним забезпеченням, хоча воно не є рідкісним чи маловідомим. Деякі знайомі з Jasper (маркетингове програмне забезпечення) або Perplexity (пошук). Це програмне забезпечення просто не існувало б без ChatGPT та його аналогів.

Слід пам’ятати, що основне програмне забезпечення від Adobe, Microsoft, Grammarly, Zoom та інших тепер включає інструменти ШІ, але це відрізняється від програмного забезпечення, яке створене з нуля на основі інтерфейсів чатботів. (Інші, такі як Otter (транскрипції), існували до ChatGPT, але тепер вони насичені технологією великих мовних моделей.)

Нижче ми розглянемо програмне забезпечення, специфічне для видавництва, яке використовує можливості генеративного ШІ.

Парадигми програмного забезпечення

Давно, коли програмне забезпечення було кодом і тільки інженери розуміли, як воно працює. Що зробило персональні комп’ютери успішними, крім відносно низької вартості, це програмне забезпечення, яке було (відносно) легким у використанні. Ми не багато думаємо про все це; воно просто оточує нас.

Але подумайте, на мить, про Microsoft Word, програму, яку, я можу з упевненістю сказати, використовує 99% читачів цієї книги. Потрібно приблизно 10 хвилин, щоб показати комусь, як написати абзац тексту в Word. Потім можна показати їм, як створити жирний текст, курсив і як змінити основний шрифт, можливо, з Calibri на Arial або Times Roman. Потім, як зберегти файл і надрукувати файл. Як здійснити пошук і заміну.

І тоді ви залишаєте їх самостійно.

Через роки ви виявляєте, що вони все ще форматують свої абзаци в Word за допомогою пробілів і табуляцій. І все ще забувають зберігати свої файли або плутаються, яку версію вони зберегли, іноді змушені відновлювати текст з нуля. Але вони “знають, як користуватися Word.”

Word має сотні функцій, але третину часу користувачі використовують лише 5 команд: Вставити, Зберегти, Скопіювати, Скасувати і Жирний. Потрібно кілька тижнів навчання, щоб правильно освоїти розширені функції Word; функції, які можуть допомогти видавцю заощадити сотні годин часу. Але більшість цього ніколи не роблять. Я використовую Word з 1985 року, майже сорок років, і ніколи не брав курсів. Я навіть не знаю, чого я не знаю про те, як витягти повну потужність з цього програмного забезпечення.

Я говорю про це, тому що це корисний спосіб зрозуміти, чому програмне забезпечення ШІ настільки відрізняється від будь-якого програмного забезпечення, з яким ви коли-небудь працювали. Воно не поставляється з інструкцією, навіть не з Керівництвом швидкого старту. Воно поставляється з порожнім екраном і питанням: “Чим я можу допомогти.”

Привітальне повідомлення на інтерфейсі розмовного ШІ, адресоване Таддеусу, з питанням, чим можна допомогти.

Немає панелі меню, немає кнопки для натискання, немає клавішових скорочень. Ви задаєте питання, починаєте чат, і отримуєте деякі відповіді.

Інтерфейс розмовного ШІ з введенням користувача, який запитує, як пояснити різницю між новим поколінням розмовного ШІ та традиційними інструментами, такими як Microsoft Word або Excel.

Відповідь Клода:

“Є кілька ключових відмінностей між роботою з сучасним розмовним ШІ, таким як я, і традиційними інструментами, такими як Microsoft Word або Excel:

“1. Взаємодія природною мовою: З розмовним ШІ ви можете спілкуватися своєю повсякденною мовою, а не вивчати та орієнтуватися в складних меню та функціях. Ви просто пояснюєте, що хочете досягти, у розмовній манері.

“2. Контекстуальне розуміння: Асистенти ШІ зберігають контекст і розуміють хід розмови, що дозволяє більш природній діалог. Традиційне програмне забезпечення не має контекстуальної обізнаності від однієї команди до наступної.

“3. Адаптивність: ШІ може динамічно адаптуватися і відповідати на широкий спектр запитів, тоді як традиційні інструменти обмежені заздалегідь визначеним набором функцій. Асистент ШІ може допомогти з написанням, аналізом, математикою, кодуванням, генерацією ідей та багато іншого в одному інтерфейсі.”

Це було корисно, але я хотів щось легше для розуміння. Тож я запитав:

Запит користувача на інтерфейсі розмовного ШІ з проханням про просте пояснення для нетехнічної аудиторії.

Клод:

“Ось простий спосіб пояснити різницю людині без технічного фону:

“Думайте про традиційне програмне забезпечення, таке як Microsoft Word або Excel, як про інструмент, наприклад, молоток або калькулятор. Він має фіксований набір функцій, які він може виконувати, і вам потрібно навчитися правильно ним користуватися, щоб отримати бажаний результат.

“З іншого боку, уявіть собі сучасний розмовний AI як розумного асистента, як обізнаного колегу або друга. Ви можете просто говорити з ним звичайною англійською, і він розуміє, що ви намагаєтеся зробити. Він може допомогти вам з різними завданнями, від написання до математики і до створення ідей.

“Вам не потрібно вчити спеціальні команди чи техніки—просто спілкуйтеся з ним природно. Він адаптується до ваших потреб і запам’ятовує контекст вашої розмови. З часом він дізнається вас і ваші вподобання.

“Тому, в той час як традиційне програмне забезпечення схоже на статичний інструмент, який ви використовуєте, розмовний AI більше схожий на інтелектуального партнера, з яким ви взаємодієте природно, щоб виконати завдання. Це більш гнучкий, персоналізований та ефективний спосіб роботи.”

Гмм. Не зовсім те, що я хотів. Тому я продовжив розмову:

Відповідь розмовного AI з порадою уникати технічного жаргону та посилань, які можуть бути незрозумілі нетехнічним людям.

Клод:

“Звичайно, давайте спробую знову без використання технічних термінів:

“Уявіть, що ви говорите з другом, який дуже обізнаний і готовий допомогти вам. Ви можете просто говорити з ним звичайною англійською про те, що ви намагаєтеся зробити, будь то написання есе, розв’язання математичної задачі або обмірковування ідей для проекту.

“Замість того, щоб вчити і запам’ятовувати багато конкретних кроків або команд, ви можете просто пояснити, що вам потрібно, своїми словами. Ваш друг розуміє контекст і адаптує свою допомогу на основі того, що ви вже обговорювали.

“Це взаємна розмова, де ви можете ставити питання, уточнювати речі і отримувати поради. І чим більше ви спілкуєтеся з цим другом, тим краще він розуміє ваші унікальні потреби і стиль спілкування.

“А тепер уявіть, що ви можете мати той самий тип корисної, легкої взаємодії, але з комп’ютерною програмою. Це основна ідея нових типів програмного забезпечення, про які ви, можливо, чули.

“Замість старого стилю програмного забезпечення, де є жорсткий набір функцій і потрібно вчити правильний спосіб його використання, це нове програмне забезпечення більше схоже на обізнаного друга. Ви можете просто говорити з ним розмовно, і він зрозуміє, як вам допомогти на основі природного потоку вашої дискусії.

“Отже, це розумніший, більш персоналізований і легший спосіб отримувати допомогу з усіма видами завдань на вашому комп’ютері, просто розмовляючи з ним, як з людиною. Це ключова різниця від старого, більш жорсткого стилю програмного забезпечення.”

Резюме: Я намагався зробити дві речі з цими прикладами. Одна з них - запропонувати дуже простий приклад того, чому програмне забезпечення чат-ботів так відрізняється від будь-якого програмного забезпечення, яке ми коли-небудь використовували. І інша - проілюструвати, як один чат може розвиватися. Це не просто одне питання і одна відповідь. Це розмова. Це велика частина прориву.

Чат-AI є свого роду поєднанням інтерна та обізнаного консультанта. Ви не можете припускати, що вони знають, що ви маєте на увазі. Вам потрібно пояснити, що ви хочете, чому ви це хочете і як вони можуть бути найбільш корисними.

Три види програмного забезпечення AI

An icon of a key

Грубо кажучи, сьогодні доступні три види програмного забезпечення AI. Перше - це базові платформи AI, як ChatGPT, основна технологія AI. Друге - назвемо це, доповнення AI, програмне забезпечення, яке створено на основі основних платформ. Ви не чули про багато з них, такі як Jasper або Rewind.

Моя третя категорія - це програмне забезпечення з AI-інструментами, приєднаними до існуючого продукту. Наприклад, у пакеті програмного забезпечення Microsoft з’явилися нові AI-інструменти в Word, Excel і PowerPoint. Adobe додала технологію AI до Photoshop і Acrobat. Grammarly перебудовується на основі нової генерації технології LLM. Це в основному той самий продукт, але з додаванням AI.

Стає ясно, що майже все програмне забезпечення, яке ви використовуєте сьогодні, незабаром матиме AI-функції. Вам потрібно буде самостійно оцінити, чи ці інструменти дійсно корисні або просто є вітринами AI.

Мене більше цікавлять нові інструменти, створені з нуля, щоб забезпечити цінність, яку може надати лише AI. Це наступне покоління програмного забезпечення.