Розуміння штучного інтелекту та деякі ключові терміни

An icon of a key

Штучний інтелект супроводжується великою кількістю технологій та термінології, більшість з яких незрозумілі всім, крім фахівців з обробки даних. Користувачам Chat AI не потрібно глибоке знання термінології штучного інтелекту чи технічних концепцій. Розмовний характер системи дозволяє інтуїтивні взаємодії без спеціальних знань про те, як усе працює. Зосередження на тому, що Chat AI насправді може робити, є важливішим.

Готуючи цю книгу, я боровся з тим, що є ‘відповідальним’ для мене як автора книги про штучний інтелект. Звичайний підхід - це надати коротке пояснення науки та огляд часто використовуваних термінів.

Я не збираюся цього робити.

Я запропоную тут кілька зовнішніх посилань на те, що я вважаю досить зрозумілими короткими описами основ штучного інтелекту.

Яке майбутнє штучного інтелекту?: McKinsey & Co. (квітень, 2024) має хороший набір пояснень.

Також Gartner’s Generative AI (не датовано) не поганий.

Futurepedia пропонує непоганий огляд Основ штучного інтелекту (травень, 2024).

Відмовившись від того, як це зробити, я тепер представлю деякі терміни, які, на мою думку, є цінними для розуміння. Не тому, що ви повинні їх знати, щоб користуватися програмним забезпеченням. Тільки тому, що цей набір термінів стосується деяких ключових аспектів того, як насправді працює поточне покоління штучного інтелекту.

Мій випадок використання для розгляду цих термінів і концепцій - це автори та видавці, які (i) хочуть піти на рівень глибше в штучному інтелекті, з будь-якої причини, або (ii) хочуть зрозуміти контекст поточних критичних зауважень щодо штучного інтелекту, або (iii) хочуть внести свій вклад у стратегічні дискусії про те, як їхні колеги чи організації повинні підходити до штучного інтелекту.

Іншими словами, це не те, що вам потрібно знати, а те, що вам може бути цікаво знати. Ось вони, у неалфавітному порядку:

Підказки та підказування

Ви можете відкрити програмне забезпечення Chat AI і просто ввести питання, так само, як ви робите це зараз у Google.

Велика мовна модель (ВММ)

Великі мовні моделі працюють, аналізуючи величезну кількість (переважно) письмових матеріалів, що дозволяє їм передбачати, які слова або речення мають бути наступними у розмові або творі. Вони не «розуміють» мову у людському сенсі, натомість обробляють текст, розбиваючи його на менші частини (так звані токени), а потім перетворюють токени у числа. Вони обробляють текст як числа, перетворюючи більше чисел, які потім знову перетворюються на текст на виході. Це надто спрощене пояснення того, чому Chat AI не «містить» захищені авторським правом роботи: він побудований з чисел, які представляють величезну абстракцію від початкових текстів.

ВММ навчаються на тому, як зазвичай використовується мова, і потім генерують відповіді на основі цього розуміння. Ми схильні недооцінювати, наскільки передбачуваною є більшість мови. Chat AI може генерувати текст, який (іноді вражаюче) схожий на існуючу літературу, але за дизайном не має можливості відтворювати конкретні уривки або копії захищених авторським правом текстів. (Я знаю, багато з вас чули про позов New York Times проти OpenAI - Times змогла змусити ChatGPT відтворити деякі частини раніше опублікованих статей дослівно).

Генеративний штучний інтелект

Найважливіше, що потрібно зрозуміти про цей термін, це частина «генеративний». Генеративний штучний інтелект генерує новий текст.

Генеративний попередньо натренований трансформер (GPT)

Це, найбільш технічний термін тут, описує конкретний тип ВММ, розроблений OpenAI. «Генеративний» вказує на його здатність створювати текст, «попередньо натренований» означає, що він був навчений на великому обсязі текстових даних, а «трансформер» посилається на програмне забезпечення, яке він використовує. Знання того, що означає GPT, корисне лише для того, щоб зрозуміти, що представляє собою GPT у ChatGPT.

ChatGPT

ChatGPT - це програмне забезпечення, яке ви бачите; GPT - це те, що стоїть за програмним забезпеченням. Користувачі взаємодіють із ChatGPT, а не з GPT за ним. Як зазначено вище, ChatGPT - це лише одна з декількох онлайн-систем Chat AI з подібною функціональністю.

Ще один термін, який ви часто зустрічатимете і який є незнайомим для багатьох:

Корпус

Словникове визначення корпусу - це «збірка письмових текстів» (хоча, насправді, це не завжди текст). Термін використовується з посиланням на те, на чому навчаються GPT: величезні корпуси (переважно) тексту. Нам кажуть, що найбільші корпуси містять сотні мільярдів слів. Для простих смертних це неможливо осягнути. Ви не вважаєте Вікіпедію величезною, що містить величезну кількість слів? Ну, у Вікіпедії лише 4,5 мільярда слів - GPT-4 навчався на понад трильйоні.

Я думаю, що важливо враховувати цей масштаб. Автори, зрозуміло, турбуються, що 75,000 слів, більше або менше, у їхній книзі могли бути втягнуті у велику мовну модель. Можливо, вони і були (більше про це нижче). Але якщо це так, подумайте, наскільки мала цінність будь-якої однієї книги для загальної потужності сьогоднішніх великих мовних моделей. Це справді незначно. Навіть 10,000 книг - це дрібниці.