הבנת הבינה המלאכותית ומספר מונחים חשובים

An icon of a key

הבינה המלאכותית מגיעה עם שפע של טכנולוגיה ומונחים, שרובם לא מובנים לכל אחד מלבד מדעני נתונים. משתמשי Chat AI לא דורשים ידע מעמיק במונחי בינה מלאכותית או המושגים הטכניים המעורבים. האופי השיחתי של המערכת מאפשר אינטראקציות אינטואיטיביות ללא ידע רקע מיוחד על איך הדברים עובדים. התמקדות במה ש-Chat AI יכול לעשות בפועל היא יותר חשובה.

בהכנת הספר הזה נאבקתי במה שהדבר ‘האחראי’ שעלי לעשות כסופר של ספר על בינה מלאכותית. הגישה הקונבנציונלית היא לספק הסבר קצר על המדע ובחינה של המונחים הנפוצים.

אני לא הולך לעשות זאת.

אני הולך להציע כאן כמה קישורים חיצוניים למה שאני חושב שהם תיאורים קצרים ומובנים של יסודות הבינה המלאכותית.

מה העתיד של הבינה המלאכותית?: McKinsey & Co. (אפריל, 2024) יש להם סט של מסבירנים טובים.

באופן דומה, בינה מלאכותית יוצרת של Gartner (ללא תאריך) אינה רעה.

Futurepedia מציעה סיכום לא רע של יסודות AI (מאי, 2024).

לאחר שטיפלתי ב“איך“, עכשיו אני הולך להציג כמה מושגים שאני חושב שכדאי להבין. לא בגלל שאתם צריכים להכיר אותם כדי להשתמש בתוכנה. אלא משום שקבוצת המונחים הזו מתייחסת לכמה היבטים מרכזיים של איך הדור הנוכחי של AI פועל למעשה.

המקרה שלי לשימוש במונחים ובמושגים האלה הוא עבור מחברים ומוציאים לאור ש-(i) רוצים להעמיק ברמת AI, מכל סיבה שהיא, או (ii) רוצים להבין את ההקשר של הביקורות הנוכחיות על AI, או (iii) רוצים להשתתף בדיונים אסטרטגיים על איך עמיתיהם או הארגונים שלהם צריכים לגשת ל-AI.

במילים אחרות, זה לא מה שאתם צריכים לדעת, אלא מה שאולי תרצו לדעת. הנה הם, לא בסדר אלפביתי:

פקודות ופקודה

אתם יכולים לפתוח תוכנת Chat AI ולהקליד שאלה, בדיוק כמו שאתם עושים כעת בגוגל.

מודל שפה גדול (LLM)

מודלים של שפה גדולה פועלים על ידי ניתוח כמויות עצומות של חומר (בעיקר) כתוב, מה שמאפשר להם לחזות אילו מילים או משפטים צריכים לבוא לאחר מכן בשיחה או ביצירה כתובה. הם לא ‘מבינים’ שפה במובן האנושי, אלא מעבדים טקסט על ידי פירוקו לחלקים קטנים יותר (הנקראים טוקנים), ולאחר מכן המרת הטוקנים למספרים. הם מעבדים את הטקסט כמספרים, ומחזירים עוד מספרים, אשר לאחר מכן מומרים בחזרה לטקסט בפלט. זהו הסבר מפושט יתר על המידה של למה Chat AI לא ‘מכיל’ עבודות מוגנות בזכויות יוצרים: הוא בנוי ממספרים שמייצגים הפשטה רחבה מהטקסטים הבסיסיים.

מודלי שפה גדולים מאומנים על איך שפה משמשת בדרך כלל ואז מייצרים תגובות בהתבסס על הבנה זו. נוטים לזלזל בכמה שרוב השפה ניתנת לחיזוי. Chat AI יכול ליצור טקסט שהוא (לפעמים באופן מזעזע) דומה לספרות קיימת, אבל, בעיצובו, אין לו את היכולת לאחזר קטעים מסוימים או עותקים של טקסטים מוגנים בזכויות יוצרים. (אני יודע, רבים מכם שמעו על התביעה של ניו יורק טיימס נגד OpenAI—הטיימס הצליחו לגרום ל-ChatGPT להחזיר חלקים מסוימים של מאמרים שפורסמו בעבר מילה במילה).

בינה מלאכותית יוצרת

הדבר החשוב ביותר להבין במונח זה הוא החלק “יוצרת”. בינה מלאכותית יוצרת יוצרת טקסט חדש.

טרנספורמטור יוצר מראש (GPT)

זה, המונח הכי נרדי כאן, מתאר סוג מסוים של מודלים לשוניים גדולים שפותחו על ידי OpenAI. “יוצרת” מציין את היכולת שלה ליצור טקסט, “יוצר מראש” מציין שהיא אומנה על גוף גדול של נתוני טקסט, ו“טרנספורמטור“ מתייחס לתוכנה שבה היא משתמשת. לדעת מה GPT מייצג עוזר רק כדי שתבינו מה ה-GPT בצ’אטGPT מייצג.

צ’אטGPT

צ’אטGPT היא התוכנה שאתם רואים; GPT זה מה שמאחורי התוכנה. משתמשים חווים את צ’אטGPT, לא את ה-GPT שמאחוריה. כפי שצוין לעיל, צ’אטGPT היא רק אחת מכמה מערכות צ’אט בינה מלאכותית מקוונות עם פונקציונליות דומה.

מונח נוסף שתתקלו בו לעיתים קרובות ושאינו מוכר לרבים הוא:

קובץ טקסטים

ההגדרה המילונית של קובץ טקסטים היא “אוסף של טקסטים כתובים” (למרות שבפועל, זה לא תמיד טקסט). המונח משמש בהתייחס למה ש-GPT אומנו עליו: אוספים עצומים של (בעיקר) טקסט. נאמר לנו שהאוספים הגדולים ביותר מכילים מאות מיליארדי מילים. עבור בני תמותה רגילים זה בלתי נתפס. האם אינכם חושבים שוויקיפדיה היא עצומה, מכילה מספר עצום של מילים? ובכן, יש בוויקיפדיה רק 4.5 מיליארד מילים - GPT-4 אומן על יותר מטריליון מילים.

אני חושב שחשוב לשקול את הקנה מידה הזה. כותבים, מובן מאליו, מודאגים שה-75,000 מילים, פלוס מינוס, בספרם אולי נספגו במודל לשוני גדול. אולי הם כן (עוד על כך בהמשך). אבל בהנחה שזה המקרה, שקלו כמה מעט ערך יש לכל ספר אחד לכוח הכולל של המודלים הלשוניים הגדולים של היום. זה באמת חסר משמעות. מעבר לחסר משמעות. אפילו 10,000 ספרים הם כסף קטן.