Oprogramowanie AI: Systemowi giganci

An icon of a key

Wymieniłem powyżej czterech gigantów AI: ChatGPT, Claude.ai, Microsoft Copilot i Google Gemini.

Każdy z nich działa mniej więcej tak samo i dostarcza podobne wyniki. Który z nich jest najlepszy? To pytanie prowadzi cię w głąb króliczej nory. To trochę jak pytanie, które miasto oferuje najlepsze wakacje na plaży lub który SUV jest najlepszy dla rodzin. Istnieje ogromna ilość niuansów w tych kwestiach i ogromna ilość dumy i uprzedzeń filtrujących nasze odpowiedzi.

Podobnie jest z tym pozornie prostym, ale niezwykle złożonym oprogramowaniem. Ludzie twierdzą, że Claude ma bardziej wyrafinowane umiejętności językowe, a ChatGPT lepiej radzi sobie z kodem oprogramowania. Microsoft Copilot integruje się z pakietem oprogramowania Microsoft. Google Gemini może połączyć się z Gmail, Google Maps i YouTube. Niektóre różnice są znaczące; wiele jest niewielkich. I ciągle się zmieniają z każdą nową wersją oprogramowania.

An icon of a key

“Najlepsze” oprogramowanie nie zostanie ustalone na długi czas. Jeśli wypróbujesz wystarczającą ilość dostępnych narzędzi, wybierzesz kilka ulubionych.

Istnieją dwie najwyższe klasy oprogramowania AI. Pierwsza to to, co można nazwać oprogramowaniem podstawowym, takim jak ChatGPT i jego konkurenci (Chat AI). Tak większość ludzi doświadcza dziś AI.

Kolejną klasą jest całe inne oprogramowanie, które zapewnia zasadniczo okno do oprogramowania podstawowego. Nowicjusze w rozmowach AI głównie nie zetknęli się z tym oprogramowaniem, chociaż nie jest ono rzadkie ani nieznane. Niektórzy znają Jasper (oprogramowanie marketingowe) lub Perplexity (wyszukiwanie). To oprogramowanie po prostu nie mogłoby istnieć bez ChatGPT i jego odpowiedników.

Pamiętaj, że popularne oprogramowanie od Adobe, Microsoft, Grammarly, Zoom itd. teraz zawiera narzędzia AI, ale jest to inne niż oprogramowanie zbudowane od podstaw na bazie interfejsów chatbotów. (Inne, jak Otter (transkrypcje), istniały przed ChatGPT, ale teraz są wyposażone w technologię dużych modeli językowych.)

Poniżej przyjrzymy się oprogramowaniu specyficznemu dla publikowania, które wykorzystuje zdolności generatywnej AI.

Paradygmaty Oprogramowania

Dawno temu oprogramowanie było kodem i tylko inżynierowie rozumieli, jak to działa. To, co sprawiło, że komputery osobiste odniosły sukces, poza ich stosunkowo niskim kosztem, to oprogramowanie, które było (stosunkowo) łatwe w użyciu. Nie zastanawiamy się nad tym zbytnio; po prostu nas otacza.

Ale zastanów się przez chwilę nad Microsoft Word, programem, który mogę bezpiecznie założyć, że używa 99% czytelników tej książki. Pokazanie komuś, jak napisać akapit tekstu w Wordzie, zajmuje około 10 minut. Następnie możesz pokazać, jak stworzyć pogrubiony tekst, kursywę i jak zmienić podstawową czcionkę, na przykład z Calibri na Arial lub Times Roman. Następnie jak zapisać plik i wydrukować plik. Jak wyszukiwać i zastępować.

A potem zostawiasz ich samych sobie.

Lata później dowiadujesz się, że nadal formatują swoje akapity w Wordzie za pomocą spacji i tabulatorów. I nadal zapominają zapisać swoje pliki, albo mylą się, którą wersję zapisali, czasami musząc odtwarzać tekst od nowa. Ale “wiedzą, jak używać Worda.”

Word ma setki funkcji, ale jedna trzecia użytkowników używa tylko 5 poleceń: Wklej, Zapisz, Kopiuj, Cofnij i Pogrubienie. Nauczenie się zaawansowanych funkcji Worda wymaga kilku tygodni szkolenia; funkcji, które mogłyby pomóc wydawcy zaoszczędzić wiele setek godzin pracy. Ale większość nigdy tego nie robi. Używam Worda od 1985 roku, prawie czterdzieści lat, i nigdy nie brałem kursu. Nawet nie wiem, czego nie wiem o tym, jak w pełni wykorzystać moc tego oprogramowania.

Rozwodzę się nad tym, ponieważ to pomocny sposób na zrozumienie, dlaczego oprogramowanie AI jest zupełnie inne od jakiegokolwiek oprogramowania, z jakim kiedykolwiek pracowałeś. Nie ma podręcznika, nawet szybkiego przewodnika startowego. Pojawia się puste okno i pytanie: “W czym mogę pomóc?”

Wiadomość powitalna na interfejsie konwersacyjnej AI skierowana do Thaddeusa, pytająca, jak może pomóc.

Nie ma paska menu, przycisku do naciśnięcia ani skrótów klawiaturowych. Zadajesz pytanie, zaczynasz czat i dostajesz odpowiedzi.

Interfejs konwersacyjnej AI z pytaniem użytkownika, jak wyjaśnić różnicę między nową generacją konwersacyjnej AI a tradycyjnymi narzędziami jak Microsoft Word czy Excel.

Odpowiedź Claude’a:

“Jest kilka kluczowych różnic między pracą z nowoczesną konwersacyjną AI, taką jak ja, a tradycyjnymi narzędziami jak Microsoft Word czy Excel:

“1. Interakcja w języku naturalnym: Z konwersacyjną AI możesz komunikować swoje intencje za pomocą codziennego języka, zamiast uczyć się i nawigować po skomplikowanych menu i funkcjach. Po prostu wyjaśniasz, co chcesz osiągnąć, w konwersacji.

“2. Zrozumienie kontekstowe: Asystenci AI utrzymują kontekst i rozumieją przepływ rozmowy, co pozwala na bardziej naturalny dialog. Tradycyjne oprogramowanie nie ma świadomości kontekstu od jednego polecenia do drugiego.

“3. Elastyczność: AI może dynamicznie dostosowywać się i odpowiadać na różnorodne prośby, podczas gdy tradycyjne narzędzia są ograniczone do zdefiniowanego zestawu funkcji. Asystent AI może pomóc w pisaniu, analizie, matematyce, kodowaniu, generowaniu pomysłów i wielu innych zadaniach w jednym interfejsie.”

To było przydatne, ale chciałem coś łatwiejszego do zrozumienia. Więc zapytałem:

Zapytanie użytkownika w interfejsie konwersacyjnej AI proszące o proste wyjaśnienie dla nietechnicznej publiczności.

Claude:

“Oto prosty sposób na wyjaśnienie różnicy komuś bez technicznego tła:

“Traktuj tradycyjne oprogramowanie, jak Microsoft Word lub Excel, jak narzędzie, na przykład młotek lub kalkulator. Ma ono zestaw funkcji, które może wykonywać, i musisz nauczyć się, jak go poprawnie używać, aby uzyskać pożądany wynik.

“Z drugiej strony, pomyśl o nowoczesnej konwersacyjnej AI jak o inteligentnym asystencie, jak o dobrze poinformowanym koledze lub przyjacielu. Możesz po prostu rozmawiać z nią zwykłym językiem, a ona rozumie, co próbujesz zrobić. Może ci pomóc w różnych zadaniach, od pisania, przez matematykę, po wymyślanie pomysłów.

“Nie musisz uczyć się żadnych specjalnych komend ani technik—po prostu rozmawiaj z nią naturalnie. Dostosowuje się do twoich potrzeb i pamięta kontekst twojej rozmowy. Z czasem poznaje cię i twoje preferencje.

“Więc podczas gdy tradycyjne oprogramowanie jest jak statyczne narzędzie, którego używasz, konwersacyjna AI jest bardziej jak inteligentny partner, z którym naturalnie współpracujesz, aby załatwiać sprawy. To bardziej elastyczny, spersonalizowany i efektywny sposób pracy.”

Hmm. Nie do końca o to mi chodziło. Więc kontynuowałem rozmowę:

Odpowiedź konwersacyjnej AI doradzająca unikanie technicznego żargonu i odniesień, które mogą być nieznane nietechnicznym osobom.

Claude:

“Oczywiście, spróbujmy jeszcze raz bez używania technicznych terminów:

“Wyobraź sobie, że rozmawiasz z przyjacielem, który jest naprawdę dobrze poinformowany i chętny do pomocy. Możesz po prostu rozmawiać z nim zwykłym językiem o tym, co próbujesz zrobić, czy to pisanie eseju, rozwiązywanie problemu z matematyki, czy burza mózgów na temat projektu.

“Zamiast musieć uczyć się i pamiętać mnóstwo specyficznych kroków lub komend, możesz po prostu wyjaśnić, czego potrzebujesz, własnymi słowami. Twój przyjaciel rozumie kontekst i dostosowuje swoją pomoc na podstawie tego, o czym już rozmawialiście.

“To jest rozmowa w obie strony, gdzie możesz zadawać pytania, wyjaśniać rzeczy i otrzymywać porady. I im więcej rozmawiasz z tym przyjacielem, tym lepiej rozumie twoje unikalne potrzeby i styl komunikacji.

“Teraz wyobraź sobie, że możesz mieć ten sam rodzaj pomocnej, łatwej interakcji, ale z programem komputerowym. To jest podstawowa idea nowych typów oprogramowania, o których możesz słyszeć.

“Zamiast starego stylu oprogramowania, gdzie masz sztywny zestaw funkcji i musisz nauczyć się, jak go poprawnie używać, to nowe oprogramowanie jest bardziej jak znający się na rzeczy przyjaciel. Możesz po prostu rozmawiać z nim w sposób konwersacyjny, a ono rozpozna, jak ci pomóc na podstawie naturalnego przepływu twojej rozmowy.

“To jest mądrzejszy, bardziej spersonalizowany i łatwiejszy sposób na uzyskanie pomocy przy wszelkiego rodzaju zadaniach na komputerze, po prostu rozmawiając z nim jak z osobą. To jest kluczowa różnica w porównaniu do starszego, bardziej sztywnego stylu oprogramowania.”

Podsumowanie: Próbowałem zrobić dwie rzeczy przy pomocy tych przykładów. Jedną z nich było przedstawienie prostego przykładu, dlaczego oprogramowanie chatbotowe jest tak inne od jakiegokolwiek oprogramowania, którego kiedykolwiek używaliśmy. A drugą było zilustrowanie, jak jedna rozmowa może się rozwijać. To nie jest tylko jedno pytanie i jedna odpowiedź. To jest rozmowa. To jest duża część przełomu.

Chatboty AI są pewnego rodzaju połączeniem stażysty i znającego się na rzeczy konsultanta. Nie możesz zakładać, że wiedzą, co masz na myśli. Musisz wyjaśnić, czego chcesz, dlaczego tego chcesz i jak mogą być najbardziej pomocne.

Trzy rodzaje oprogramowania AI

An icon of a key

Ogólnie rzecz biorąc, dostępne są dziś trzy rodzaje oprogramowania AI. Pierwszym są podstawowe platformy AI, takie jak ChatGPT, podstawowa technologia AI. Drugim są, nazwijmy to, dodatki AI, oprogramowanie, które zostało świeżo zbudowane na bazie podstawowych platform. O wielu z nich nie słyszałeś, narzędzia takie jak Jasper czy Rewind.

Moja trzecia kategoria to oprogramowanie z narzędziami AI przyczepionymi do istniejącego produktu. Na przykład pakiet Microsoftu zawiera nowe narzędzia AI w Wordzie, Excelu i PowerPoincie. Adobe dodało technologię AI do Photoshopa i Acrobata. Grammarly jest przebudowywane wokół nowej generacji technologii opartej na LLM. To w większości ten sam produkt, ale z dodanym AI.

Staje się jasne, że niemal całe oprogramowanie, którego dziś używasz, wkrótce będzie zawierać funkcje AI. Będziesz musiał sam ocenić, czy te narzędzia są naprawdę przydatne, czy tylko ozdobą AI.

Bardziej interesują mnie nowe narzędzia, zbudowane od podstaw, aby dostarczyć wartość, którą tylko AI może zapewnić. To jest następna generacja oprogramowania.