
Image generated with OpenAI
Opinia: Dlaczego agenci AI są przyszłością codziennej sztucznej inteligencji
2025 wydaje się być rokiem Agentycznej Sztucznej Inteligencji. OpenAI, Microsoft, Anthropic i inne czołowe technologiczne firmy wydały do tej pory swoje najbardziej zaawansowane modele AI, zdolne do wykonywania skomplikowanych zadań, które jeszcze w zeszłym roku były niemożliwe. Ale czym dokładnie są agenci AI i ile z tej technologii to rzeczywistość, a ile tylko hype?
Nadążanie za trendami w dziedzinie AI w ostatnich latach może być męczące. Przeszliśmy od podstawowej AI do generatywnej AI, potem do rozumowania AI, a teraz, agenci AI dominują w dyskusjach. W ciągu ostatnich kilku miesięcy, wiele technologicznych firm wprowadziło nowe agenty AI i podkreślało, jak atrakcyjne stają się przepływy pracy, które je łączą.
W styczniu OpenAI wprowadziło swój pierwszy agenta AI, Operatora, zdolnego do samodzielnego wykonywania zadań takich jak przeglądanie internetu, rezerwowanie restauracji czy kupowanie biletów na koncert, na podstawie Twoich preferencji i kryteriów.
Dwa miesiące później, chiński start-up AI Zhipu wypuścił AutoGLM Rumination, darmowego agenta AI, który może działać niezależnie i planować podróże dla użytkowników. Zaledwie kilka dni temu, Microsoft wprowadził „Computer Use” dla Copilot Studio, dodając więcej autonomicznych możliwości do agentów AI, w tym zdolność przejęcia kontroli nad pulpit użytkownika.
Jednak ten trend nie dotyczy tylko firm wprowadzających na rynek fajne nowe produkty – to skomplikowane i dynamicznie rozwijające się pole, które łączy różne formy AI z interakcją człowieka. Zarówno entuzjaści technologii, jak i eksperci wykazują silny optymizm wobec Agentic AI.
„Jednym z trendów, którym również się cieszę, jest przepływ pracy agentów AI” – powiedział ekspert AI i współzałożyciel Coursera i DeepLearning, Andrew Ng, na konferencji BUILD 2024 Snowflake’a w listopadzie. „Gdybyś zapytał, na którą technologię AI warto zwrócić największą uwagę? Powiedziałbym, że jest to Agentic AI.”
Więc, czym dokładnie są agenci AI? Czy działają tak dobrze, jak twierdzą eksperci? Oto krótki przegląd najważniejszych aspektów tej powstającej technologii i najnowszych osiągnięć.
Co to są agenci AI?
Jak pokazały firmy takie jak OpenAI i Microsoft, agenci AI to technologie zdolne do wykonywania skomplikowanych zadań, autonomicznie łączące różne aplikacje i oprogramowanie.
W zasadzie są to „tradycyjne” chatboty AI, ale bardziej zaawansowane, zdolne do wykonywania zadań, które przekraczają to, do czego przyzwyczailiśmy się w ciągu ostatnich dwóch lat. Zadania te obejmują planowanie, przeglądanie sieci, zapamiętywanie twoich zainteresowań, a nawet robienie zakupów spożywczych bez krok po kroku prowadzenia, ponieważ same rozwiązują problemy.
Google Cloud definiuje agentów AI jako „systemy oprogramowania, które wykorzystują AI do dążenia do celów i wykonywania zadań w imieniu użytkowników”.
To, co czyni te modele AI naprawdę wyjątkowymi, to ich zaawansowane zdolności rozumowania, które pozwalają im przetwarzać różne typy informacji – audio, tekst, wideo, kod i obrazy – jednocześnie. Mogą one rozumieć skomplikowane sytuacje w sposób, w jaki zrobiłby to człowiek, podejmować działania i interakcje z oprogramowaniem i platformami.
Wiele firm technologicznych teraz stara się doprowadzić swoje modele AI do tego kolejnego poziomu.
Zaledwie kilka dni temu, OpenAI ogłosiło, że jego modele AI o3 i o4-mini potrafią „myśleć” za pomocą obrazów i manipulować nimi – na przykład przycinając je lub przekształcając. Tymczasem nowa funkcja Microsoftu „Computer Use” umożliwia jego agentom AI rozpoznawanie graficznych interfejsów użytkownika.
„Jeśli osoba potrafi korzystać z aplikacji, agent też może,” powiedział Charles Lamanna, Corporate Vice President, Business & Industry Copilot w Microsoft, w ogłoszeniu.
Następny poziom: technologia AI Agentic
Podczas gdy wiele firm technologicznych rozwija ultrainteligentne chatboty AI, agentyczna AI idzie o krok dalej. Ta technologia koncentruje się na tworzeniu systemów, w których wielu agentów AI może współdziałać i wykonywać różne zadania, aby dostarczyć bardziej precyzyjne i kompletne wyniki.
Podczas swojego wykładu na temat „Moc agentów AI” na niedawnym wydarzeniu Tech Talk, które miałam okazję uczestniczyć, zorganizowanym przez eDreams, ekspertka ds. AI, Patricia Gutierrez Faxas, wyjaśniła, że te systemy mogą przyjmować różne struktury. Systemy wieloagentowe mogą rozbić skomplikowane zadania na prostsze, przydzielić je specjalizowanym agentom i tworzyć różne typy sieci.
Agent AI może pełnić rolę „Nadzorcy”, delegując mniejsze zadania do innych specjalistycznych agentów, lub wielu agentów może pracować jednocześnie nad różnymi zadaniami i koordynować je, aby dostarczyć finalny rezultat. Niektóre z korzyści tych systemów to poprawa dokładności, większa prywatność i zmniejszenie błędów.
Andrew Ng zgadza się z tym podejściem. Podczas swojego przemówienia na BUILD 2024, podkreślił znaczenie agentywnych przepływów pracy AI do przetwarzania skomplikowanych zadań z znacznie lepszymi wynikami. Skok w wydajności od modeli takich jak GPT-3.5 do GPT-4 – i ich silniejsze wyniki na punktach odniesienia kodowania – jest w dużej mierze wynikiem agentywnych przepływów pracy i agentywnego rozumowania.
Jak agenci AI wpłyną na nasze życie?
Firmy technologiczne podejmują różne podejścia do agentywnego AI. OpenAI skupia się na pomysłach dla codziennych użytkowników. Podczas uruchamiania Operatora, zespół wyjaśnił w filmie, że osoba mogłaby po prostu pomyśleć o daniu, które chciałaby przygotować, poprosić ChatGPT o znalezienie najlepszego przepisu, a nawet zlecić mu zakup niezbędnych składników z internetowego supermarketu.
Model AI może zadawać pytania uzupełniające i zatrzymać się przed wykonaniem kluczowych zadań, takich jak finalizowanie zakupu za pomocą karty kredytowej użytkownika. Użytkownicy mogą ustawić limity wydatków lub wymagać od asystenta potwierdzenia przed zakupem czegokolwiek.
Możliwości wykorzystania agentów AI przez zwykłych ludzi wydają się nieograniczone, ale najpopularniejsze dotychczas zastosowania to działanie jako agenci podróży, osobiste zakupy i asystentki administracyjne – przecież kto by nie chciał spersonalizowanej technologii, która wysyła e-maile, zapamiętuje ważne urodziny i zajmuje się podatkami?
Microsoft przyjął bardziej korporacyjne podejście. Firma pokazała, jak agencje marketingowe mogą wykorzystywać agentów AI do automatyzacji zbierania danych rynkowych i generowania analiz opartych na wglądach, czy jak duże przedsiębiorstwa mogą ich używać do przetwarzania faktur w swoich systemach.
Jednak, mimo że wszystkie te przypadki użycia brzmią rewolucyjnie, eksperci zgadzają się, że przed nami jeszcze długa droga. Większość ludzi nie może jeszcze korzystać z agentów AI, aby ulepszyć swoje codzienne życie, ponieważ wiele z tych funkcji, jak Operator, jest dostępnych tylko dla użytkowników Pro, której subskrypcja kosztuje 200 dolarów miesięcznie.
Czy więc AI oparte na agentach spełnia nadzieje, które w nią pokładano?
Wiele nagłówków prasowych obiecuje nową rewolucję AI prowadzoną przez Agentic AI. Na pewno jest wiele zamieszania w branży – a rzeczywistość może nie być daleko za nim. Niedawny raport udostępniony przez IBM ujawnił, że wielu programistów aktywnie bada i rozwija tę technologię.
„IBM i Morning Consult przeprowadzili badanie wśród 1000 twórców, którzy budują aplikacje AI dla przedsiębiorstw, a 99% z nich stwierdziło, że badają lub rozwijają agentów AI,” wyjaśniła dr Maryam Ashoori, Dyrektor Zarządzania Produktem w IBM watsonx.ai. „Więc tak, odpowiedzią jest, że 2025 rok będzie rokiem agenta.”
Jednak eksperci zauważają, że istnieje wiele interpretacji tego, czym są prawdziwe systemy AI i jak powinny działać. W rezultacie, postęp i efektywność obecnych systemów AI często zależy od perspektywy i standardów osoby oceniającej technologię.
Pewne jest, że wielu ekspertów i decydentów głęboko wierzy w tę technologię i inwestuje w nią duże środki. Najnowsze badania wykazały, że 84% liderów IT ufa systemom AI tak samo jak ludziom, a OpenAI przewiduje około 125 miliardów dolarów dochodu do 2029 roku.
Chociaż technologia Agentic AI nie jest jeszcze w pełni rozwinięta i jej adopcja nie jest tak powszechna jak chatbotów – głównie z powodu jej wysokich kosztów – to jasne jest, że ogromny optymizm i entuzjazm wokół tego trendu są na tyle silne, aby napędzić znaczące zmiany w nadchodzących miesiącach.