Inicjatywa MIT SEAL umożliwia AI samodzielną naukę i ciągłą adaptację

Image by Freepik

Inicjatywa MIT SEAL umożliwia AI samodzielną naukę i ciągłą adaptację

Przeczytasz w: 3 min

Badacze z Laboratorium Sztucznej Inteligencji MIT stworzyli innowacyjną strukturę o nazwie SEAL (Self-Adapting LLMs). SEAL umożliwia systemom sztucznej inteligencji naukę nowych umiejętności po początkowym szkoleniu poprzez samokształcenie.

Spieszysz się? Oto najważniejsze informacje:

  • MIT opracowało SEAL, ramy umożliwiające AI samodzielną naukę nowych umiejętności.
  • SEAL przepisuje swoje własne szkolenie, korzystając z samodzielnie generowanych streszczeń, quizów i notatek.
  • Osiągnęło to 40% lepsze zapamiętywanie i 72,5% skuteczność w zadaniach wymagających rozumowania.

Nowy system przewyższa istniejące duże modele językowe, w tym ChatGPT, co badacze wyjaśniają ogólnie pozostaje niezmienne po przeszkoleniu i wymaga intensywnego przeszkolenia, aby nauczyć się nowych informacji.

Głównym przełomem SEAL jest zdolność do pozwalania AI generować własne materiały treningowe, a następnie używać tych materiałów do doskonalenia się. Rzeczywiście, kiedy zaprezentowano mu nowe dane – takie jak artykuł prasowy czy przykładowe zadania – system tworzy uproszczone wyjaśnienia, powiązane fakty lub pytania do praktyki.

Badacze wyjaśniają, że ten proces naśladuje metody uczenia się człowieka, gdzie ludzie zwykle piszą notatki i fiszki, aby poprawić swoje zrozumienie i zapamiętywanie nowych informacji.

Podczas fazy „wewnętrznej pętli”, SEAL przeprowadza niewielką aktualizację znaną jako „samokorekta”. System przeprowadza ocenę „zewnętrznej pętli”, aby zweryfikować poprawę swojej wydajności po aktualizacji. Gdy AI identyfikuje pozytywną zmianę, zapamiętuje modyfikację; w przeciwnym razie, próbuje nowych podejść.

Naukowcy twierdzą, że ten iteracyjny proces pozwala AI na ciągłe doskonalenie swojej wiedzy i adaptację do nowych wyzwań bez potrzeby pełnego przeszkolenia.

Badacze zauważają, że metoda używana przez SEAL różni się od wszystkich tradycyjnych podejść do uczenia ze wzmocnieniem (RL). Agenci w standardowych środowiskach RL uczą się na zasadzie prób i błędów, jak maksymalizować swoje nagrody, kiedy wchodzą w interakcje ze swoim otoczeniem.

SEAL stosuje RL jako narzędzie do szkolenia swojego systemu AI, aby tworzyć i implementować własne zasoby do nauki, co czyni model języka zarówno instruktorem, jak i uczniem. System produkuje „samokorekty”, które obejmują spersonalizowane instrukcje wraz z syntetycznymi danymi do swojego procesu doskonalenia. To podejście umożliwia ciągłe, samodzielne aktualizacje, których tradycyjne metody RL, nie dostosowujące bezpośrednio parametrów modelu, nie są w stanie osiągnąć.

Badacze z MIT przetestowali SEAL na dwóch frontach. Po pierwsze, w nauce nowych faktów, SEAL przekształcił surowy tekst w implikacje i formaty Q&A, co zaowocowało poprawą dokładności o 47%, przewyższającą nawet materiały szkoleniowe GPT-4.1. Po drugie, w zadaniach związanych z abstrakcyjnym rozumowaniem, SEAL osiągnął 72,5% skuteczności, przewyższając modele bez uczenia ze wzmocnieniem czy standardowego szkolenia.

Badacze argumentują, że potencjalne zastosowania są szeroko zakrojone. SEAL może umożliwić różne zastosowania, od spersonalizowanych tutorów AI, przez samoevoluujących współpracowników badawczych, po autonomiczne agenty, które doskonalą się poprzez doświadczenie.

Technologia ma potencjał do przekształcenia systemów AI w przedsiębiorstwach, pozwalając im rozwijać wewnętrzne zdolności myślenia, które zastąpią potrzebę kosztownych procesów przekwalifikowania do obsługi szybkich zmian danych i wymagań użytkowników.

Jednak nadal istnieją wyzwania, na przykład SEAL może cierpieć na to, co badacze nazywają „katastrofalnym zapominaniem”, gdzie nowa nauka nadpisuje poprzednią wiedzę, a proces samokorekty wymaga znacznych zasobów komputerowych.

Aby zminimalizować te problemy, zespół proponuje systemy hybrydowe, które łączą SEAL z zewnętrznymi narzędziami do tymczasowej pamięci, rezerwując aktualizacje SEAL dla niezbędnej, długoterminowej wiedzy.

Pomimo tych przeszkód, badacze z MIT wierzą, że ta technologia pomoże maszynom osiągnąć adaptacyjność na miarę człowieka i zdolności do uczenia się przez całe życie.

Spodobał Ci się ten artykuł? Oceń go!
Był okropny Nie podobał mi się Był w porządku Był całkiem dobry! Był super!

Cieszymy się, że doceniasz to, co robimy!

Cenimy Twoją opinię. Czy możemy liczyć na ocenę na Trustpilot? Zajmie Ci to tylko chwilę. Będziemy zobowiązani. Dziękujemy za wsparcie!

Oceń nas na Trustpilot
0 Na podstawie głosów 0 użytkowników
Tytuł
Komentarz
Dziękujemy za Twoją opinię