ChatGPT Agent to nowy poziom automatyzacji AI

ChatGPT i reklamy. Co planuje OpenAI na przyszłość?
fot. Andrew Neel (źródło: Unsplash)

Era pasywnych chatbotów dobiegła końca. OpenAI zaprezentowało ChatGPT Agent, czyli system, który nie tylko rozmawia z użytkownikiem, ale realnie wykonuje złożone operacje, samodzielnie poruszając się po internecie, analizując dane i uruchamiając programy. To kolejny krok w stronę inteligentnych asystentów, którzy nie tylko odpowiadają, ale też działają.

Jak działa ChatGPT Agent?

ChatGPT Agent to inteligentna hybryda oparta na trzech elementach: Operatorze, Deep Research i modelu konwersacyjnym ChatGPT. Każdy z tych komponentów wnosi coś innego – Operator umożliwia interakcje z graficznym interfejsem stron internetowych, Deep Research służy do zaawansowanej analizy informacji, a ChatGPT odpowiada za płynność dialogu i podejmowanie decyzji w oparciu o intencje użytkownika.

Agent korzysta z własnego wirtualnego komputera, wyposażonego w przeglądarkę testową oraz terminal. Może symulować ruchy myszki, wypełniać formularze, filtrować wyniki, a nawet pobierać i analizować pliki, w tym także PDF-y. W razie trudności, AI wykorzystuje zdolności rozumowania, a jeśli zadanie go przerasta, to po prostu przekazuje kontrolę użytkownikowi.

Co potrafi ChatGPT Agent?

Nowe możliwości robią wrażenie, ponieważ Agent potrafi na przykład sprawdzić Twój kalendarz, przeanalizować najnowsze e-maile i przygotować briefing o nadchodzących spotkaniach. Może zaprojektować japońskie śniadanie i jednocześnie zamówić potrzebne składniki w sklepie internetowym. Przyda się też w pracy do porównywania ofert i tworzenia prezentacji, czy też zarządzania arkuszami kalkulacyjnymi.

W środowisku firmowym agent może automatyzować wiele żmudnych czynności, takich jak wyszukiwanie ofert, uzupełnianie danych czy planowanie działań projektowych. Dodatkowo, użytkownik może ustawić cykliczne zadania, np. cotygodniowe generowanie raportów.

Wersja demonstracyjna pokazała także scenariusze z życia codziennego: od planowania randki z rezerwacją stolika w odpowiednim terminie, po regularne wnioskowanie o miejsce parkingowe w biurze. To realne ułatwienie, choć trzeba przyznać, że szybkość działania nadal bywa ograniczeniem, ponieważ niektóre operacje potrafią zająć nawet kilkanaście minut.

Deep Research i analiza danych

Jednym z mocnych filarów systemu jest Deep Research, czyli specjalistyczny komponent służący do przeszukiwania internetu i tworzenia złożonych raportów. Agent potrafi analizować treści tekstowe, pliki graficzne i dokumenty PDF, prezentując wyniki w czytelny sposób z odniesieniami do źródeł.

W testach porównawczych, system osiągnął 26,6% w benchmarku Humanity’s Last Exam. Jest to wynik znacznie przewyższający inne rozwiązania tego typu, jak DeepSeek. To dowód na to, że nowy agent nie tylko działa, ale i potrafi myśleć.

Bezpieczeństwo i kontrola użytkownika

ChatGPT Agent to potężne narzędzie, ale OpenAI nie zapomniało o bezpieczeństwie. AI prosi o pozwolenie przed podjęciem każdej istotnej decyzji, unika finansowych transakcji i pozwala na przejęcie kontroli w dowolnym momencie. Szczególnie zadania wymagające logowania są celowo przerywane, a użytkownik musi wtedy wprowadzić dane samodzielnie.

Wbudowane zabezpieczenia mają chronić przed próbami tzw. prompt injection, czyli przejęcia agenta przez złośliwe skrypty na stronach internetowych. To istotne w czasach, gdy AI może poruszać się po sieci tak samo swobodnie, jak człowiek.

Dostępność i ograniczenia

ChatGPT Agent dostępny jest już dla subskrybentów planów Pro, Plus i Team. Użytkownicy Pro otrzymują 400 wiadomości miesięcznie, natomiast pozostali 40, z możliwością dokupienia dodatkowych kredytów. Aby aktywować funkcję, wystarczy przełączyć się na tryb Agenta w menu narzędzi ChatGPT.

OpenAI zapowiada, że to dopiero początek i wkrótce dostęp otrzymają również użytkownicy biznesowi (Enterprise) i edukacyjni (Education), a funkcje Agenta mają być sukcesywnie rozbudowywane.

Czy to już rewolucja?

Choć Agent robi duże wrażenie, nie jest wolny od ograniczeń. Wciąż zdarza się, że AI niepoprawnie interpretuje dane lub wykonuje zadania z opóźnieniem. Agent nie zawsze odróżnia wiarygodne źródła od plotek, a jego „halucynacje”, choć rzadsze niż w starszych modelach to nadal mogą się zdarzać.

Jednak kierunek jest jasny, OpenAI i konkurencja (Google, Microsoft, Apple, Anthropic) dążą do stworzenia w pełni autonomicznych asystentów AI. Sam Altman zapowiedział, że 2025 będzie rokiem agentów i wygląda na to, że dotrzymuje słowa.

Źródło: OpenAI

Chcesz być na bieżąco? Śledź ROOTBLOG w Google News!