Jak autonomiczne są agenty AI? Anthropic przeanalizował miliony interakcji
18 lutego 2026. Anthropic opublikował badanie "Measuring AI agent autonomy in practice", oparte na analizie milionów wywołań narzędzi z Claude Code i publicznego API. To jedno z pierwszych tak dużych badań empirycznych odpowiadających na pytanie: ile autonomii ludzie faktycznie dają agentom AI?
Autonomia rośnie, i to szybko
Między październikiem 2025 a styczniem 2026 czas, przez jaki Claude Code pracuje samodzielnie przed zatrzymaniem się, niemal się podwoił. Na poziomie 99,9 percentyla wzrósł z poniżej 25 minut do ponad 45 minut. To wyraźny sygnał, że użytkownicy coraz chętniej przekazują agentom dłuższe, bardziej złożone zadania.
Trend jest jednoznaczny: zaufanie do agentów AI rośnie. Nasówa się zatem pytanie: czy infrastruktura bezpieczeństwa nadąża za tym tempem?
Nie tylko kod. AI wchodzi w back-office
Choć inżynieria oprogramowania dominuje pod względem wolumenu wywołań narzędzi (49,7%), warto pamiętać o zastrzeżeniu metodologicznym: zadania programistyczne generują wiele sekwencyjnych akcji na jeden projekt, co zawyża ich udział względem liczby faktycznych wdrożeń. Długi ogon zastosowań jest mimo to interesujący:
- Automatyzacja back-office 9,1%
- Marketing i copywriting 4,4%
- Sprzedaż i CRM 4,3%
- Finanse i księgowość 4,0%
- Analiza danych 3,5%
Agentowe AI przestaje być domeną wyłącznie deweloperów. Firmy zaczynają delegować powtarzalne procesy biznesowe, od generowania raportów po obsługę korespondencji.
49,7% to kod, ale reszta to sygnał: AI-agenci wchodzą w back-office, marketing, sprzedaż i finanse. To dopiero początek.
Bezpieczeństwo: pozytywny obraz
Dane dotyczące bezpieczeństwa są optymistyczne:
- 80% wywołań narzędzi pochodzi od agentów z co najmniej jednym zabezpieczeniem
- Co najmniej 73% operuje z udziałem człowieka w pętli decyzyjnej (human-in-the-loop). Rzeczywisty nadzór może być wyższy, ponieważ Anthropic nie ma wglądu w mechanizmy kontroli po stronie klienta
- Jedynie 0,8% akcji ma charakter nieodwracalny
Ekosystem agentów AI rozwija się z zachowaniem zasad ostrożności, przynajmniej na razie.
Dlaczego to ważne?
Badanie Anthropic dostarcza pierwszy solidny, oparty na danych obraz tego, jak agenty AI funkcjonują w praktyce. Nie w teorii ani demonstracjach, lecz w codziennym użyciu na milionach wywołań. Dla organizacji planujących wdrożenie agentów AI to cenne źródło benchmarków dotyczących zarówno możliwości, jak i ram bezpieczeństwa.
Źródło: Anthropic, "Measuring AI agent autonomy in practice", 18 lutego 2026. anthropic.com/research/measuring-agent-autonomy
