Jak autonomiczne są agenty AI? Anthropic przeanalizował miliony interakcji

18 lutego 2026. Anthropic opublikował badanie "Measuring AI agent autonomy in practice", oparte na analizie milionów wywołań narzędzi z Claude Code i publicznego API. To jedno z pierwszych tak dużych badań empirycznych odpowiadających na pytanie: ile autonomii ludzie faktycznie dają agentom AI?

Autonomia rośnie, i to szybko

Między październikiem 2025 a styczniem 2026 czas, przez jaki Claude Code pracuje samodzielnie przed zatrzymaniem się, niemal się podwoił. Na poziomie 99,9 percentyla wzrósł z poniżej 25 minut do ponad 45 minut. To wyraźny sygnał, że użytkownicy coraz chętniej przekazują agentom dłuższe, bardziej złożone zadania.

Trend jest jednoznaczny: zaufanie do agentów AI rośnie. Nasówa się zatem pytanie: czy infrastruktura bezpieczeństwa nadąża za tym tempem?

Nie tylko kod. AI wchodzi w back-office

Choć inżynieria oprogramowania dominuje pod względem wolumenu wywołań narzędzi (49,7%), warto pamiętać o zastrzeżeniu metodologicznym: zadania programistyczne generują wiele sekwencyjnych akcji na jeden projekt, co zawyża ich udział względem liczby faktycznych wdrożeń. Długi ogon zastosowań jest mimo to interesujący:

Automatyzacja back-office 9,1%
Marketing i copywriting 4,4%
Sprzedaż i CRM 4,3%
Finanse i księgowość 4,0%
Analiza danych 3,5%

Agentowe AI przestaje być domeną wyłącznie deweloperów. Firmy zaczynają delegować powtarzalne procesy biznesowe, od generowania raportów po obsługę korespondencji.

49,7% to kod, ale reszta to sygnał: AI-agenci wchodzą w back-office, marketing, sprzedaż i finanse. To dopiero początek.

Bezpieczeństwo: pozytywny obraz

Dane dotyczące bezpieczeństwa są optymistyczne:

80% wywołań narzędzi pochodzi od agentów z co najmniej jednym zabezpieczeniem
Co najmniej 73% operuje z udziałem człowieka w pętli decyzyjnej (human-in-the-loop). Rzeczywisty nadzór może być wyższy, ponieważ Anthropic nie ma wglądu w mechanizmy kontroli po stronie klienta
Jedynie 0,8% akcji ma charakter nieodwracalny

Ekosystem agentów AI rozwija się z zachowaniem zasad ostrożności, przynajmniej na razie.

Dlaczego to ważne?

Badanie Anthropic dostarcza pierwszy solidny, oparty na danych obraz tego, jak agenty AI funkcjonują w praktyce. Nie w teorii ani demonstracjach, lecz w codziennym użyciu na milionach wywołań. Dla organizacji planujących wdrożenie agentów AI to cenne źródło benchmarków dotyczących zarówno możliwości, jak i ram bezpieczeństwa.

Źródło: Anthropic, "Measuring AI agent autonomy in practice", 18 lutego 2026. anthropic.com/research/measuring-agent-autonomy

Jak autonomiczne są agenty AI? Anthropic przeanalizował miliony interakcji

Jak autonomiczne są agenty AI? Anthropic przeanalizował miliony interakcji

Autonomia rośnie, i to szybko

Nie tylko kod. AI wchodzi w back-office

Bezpieczeństwo: pozytywny obraz

Dlaczego to ważne?

Chcesz więcej takich analiz?