Jak autonomiczne są agenty AI? Anthropic przeanalizował miliony interakcji
18 lutego 2026 — Anthropic opublikował badanie „Measuring AI agent autonomy in practice", oparte na analizie milionów interakcji z Claude Code i API. To jedno z pierwszych tak dużych badań empirycznych odpowiadających na pytanie: ile autonomii ludzie faktycznie dają agentom AI?
Autonomia rośnie — i to szybko
Między październikiem 2025 a styczniem 2026 czas, przez jaki Claude Code pracuje samodzielnie przed zatrzymaniem się, niemal się podwoił. Na poziomie 99,9 percentyla wzrósł z poniżej 25 minut do ponad 45 minut. To wyraźny sygnał, że użytkownicy coraz chętniej przekazują agentom dłuższe, bardziej złożone zadania.
Trend jest jednoznaczny: zaufanie do agentów AI rośnie szybciej, niż przewidywała większość analityków. Kluczowe pytanie brzmi — czy infrastruktura bezpieczeństwa nadąża za tym tempem?
Nie tylko kod — AI wchodzi w back-office
Choć inżynieria oprogramowania dominuje (49,7% wywołań narzędzi), długi ogon zastosowań jest równie interesujący:
- Automatyzacja back-office — 9,1%
- Marketing i copywriting — 4,4%
- Sprzedaż i CRM — 4,3%
- Finanse i księgowość — 4,0%
- Analiza danych — 3,5%
Agentowe AI przestaje być domeną wyłącznie deweloperów. Firmy zaczynają delegować powtarzalne procesy biznesowe — od generowania raportów po obsługę korespondencji.
49,7% to kod, ale reszta to sygnał: AI-agenci wchodzą w back-office, marketing, sprzedaż i finanse. To dopiero początek.
Bezpieczeństwo: pozytywny obraz
Dane dotyczące bezpieczeństwa są optymistyczne:
- 80% wywołań narzędzi pochodzi od agentów z co najmniej jednym zabezpieczeniem
- 73% operuje z udziałem człowieka w pętli decyzyjnej (human-in-the-loop)
- Jedynie 0,8% akcji ma charakter nieodwracalny
Ekosystem agentów AI rozwija się z zachowaniem zasad ostrożności — przynajmniej na razie.
Dlaczego to ważne?
Badanie Anthropic dostarcza pierwszy solidny, oparty na danych obraz tego, jak agenty AI funkcjonują w praktyce — nie w teorii ani demonstracjach, lecz w codziennym użyciu przez setki tysięcy użytkowników. Dla organizacji planujących wdrożenie agentów AI to cenne źródło benchmarków dotyczących zarówno możliwości, jak i ram bezpieczeństwa.
