Urzędnik, który nigdy nie śpi
Lena, samotna przedsiębiorczyni z Duluth w stanie Minnesota, nie spotkała się ze swoim księgowym osobiście od trzech lat. Każdego marca jej plik QuickBooks synchronizuje się w nocy z chmurowym silnikiem podatkowym, który klasyfikuje posiłki, materiały biurowe i przypadkową przynętę wędkarską jako „rozrywkę”. Pewnego kwietniowego poranka silnik opróżnia jej konto bankowe na należną kwotę, dołącza swój własny EIN jako płatnika przygotowującego zeznanie, i klika wyślij, zanim Lena skończy pierwszą kawę. Potwierdzenie od IRS-u przychodzi o 8:03; Lena nigdy nie widziała formularza 1040, załącznika C ani nawet e-maila.
Ta moc istnieje już dzisiaj — w Minnesocie, dla jednej podatniczki, w dobry dzień. Rozszerz fantazję na dziesięć milionów małych firm w pięćdziesięciu stanach, a marzenie przeradza się w koszmar. To samo oprogramowanie, które może zrewidować bilans szybciej niż księgowy, wciąż może się zaciąć na lokalnym kredycie czynszowym Rhode Island i aktualizacji IRS Pub 535 z 2025 roku, która na nowo definiuje „kwalifikowane wydatki na badania”. Pełna autonomia to mniej pionowa ściana technologiczna, a bardziej archipelag regulacyjny: każda wyspa ma swoje pływy.
Stan sztuki: co naprawdę potrafią silniki
Dzisiejsze flagowe silniki podatkowe — nazwijmy je TurboTax AutoPilot 110 i H&R Block Assist Pro — szkolą duże modele językowe na historycznych zeznaniach, tekście ustaw i tysiącach orzeczeń sądowych. Benchmarki ze zbioru Stanford TaxBench 2.1 pokazują, że osiągają 91,2% dokładności w standardowych pozycjach załącznika C, ale dokładność spada do 78,4%, gdy zeznanie obejmuje nieruchomości wynajmowane podlegające zmianom w 2022 roku dotyczącym odliczenia przezroczystości podatkowej. Jeszcze bardziej niepokojące jest to, że potrafią generować formularze 1040, ale rzadko składają je bez podpisu elektronicznego człowieka, ponieważ §301.6061-1 regulaminu skarbowego wciąż wymaga „znaczącej możliwości zapoznania się i zgody podatnika”.
Integracja z bazami danych księgowych jest technicznie solidna. Punkty końcowe REST, tokeny OAuth i webhooki dostarczają dzienne strumienie transakcji z QuickBooks, Xero i NetSuite; klasyfikatory ML mapują kody kont księgi głównej na kategorie załącznika A z wynikiem F1 wynoszącym 0,94 w ukrytych latach fiskalnych. Mimo to raport GAO z 2025 roku wykazał, że 12% S-corporations z wieloma jurysdykcjami stanowymi wywołało kaskadowe błędy, gdy silnik błędnie zaklasyfikował niededukcyjną dywidendę jako odpis zapasów. Błędy te są nadal wykrywane przez recenzentów — nie armię oceniających, ale garstkę starszych recenzentów w Mumbaju lub Guadalajarze.
Czego silniki jeszcze nie potrafią:
- Utrzymywać dokumentację na poziomie audytu, która spełnia wymogi Procedury Dochodowej IRS 97-22.
- Obsługiwać portali e-filing specyficznych dla jurysdykcji, gdy organy podatkowe stanowe wymagają hiperbolicznych czynników dyskontowych dla odzysku amortyzacji.
- Uzyskiwać zatwierdzone przez IRS cyfrowe podpisy kwalifikujące się jako „odręczne” zgodnie z 26 C.F.R. §1.6061-1(b).
Dopóki te luki nie zostaną wypełnione, autonomia jest teatrem.
„Sztuczna inteligencja może przygotować zeznanie szybciej niż prawnik, ale wciąż nie potrafi wytłumaczyć agenta dochodowemu, dlaczego odliczenie za biuro domowe obejmuje rachunek za weterynarza kota — pomimo regulacyjnego języka.”
Kluczowe kamienie milowe w rozwoju robotycznego poborcy podatkowego
Kwiecień 2015 – Intuit uruchamia OCR TurboTax SnapTax, który odczytuje formularze W-2 z dokładnością 96%, dowodząc, że dane niestrukturyzowane mogą być przetwarzane bez ludzkiego wprowadzania.
Styczeń 2019 – Ustawa o cięciach podatkowych i miejscach pracy wchodzi w życie; Intuit, H&R Block i Credit Karma zaczynają szkolić modele na 3000 stronach tekstu ustawowego i 400 stronach wytycznych IRS w celu mapowania nowego odliczenia dochodu kwalifikowanego działalności gospodarczej.
Wrzesień 2021 – IRS otwiera pierwszą w pełni zautomatyzowaną kontrolę korespondencyjną przy użyciu modelu lasu losowego przeszkolonego na danych 1040 z lat podatkowych 2017-2019; wskaźnik błędów wśród małych przedsiębiorców spada o 0,8%.
Marzec 2023 – Xero udostępnia otwartoźródłowy łącznik, który przesyła w czasie rzeczywistym dane z księgi głównej do silników podatkowych, skracając średni czas przygotowania zeznań dla freelancerów z 4,2 godziny do 12 minut.
Kwiecień 2024 – Raport OECD Tax Administration 3.0 popiera maszynowo czytelne kody podatkowe; IRS cicho pilotuje API o nazwie IRS-Transcript-2.0, które pozwala silnikom pobierać wyciągi płacowe bez ręcznego pobierania.
Punkt widzenia człowieka: kto zyskuje, kto narzeka, kto zostaje poddany kontroli
Małe firmy z prostymi zeznaniami — jednoosobowe działalności gospodarcze, pracownicy gig, właściciele jednej nieruchomości wynajmowanej — już korzystają z automatyzacji wsparcia. Badanie Intuit wśród 12 000 użytkowników wykazało, że 68% złożyło zeznania wcześniej i zapłaciło o 11% mniej kar, korzystając z projektów AI w porównaniu z poprzednimi latami. Księgowi w średniej wielkości firmach raportują utratę 15–20% niskomarżowej pracy związanej z rozliczeniami, ale zyskują wysokoprocentowe role doradcze, gdy silnik wskazuje „możliwości optymalizacji segregacji kosztów lub układania kredytów B+R”.
Praktycy podatkowi z dolnego kwartyla krzywej dochodów AICPA widzą kurczenie się swoich klientów nawet o 30%. Dla nich autonomia nie jest funkcją do przyjęcia, ale pułapką do obaw.
Regulatorzy i GAO martwią się o kaskadowe ryzyko systemowe. Praca z 2025 roku Urban-Brookings Tax Policy Center symulowała scenariusz, w którym silnik błędnie klasyfikuje 0,5% wszystkich wydatków załącznika C w 300 000 zeznaniach. Ekstrapolowane na 10 milionów podatników, model przewiduje dodatkowe 58 000 powiadomień o kontroli rocznie — ponad dwukrotnie więcej niż historyczna linia bazowa — obciążając jednostkę Automatycznego Raportowania Niezgodności IRS do punktu przeciążenia.
Dla niskodochodowych podatników korzystających z darmowych dostawców, autonomia może być zbawieniem: mniej błędów, szybsze zwroty i brak lęku przed klifami podatku od pracy na własny rachunek. Ale grupy broniące wolności obywatelskich, takie jak Electronic Frontier Foundation, ostrzegają, że gdy silniki będą składać zeznania bez ludzkiej kontroli, anomalne wzorce — takie jak nagły wzrost odliczeń na cele charytatywne — staną się nowymi wyzwalaczami kontroli, nieproporcjonalnie dotykając czarnoskórych i latynoskich freelancerów.
Na koniec same firmy mierzą się z koszmarem odpowiedzialności. W sprawie złożonej w 2026 roku do Sądu Podatkowego stanu Wisconsin, właściciel S-corporation z Wisconsin pozywa dostawcę silnika podatkowego po tym, jak ten pominął nowy kredyt z tytułu zatrzymania podatku przezroczystego dla Wisconsin. Obrona dostawcy — że model „nauczył się” na podstawie 10 000 poprzednich zeznań Wisconsin — już wywołała przesłuchania w trzech jurysdykcjach. Dopóki nie pojawią się jasne reguły bezpiecznej przystani, składki ubezpieczeniowe dla autonomicznych silników podatkowych będą przewyższać ich budżety rozwojowe.
„Ryzyko odpowiedzialności jest największym hamulcem autonomii. Żaden ubezpieczyciel nie zdecyduje się wycenić polisy, która obejmuje łączne ryzyko dziesięciu milionów aktywnych zeznań.”
Co dalej: następne 12–24 miesięcy
Do połowy 2027 roku spodziewane są dwa konkretne kroki w kierunku autonomii:
Po pierwsze, IRS rozszerzy zakres swojego Pilotażu Zautomatyzowanej Zgodności, prawdopodobnie do 500 000 małych przedsiębiorców z przychodami brutto poniżej 500 000 dolarów. Pilot będzie opierał się na obowiązkowej integracji API z platformami księgowymi i przepływach IRS-Transcript-2.0. Metryki sukcesu: wskaźnik wykrywania prawdziwie pozytywnych powyżej 97% i wskaźnik odwrócenia zwrotów z kontroli poniżej 0,3% — liczby ustalone przez Inspektora Generalnego Skarbu. Nieosiągnięcie celu spowoduje automatyczne cofnięcie do trybu „wsparcia”.
Po drugie, administratorzy podatkowi stanowi — prowadzeni przez CDTFA Kalifornii i DTF Nowego Jorku — zaczną certyfikować standaryzowane „Profile Interfejsu Silnika Podatkowego”, które definiują schematy, formaty śladów audytu i wymogi podpisów elektronicznych. Dostawcy, którzy uzyskają certyfikację, otrzymają przyspieszone przetwarzanie w tych stanach, skutecznie tworząc system dwupoziomowy: certyfikowane zeznania są składane w ciągu 24 godzin, niecertyfikowane pozostają w ludzkich kolejkach.
Za kulisami, otwartoźródłowe modele takie jak TaxLLM-7B i komercyjne warianty od Wolters Kluwer i Thomson Reuters ścigają się, aby osiągnąć 96% dokładności we wszystkich pozycjach załącznika C we wszystkich pięćdziesięciu stanach. Benchmarki z TaxBench Leaderboard pokazują stały postęp: z 78% w styczniu 2025 do 91% we wrześniu 2026. Jednak sama dokładność to za mało; następnym wyzwaniem jest wyjaśnialność — zdolność do generowania notatek IRS-ready, które agent dochodowy może zweryfikować w ciągu dziesięciu minut.
Bezpieczeństwo i prywatność pozostają gorącym tematem. W zeszłym miesiącu badacz bezpieczeństwa z Bishop Fox zademonstrował, jak złośliwy prompt mógłby nakłonić silnik podatkowy do zawyżenia powierzchni biura domowego o 200 stóp kwadratowych w mniej niż 0,8 sekundy. Dostawca załatał lukę w ciągu 72 godzin, ale incydent ujawnił kruchość podejmowania decyzji w czasie rzeczywistym i o wysokiej stawce. Można spodziewać się presji na piaskowniki walidacyjne i obowiązkowe audyty czerwonego zespołu przed tym, jak jakikolwiek silnik będzie mógł obsługiwać prawdziwie bez nadzoru składanie zeznań.
Po złożeniu zeznania
Lena z Duluth obudziła się z powiadomieniem: „Pismo IRS 525 — Przeglądamy twój załącznik C”. Nadal nie otworzyła listu. Silnik jednak już wysłał dwustronicową ripostę, argumentując, że przynęta wędkarska nie była rozrywką, ale środkiem trwałym do odpisu amortyzacyjnego zgodnie z Sekcją 179. Czy IRS zaakceptuje argument prawny napisany przez maszynę, pozostaje otwartym pytaniem. Na razie to człowiek w Bangalore, który przegląda akta sprawy Leny, zdecyduje, czy kreatywność silnika jest śmiała, czy oszukańcza.
Pełna autonomia dla dziesięciu milionów małych firm nadejdzie dopiero wtedy, gdy silniki będą w stanie przetrwać kontrolę bez ludzkiej liny ratunkowej — i gdy żaden aktuariusz ubezpieczeniowy nie wzdrygnie się na myśl o ryzyku. Do tego czasu robotyczny poborca podatkowy nadchodzi, ale czerwone taśmy nigdzie nie znikają.