C’è un’illusione che mi capita spesso di smontare nelle prime call con un cliente. Si pensa che leggere documenti con l’AI sia un problema risolto: carichi la fattura, escono i campi ordinati pronti per il gestionale, fine. Nelle demo funziona sempre. Una volta acceso davvero, su 10.000 documenti reali al mese, lo stesso sistema fa pasticci che diventano problemi seri: pagamenti sbagliati e registrazioni contabili da rifare, con il telefono che squilla quando un cliente se ne accorge prima di voi.

La differenza fra una demo e un sistema che gira davvero non sta nel modello AI che usi. Sta in come gestisci i casi in cui il modello sbaglia. Su questo si gioca quasi tutto il valore, e quasi nessuno ne parla. Voglio raccontarvi un modo di costruire questi sistemi che ho visto funzionare bene, partendo da un caso reale di elaborazione di documenti sanitari, ma adattabile a qualsiasi PMI italiana che lavora con fatture, ordini, contratti o bolle.

Perché i documenti reali sono difficili da leggere per l’AI?

Quando un programmatore prova un sistema di lettura automatica in laboratorio, usa scansioni perfette. Quando lo stesso programma viene acceso in azienda, gli arriva la foto fatta dal commerciale al volo in macchina, la fattura del fornitore che ha la stampante che striscia, il modulo compilato a penna con la firma sopra una data importante. Su questi casi i modelli economici sbagliano. Non sempre, e non in modo evidente.

Gli errori che fanno più danni sono quelli silenziosi. Una data del 2025 letta come 2026, un importo di 1.230 euro letto come 1.230,00 in un formato che il gestionale interpreta come 123.000. Il documento viene salvato, il programma non si lamenta, e l’errore esce fuori tre mesi dopo quando qualcuno fa la riconciliazione. A quel punto trovare la causa costa più di tutto quello che si è risparmiato con l’automazione.

Un sistema lineare (carica, leggi, salva) non ha modo di accorgersi di questi casi. Per quello serve un modo diverso di costruirlo.

Come si costruisce un sistema di estrazione che si controlla da solo?

L’idea di base è semplice da spiegare e meno semplice da costruire bene. Il sistema ha quattro stadi, ognuno con un compito chiaro.

  1. Caricamento e preparazione. Il documento arriva (un PDF di 50 pagine, una foto da 8 MB, una scansione storta). Prima ancora di chiamare l’AI il sistema lo prepara: comprime le immagini direttamente sul telefono o sul computer di chi le carica, divide i PDF lunghi in blocchi più piccoli, raddrizza le pagine ruotate. Sembra dettaglio tecnico, in realtà è il passaggio che decide quanti errori farete a valle. Un’immagine preparata male è un errore garantito.

  2. Lettura veloce. Il primo modello AI legge il documento. Si usa un modello economico, bravo su scansioni pulite e impaginazioni regolari. In un sistema fatto bene regge l’80% dei casi senza problemi. Costa pochi centesimi a documento.

  3. Controllo automatico. Un secondo modello, più piccolo e veloce, confronta l’immagine originale con il testo che è venuto fuori. Non controlla la sintassi o la grammatica, controlla i disastri: testo vuoto, contenuto inventato di sana pianta dal modello (è il classico tranello dell’AI, che a volte si mette a riempire gli spazi con cose verosimili ma false), date impossibili, righe completamente illeggibili. Il controllo deve essere indulgente, e questo è il primo punto controintuitivo del sistema.

  4. Recupero con il modello bravo. I documenti che non passano il controllo vengono passati a un modello più potente e più costoso, quello che legge il contesto come farebbe una persona. Riconosce la grafia, capisce le annotazioni a mano, gestisce le impaginazioni complicate. Costa dieci volte di più del primo, ma si usa solo sul 15-20% dei documenti. La media dei costi resta sostenibile.

Quali scelte tecniche fanno la differenza in produzione?

Questo modo di costruire il sistema sembra logico sulla carta. Quando si va davvero in azienda, ci sono cinque dettagli che decidono se funziona o meno.

Far vedere all’utente cosa sta succedendo. Il sistema lavora dal vivo e manda continui aggiornamenti a chi sta caricando i documenti: “sto preparando le immagini”, “sto leggendo la pagina 3 di 12”, “ho dovuto chiamare il modello bravo sulla pagina 7”. Sembra dettaglio estetico, è in realtà la cosa che cambia il comportamento delle persone. Quando vedono che certi tipi di foto fanno scattare il modello costoso, smettono di mandarli e cominciano a scansionare meglio. È formazione gratis, fatta dal sistema invece che dal vostro consulente.

Gestire i limiti dei fornitori. OpenAI, Anthropic e Google (i tre fornitori più usati per questi modelli AI) mettono un tetto a quante richieste si possono fare al minuto. Se il sistema non lo gestisce, si blocca appena il volume cresce. Il modo corretto è aspettare con tempi crescenti (60 secondi, poi 120, poi 240) e dire all’utente quanto manca al prossimo tentativo. Non è elegante, ma evita di perdere documenti.

Mandare insieme quello che si può, in fila quello che non si può. I controlli veloci possono partire tutti insieme, decine alla volta. Le letture pesanti devono andare una dietro l’altra per non sforare i limiti dei fornitori. Sembra distinzione da addetti ai lavori, ma fa la differenza fra un sistema che processa 500 documenti all’ora e uno che ne processa 50.

Liberare la memoria del computer che fa il lavoro. Quando si elaborano immagini grandi a raffica, se i dati non vengono buttati via dalla memoria appena finito di usarli, il sistema si pianta dopo poche decine di file. Va programmato esplicitamente, e tanti se ne dimenticano.

Un’ultima cosa che spesso viene saltata: tenere traccia di tutto quello che fallisce. I documenti che neanche il modello potente riesce a leggere non vanno cancellati né nascosti. Vanno salvati con tutti i dettagli del perché hanno fallito, perché sono i casi su cui si capisce dove il sistema ha ancora limiti.

Quanto costa e quanto rende un sistema di estrazione dati AI?

Facciamo un esempio realistico (per il quadro completo del costo di un progetto AI in azienda vedete l’analisi dedicata). Un’azienda italiana di servizi gestisce 2.000 fatture passive al mese. Oggi le inserisce a mano: 5 minuti a fattura, fanno circa 167 ore di lavoro al mese. A 25 euro l’ora di costo aziendale pieno, sono 4.175 euro al mese in inserimento dati. Più gli errori che escono dopo, difficili da quantificare ma reali.

Un sistema ben fatto su questo flusso:

  • Sviluppo iniziale: 12.000-18.000 euro una tantum
  • Consumo dei modelli AI: 300-500 euro al mese (80% sul modello economico, 20% sul modello potente)
  • Persona che controlla le eccezioni: 10-15 ore al mese
  • Risparmio netto: circa 3.000 euro al mese
  • Tempo di rientro: 4-6 mesi

Il numero che colpisce nei progetti reali non è il risparmio in euro, è la riduzione degli errori a valle. Su un caso che abbiamo seguito l’anno scorso, le contestazioni di fornitori per fatture registrate in modo errato sono scese del 70% nei primi sei mesi. Quello è valore che non vedete subito in busta paga ma che pulisce parecchio rumore dai processi.

Quando non serve un sistema AI per i documenti?

Non tutti i problemi di lettura documenti hanno bisogno di questa complessità. Tre casi in cui è sproporzionata:

  • Volumi sotto i 200 documenti al mese: il tempo di costruirlo non rientra
  • Documenti tutti uguali, prodotti dallo stesso programma (per esempio le fatture elettroniche italiane, che sono già file ordinati e leggibili da qualsiasi gestionale)
  • Casi dove un errore non costa nulla, perché c’è già una persona che controlla a valle e che non sarà tolta mai

Se siete in uno di questi tre scenari, un programma di lettura testo commerciale, o addirittura un semplice lettore di fatture elettroniche, fa il lavoro a un decimo del prezzo. Non c’è gloria nell’usare l’AI dove non serve.

Cosa portarsi a casa

I sistemi lineari (carica, leggi, salva) sono stati la regola per dieci anni perché funzionavano bene sui documenti puliti che girano dentro le aziende strutturate. Adesso che leggiamo anche quello che arriva dal mondo esterno (foto del telefono, scansioni di terzi, moduli compilati a mano), serve un altro modo di pensare il sistema.

Il principio è semplice: il sistema deve sapere quando sta sbagliando e cosa fare in quei casi. Non è una questione di modello più potente, è una questione di come si mette in piedi tutto il flusso. Il modello più potente vi serve come scialuppa di salvataggio, non come barca principale.

Per le PMI italiane che stanno valutando un progetto di questo tipo, il consiglio è quello di sempre: partite da un solo tipo di documento, misurate dove perdete tempo oggi, fate una prova mirata su un campione di documenti reali. Il resto si capisce strada facendo.

Se volete capire se nel vostro flusso documenti ci sono i presupposti per costruire un sistema così, scriveteci. La prima call è gratuita e serve per capire i numeri (volumi, tipi di documento, costi attuali), non per proporvi un preventivo.

Fonti e approfondimenti

FonteArgomentoLink
OpenAIDocumentazione tecnica sui limiti di richieste al minutoplatform.openai.com
AnthropicCapacità del modello Claude di leggere immagini e documenti complessidocs.anthropic.com
Agenzia delle EntrateSpecifiche tecniche della fatturazione elettronica italianaagenziaentrate.gov.it
Forrester”AI Changes the Intelligent Document Processing Market”: GenAI/agentic AI come fattori di rottura nell’IDPforrester.com
Anitec-Assinform”Il Digitale in Italia 2025” (PDF): segmento AI +38,7% YoY; processi amministrativi = 28,2% dei casi d’uso AIaliautonomie.it (PDF)
Osservatorio PolimiProcess Automation 2025: 62% delle grandi aziende italiane usa automazione di processo, PMI ferme al 15%automazione-plus.it

Domande frequenti