Ogni pochi mesi esce un modello “più potente” e parte la stessa domanda in azienda: ci riguarda davvero o è l’ennesimo annuncio? Con Claude Opus 4.8, rilasciato il 28 maggio 2026, la risposta dipende da cosa ci fai. Proviamo a tradurre l’annuncio in conseguenze pratiche, senza slide.

Cosa è cambiato davvero

Tre fatti concreti, verificabili. Il primo: Opus 4.8 è il nuovo numero uno dell’Intelligence Index di Artificial Analysis, a quota 61, davanti a GPT-5.5. È la prima volta che Claude prende la testa di quell’indice. Il secondo: è il modello più capace su computer-use e agenti browser tra quelli testati, con l’84% sul benchmark Online-Mind2Web, ed è l’unico a completare ogni caso del Super-Agent benchmark. Il terzo: il prezzo è invariato rispetto a Opus 4.7, 5 dollari per milione di token in input e 25 in output.

La parte che conta non è il punteggio in sé, ma dove arriva il miglioramento: sulla capacità di agire, non solo di rispondere.

Perché “computer-use” conta per un’azienda

Un chatbot risponde a domande. Un agente ragiona, decide e agisce sui sistemi: apre il gestionale, compila un modulo, cerca un’informazione in un portale, completa un flusso di più passaggi. Il computer-use è la forma più avanzata di questa capacità — l’AI controlla un browser o un desktop come farebbe una persona.

Finora il problema degli agenti non era l’idea, ma l’affidabilità: troppo spesso un flusso di dieci passaggi deragliava al settimo. Il salto di Opus 4.8 è proprio qui. Per un’azienda significa che casi d’uso che un anno fa erano demo — un agente che riconcilia fatture tra due sistemi, che aggiorna schede prodotto, che gestisce un processo ripetitivo end-to-end — diventano abbastanza solidi da provarli sul serio. Abbiamo messo a confronto i modelli su questo terreno nella nostra analisi sui migliori modelli AI per agenti e computer-use.

Cambia qualcosa sul prezzo?

No, ed è una buona notizia. A parità di prezzo arriva più capacità: il rapporto valore/costo migliora senza che tu debba rinegoziare nulla. In input Opus 4.8 è ora allineato a GPT-5.5 (5 dollari per milione di token); in output costa meno ($25 contro $30). Per chi genera testi lunghi, l’output di Claude pesa meno sul budget. Il confronto completo sul rapporto qualità/prezzo dei due frontier è nel nostro ChatGPT contro Claude per l’azienda.

Conviene cambiare modello?

Dipende da dove parti. Se usi già Claude, non devi fare nulla: il nuovo modello è disponibile da subito su tutti i piani e via API, e di norma si passa al nuovo Opus senza interventi. Vale la pena verificare un punto solo: se nel tuo software hai fissato una versione specifica del modello, controlla a quale punta.

Se stai valutando ora quale AI adottare, Opus 4.8 rafforza la posizione di Claude dove era già forte — reasoning, coding, scrittura tecnica in italiano — e aggiunge la leadership sugli agenti. Ma “il migliore sui benchmark” non vuol dire “il migliore per te”: la scelta resta una funzione del tuo caso d’uso, del budget e dei vincoli sui dati.

Cosa non cambia

Il limite di sempre resta: Claude non offre data residency in UE. È conforme GDPR e certificato SOC2 e ISO27001, ma i dati non risiedono in Europa. Per la maggior parte dei casi PMI non è un problema; per PA, sanità e finance regolamentato lo è. In quei contesti la decisione non cambia con Opus 4.8: si valuta una via con residency europea — Mistral, vendor francese self-hostabile, o Google Vertex AI in regione UE. Abbiamo confrontato l’opzione frontier e quella sovrana europea in Claude contro Mistral, e raccolto le opzioni conformi nella guida agli strumenti AI con residency UE e GDPR.

In sostanza: Opus 4.8 alza l’asticella sulle capacità — soprattutto sugli agenti — senza toccare prezzo né vincoli di compliance. Se in azienda stai pensando a un agente che faccia un lavoro ripetitivo end-to-end, oggi il terreno è più solido di sei mesi fa. Se vuoi capire da dove partire sul tuo caso, parlaci del tuo progetto.

Domande frequenti