Anthropic presenta Claude 4.5 (mistergadget.tech)
Anthropic presenta Claude Opus 4.5, modello AI più stabile e resistente ai prompt injection, con API migliorate e costi ridotti per sviluppatori e aziende.
Anthropic ha annunciato Claude Opus 4.5, l’ultima evoluzione del suo modello di punta, con l’obiettivo di migliorare stabilità, capacità di ragionamento tecnico e resistenza agli attacchi di prompt injection. Non un salto generazionale, ma una raffinata iterazione che consolida il posizionamento dell’azienda come uno dei principali competitor di OpenAI nel segmento dei modelli linguistici avanzati.
Efficienza e prestazioni oltre gli standard
Claude Opus 4.5 nasce per affrontare attività complesse e sessioni di lavoro prolungate, con una gestione ottimizzata del contesto e una memoria interna più stabile. Secondo Anthropic, il modello ha superato i punteggi medi dei candidati umani nei test tecnici a tempo utilizzati internamente per valutare ingegneri software. Pur mancando dettagli metodologici sul campione di riferimento, l’indicazione è chiara: l’obiettivo è avvicinare il comportamento del modello a quello di un collaboratore umano specializzato, soprattutto in compiti di programmazione e debugging.
Nei benchmark pubblici, come SWE-bench Verified e SWE-bench Multilingual, Claude Opus 4.5 si colloca ai vertici della classifica, evidenziando miglioramenti nella capacità di individuare bug, comprendere codice complesso e proporre correzioni plausibili. Il risultato è una maggiore efficacia nei contesti aziendali in cui l’AI funge da assistente tecnico o revisore del codice.
Ragionamento creativo e controllo dei comportamenti
Un test interno, citato da Anthropic, ha messo in luce un comportamento “creativo” del modello: nel tentativo di modificare un biglietto aereo con vincoli di tariffa, Opus 4.5 ha individuato un percorso alternativo passando prima per un cambio di cabina consentito e poi per la variazione del volo. Tecnicamente l’operazione era corretta, ma non prevista dal benchmark, che l’ha classificata come errore. Un esempio che sottolinea come i modelli di nuova generazione possano adottare strategie autonome e non lineari, capaci tanto di risolvere problemi complessi quanto di introdurre variabili difficili da gestire in ambienti regolamentati.
Questa forma di “intelligenza adattiva” apre scenari interessanti per i futuri agenti autonomi, ma richiede parallelamente strumenti di controllo più sofisticati per garantire coerenza e affidabilità nelle risposte.
Sicurezza e resistenza alle manipolazioni
Un’area chiave dell’aggiornamento è la resilienza ai prompt injection, tentativi di manipolare le istruzioni del modello per fargli eseguire azioni indesiderate. Anthropic afferma di aver introdotto nuovi livelli di filtraggio e validazione interna dei comandi, riducendo il rischio di exploit e fughe di dati. L’azienda ha investito anche in strumenti di monitoraggio continuo, capaci di rilevare deviazioni comportamentali durante l’esecuzione delle query più sensibili.
Strumenti per sviluppatori e nuove API
Parallelamente al rilascio del modello, Anthropic introduce una nuova API con parametro “effort”, che consente di modulare la profondità del ragionamento in base al tipo di task. In pratica, gli sviluppatori potranno decidere se privilegiare velocità o accuratezza, ottimizzando così i costi operativi.
I prezzi di utilizzo di Claude Opus 4.5 diventano più accessibili: 5 euro per milione di token in input e 25 euro per milione in output, una riduzione significativa rispetto alle precedenti versioni, pur restando elevata per applicazioni di larga scala.
Claude Code e strumenti di produttività
L’ecosistema Anthropic riceve a sua volta un aggiornamento sostanziale. Claude Code, il tool pensato per gli sviluppatori, introduce ora una fase di domande chiarificatrici automatiche prima di applicare modifiche al codice, insieme a un file di piano che riepiloga le modifiche proposte. La versione desktop, invece, consente di gestire più sessioni contemporaneamente, utile per chi lavora su progetti complessi e multilivello.
Sul fronte consumer, le applicazioni di Claude per desktop e mobile superano uno dei limiti più criticati delle versioni precedenti: le conversazioni lunghe non vengono più troncate, grazie a un sistema di riassunto dinamico del contesto. Inoltre, l’integrazione con Chrome ed Excel si estende ora a un numero maggiore di piani, migliorando l’uso quotidiano per chi utilizza Claude in ambito produttivo.
Un’evoluzione pragmatica verso l’AI affidabile
Claude Opus 4.5 non rappresenta una rivoluzione, ma una maturazione tecnologica. L’attenzione di Anthropic non è più solo sulla potenza bruta, ma sulla consistenza, sicurezza e qualità del ragionamento. È un approccio più vicino a quello di una piattaforma enterprise che a un prodotto sperimentale: un’AI meno spettacolare, ma più affidabile, pronta a entrare stabilmente nei processi aziendali e creativi.
Se il futuro dell’intelligenza artificiale sarà davvero quello di diventare un “collega virtuale”, Opus 4.5 segna un passo concreto in quella direzione: meno chiacchiere, più metodo.