Claude Opus 4.5 arriva con nuovi superpoteri, ma i test sulla sicurezza lasciano più di un dubbio
L’annuncio di Claude Opus 4.5 arriva in un momento di forte competizione tra i laboratori di intelligenza artificiale. Anthropic punta su un modello orientato all’affidabilità nel coding, ma qualcosa sul fronte della sicurezza non torna del tutto.
L’ultima versione di Claude è capace di gestire attività complesse, dall’uso di fogli di calcolo alla ricerca strutturata, e anche il supporto nelle applicazioni su computer. Restano però dubbi sulla gestione delle vulnerabilità che riguardano l’intero settore.
La società presenta Opus 4.5 come un modello più solido nei compiti che richiedono interazioni con file, browser e applicazioni desktop. Le nuove funzioni includono una gestione più estesa di Claude Code e integrazioni con Excel e Chrome.
Anthropic affronta anche il tema degli attacchi tramite prompt injection, che inseriscono istruzioni malevole nei dati elaborati dal modello. L’azienda sostiene una maggiore resistenza, pur riconoscendo che diversi attacchi continuano a superare le barriere attuali.
I test mostrano risultati disomogenei. Nelle prove sul coding malevolo, con 150 richieste in violazione di policy, il modello ha rifiutato il 100% delle azioni. Le prestazioni scendono però in altri contesti: in Claude Code il tasso di rifiuto supera di poco il 78%, mentre nelle attività operative sul computer si ferma all’88%.
Gli esempi includono richieste legate a sorveglianza non autorizzata, raccolta dati e produzione di contenuti offensivi. I documenti citano anche istruzioni mirate alla compilazione di elenchi sensibili o alla stesura di email estorsive tramite applicazioni presenti sul dispositivo.
Questo evidenzia quanto sia complesso costruire sistemi realmente affidabili nelle attività che coinvolgono l’uso diretto del computer. La corsa all’efficacia impone un lavoro costante sulla protezione da abusi e comportamenti indesiderati, un aspetto che continua a richiedere attenzione mirata, mentre sembra che molte aziende vogliano solo arrivare per prime. Ad Anthropic va quindi senz’altro il merito di aver messo l’accento non solo sugli aspetti positivi.
Source link




