Scienza e tecnologia

OpenAI lancia GPT 5.3 Codex: l’AI che ha imparato dai propri errori

OpenAI ha presentato GPT 5.3 Codex, un modello che punta a ripensare il modo in cui gestiamo attività continuative sul computer. La novità che attira subito l’attenzione riguarda il processo di training del quale è stato oggetto: secondo OpenAI, il modello avrebbe contribuito in parte alla propria crescita, almeno nelle fasi iniziali, un dettaglio che mette subito in chiaro il tipo di esperimento in gioco. E che richiama alla mente i pericoli vaticinati da tanti film di fantascienza.

GPT 5.3 Codex nasce dall’unione delle funzioni di GPT 5.2 e GPT 5.2 Codex, con l’obiettivo di concentrarle in un’unica architettura in grado di seguire attività prolungate. OpenAI descrive una velocità superiore del 25%, dettaglio che permette al modello di affrontare procedure di debug, gestione di pipeline e analisi di risultati in scenari complessi.

Durante lo sviluppo, versioni preliminari hanno individuato errori di training, monitorato infrastrutture e diagnosticato malfunzionamenti, fornendo indicazioni ai ricercatori.

Un approccio che potrebbe segnare un passo generazionale nel quale le IA iniziano ad auto-migliorarsi da sole.

Nei benchmark, GPT 5.3 Codex ottiene nuovi valori di riferimento nei test SWE Bench Pro, Terminal Bench 2.0 e OSWorld Verified, tutti orientati a misurare la capacità di programmare, usare strumenti e muoversi in ambienti grafici. I test di programmazione mostrano un uso più efficiente dei token e un netto miglioramento rispetto alla generazione precedente.

OpenAI ha chiesto al modello di sviluppare videogiochi web nell’arco di più giorni, lasciandolo lavorare anche in autonomia. GPT 5.3 Codex ha risolto bug, ampliato le funzioni richieste e gestito le modifiche senza perdere il filo delle attività. Risultati simili emergono anche nella creazione di siti web, dove il modello produce layout coerenti anche con richieste poco precise.

Il raggio d’azione non si limita al codice. Con il set di compiti GDPval, pensato per simulare 44 professioni, la nuova versione mostra prestazioni in linea con GPT 5.2, generando documenti, presentazioni, analisi finanziarie e report complessi.

Su OSWorld Verified, inoltre, migliora il comportamento come agente in grado di operare un computer, includendo funzioni tipiche di un assistente visivo.

La gestione del contesto rappresenta un altro punto chiave. Il modello aggiorna costantemente sullo stato delle attività e permette di intervenire durante l’esecuzione, discutendo le scelte e spiegando i passaggi. Nella app Codex, disponibile per macOS, questo comportamento consente anche di coordinare più agenti contemporaneamente.

Sul fronte sicurezza, OpenAI classifica per la prima volta un proprio modello come altamente capace in cybersecurity. GPT 5.3 Codex riceve un addestramento specifico per individuare vulnerabilità software ed è distribuito con mitigazioni dedicate. L’azienda introduce anche programmi come Trusted Access for Cyber e strumenti per la scansione del codice open source, supportati da crediti API per la ricerca.

Dal punto di vista dell’infrastruttura, GPT 5.3 Codex è stato addestrato su sistemi NVIDIA GB200 NVL72, mentre l’accesso API arriverà in una fase successiva. Gli utenti paganti possono già accedere al modello tramite l’app, l’IDE e gli altri canali Codex.

E se siete arrivati fin qui, saprete già come andrà a finire: quand’è che ci metteremo con calma a riflettere su dove stiamo andando con l’IA? Ai posteri l’ardua sentenza.


Source link

articoli Correlati

Back to top button
Translate »