OpenAI ha annunciato il Lockdown Mode, una nuova modalità di sicurezza per ChatGPT progettata per ridurre il rischio di attacchi di prompt injection — una delle vulnerabilità più insidiose dei sistemi AI moderni.

Cos'è un attacco di prompt injection?

Un attacco di prompt injection avviene quando istruzioni malevole vengono nascoste in contenuti web, documenti o altri file che l'AI elabora. L'obiettivo è manipolare il comportamento del modello — ad esempio inducendolo a inviare dati sensibili a un attaccante esterno senza che l'utente se ne accorga.

Con l'espansione delle funzioni agentive di ChatGPT — navigazione web, analisi di file, automazioni — questa tipologia di attacco è diventata concretamente più pericolosa.

Come funziona il Lockdown Mode

Quando attivato, il Lockdown Mode disabilita una serie di funzioni che potrebbero essere sfruttate per esfiltrare dati:

  • Navigazione web in tempo reale — accessibili solo i contenuti cached
  • Caricamento e visualizzazione di immagini dalla rete
  • Deep Research
  • Agent Mode (modalità autonoma)

L'obiettivo è bloccare l'ultima fase di un attacco: quella in cui i dati vengono trasferiti fuori dal sistema tramite richieste di rete in uscita.

I limiti che OpenAI ammette

OpenAI è stata trasparente sui limiti della funzione. Anche con Lockdown Mode attivo, ChatGPT può ancora essere vulnerabile a prompt injection presenti in:

  • Contenuti web cached
  • File caricati dall'utente

In questi casi, il comportamento o l'accuratezza delle risposte potrebbe essere compromesso senza che l'utente se ne accorga.

A chi serve

Il Lockdown Mode non è pensato per l'utente medio. È una funzione per chi gestisce dati sensibili — team legali, aziende con processi riservati, professionisti che usano ChatGPT per analizzare documenti confidenziali.

Per chi usa ChatGPT per attività quotidiane standard, il Lockdown Mode ridurrebbe l'utilità dello strumento senza un beneficio proporzionale.

Disponibilità

La funzione è in rollout progressivo per:

  • Account ChatGPT personali
  • Account ChatGPT Business self-serve

OpenAI sta anche introducendo le Elevated Risk labels, etichette che segnalano quando un'azione ha un livello di rischio più alto — un secondo livello di trasparenza per aiutare gli utenti a capire cosa sta facendo il modello.


Il Lockdown Mode è un passo nella direzione giusta, ma non è una soluzione definitiva. Il prompt injection rimane uno dei problemi irrisolti dell'AI agentiva: finché i modelli elaborano contenuti da fonti esterne, il rischio non può essere eliminato del tutto — solo contenuto.

← Tutti gli articoli