Negli ultimi giorni, migliaia di sviluppatori e utenti hanno segnalato interruzioni e latenze estreme nell’accesso a ChatGPT e alle API di OpenAI. Analizziamo insieme cosa è accaduto, perché il servizio è in “degraded performance” e come seguire gli aggiornamenti ufficiali.
Quando è iniziato il disservizio
L’incidente ha avuto inizio domenica 21 giugno 2025 alle 22:00 UTC, quando il sistema di ingestione dati della Compliance API ha cominciato a soffrire gravi ritardi nel processamento delle richieste. Questo componente, fondamentale per la verifica in tempo reale delle policy di sicurezza e privacy, ha accumulato code che hanno bloccato o rallentato tutte le chiamate API standard status.openai.com.
Che impatto ha avuto su ChatGPT e le API
Errori e timeout: numerosi utenti hanno ricevuto messaggi di errore come “A network error occurred” o timeout dopo 60+ secondi di attesa thescottishsun.co.uk.
Interruzioni di servizio: chatbot integrati in piattaforme di customer care e moderazione automatica dei contenuti si sono fermati, costringendo all’intervento manuale.
Latenze elevate: anche quando non si verificavano errori, il tempo di risposta è salito fino a 5–10 secondi, compromettendo l’esperienza utente.
Secondo i report di Downdetector, oltre 500 segnalazioni sono arrivate in un’ora solo il 27 giugno, con picchi di utilizzo bloccati e disservizi localizzati in Europa, USA e Asia thescottishsun.co.uk.
Gli aggiornamenti di stato ufficiali
OpenAI ha pubblicato diversi aggiornamenti sulla propria status page:
21 giugno, 22:00 UTC – Investigating: prime segnalazioni di ritardi nella Compliance API.
23 giugno, 22:01 UTC – Identified: root cause individuata, si lavora a una mitigazione.
26 giugno, 17:57 UTC – Monitoring: mitigazione applicata, si attendono miglioramenti stabili.
28 giugno, 00:11 UTC – Ongoing: sebbene ci siano segnali positivi, le performance non sono ancora tornate nella norma status.openai.com.
Per seguire in tempo reale lo stato dei servizi e ricevere notifiche, è possibile iscriversi agli aggiornamenti via email direttamente dalla pagina:
status.openai.com status.openai.com
Cosa possono fare gli sviluppatori nel frattempo
Implementare retry logic
Inserire meccanismi di ritentativo con backoff esponenziale per gestire temporanei errori 5xx o time-out.Cache locale dei risultati critici
Per operazioni non critiche in tempo reale, utilizzare una cache (Redis, Memcached) che riduca il numero di chiamate API.Fallback a modelli on-premise
Se disponibili, mantenere un’istanza di un modello locale di precedente generazione (ad esempio GPT-3.5) per garantire continuità di servizio.
Perché è importante la resilienza
Questo episodio dimostra come un singolo punto di guasto nella compliance possa impattare l’intera infrastruttura. Le best practice includono:
Architettura a microservizi: separare i componenti critici per evitare effetti a cascata.
Monitoraggio e alerting avanzato: integrare strumenti come UptimeRobot o Prometheus per allertare subito i team di SRE.
Piani di disaster recovery: simulare periodicamente scenari di outage per testare i processi di ripristino e formazione del personale.
Cosa aspettarsi nei prossimi giorni
OpenAI prevede il completo ripristino delle performance entro i primi giorni di luglio 2025, grazie a un rollout in tre fasi della soluzione al problema di ingestione dati. Nel frattempo, il team continuerà a monitorare e ottimizzare le code di elaborazione.
Restate aggiornati sulla status page ufficiale e valutate oggi stesso l’adozione di strategie di resilienza per proteggere le vostre applicazioni da futuri disservizi.

