20/08/2025Il rilascio più atteso dell’anno: GPT-5 è una delusione?

A Febbraio, Sam Altman aveva pubblicato su X un post con la roadmap di OpenAI che avrebbe portato al rilascio di GPT-5. 🙌

Da lì in poi si è parlato molto delle ipotetiche capacità di questo modello e negli ultimi due mesi si sono create molte aspettative a riguardo.

Il 7 agosto c’è stato il rilascio ufficiale con la classica live di OpenAI. 🚀

Abbiamo fatto anche una live reaction in cui io e alcuni colleghi abbiamo commentato la presentazione. Se te la sei persa la trovi al link indicato qui su 🙂

Non mi soffermo troppo sui dettagli tecnici annunciati da OpenAI perché volevo parlarti più di qual è stata la reazione della community al rilascio del modello.

Ci tenevo, però, a farti notare un dettaglio che sembra super interessante.

Il tasso di allucinazione indicato qui è molto ridotto e questo è molto importante quando parliamo di affidabilità e precisione dei risultati.

Disclaimer: in realtà le allucinazioni ci sono, non sono ridotte a zero. Noi stiamo facendo diversi test e in tante richieste GPT-5 ha fatto allucinazioni che Sonnet non ha fatto.

Qui sotto un esempio fatto da noi:

Un altro dettaglio che volevo mostrarti è che OpenAI dovrebbe ancora lavorare sulla creazione dei grafici 😂

Le aspettative su questo modello erano alte, molti si aspettavano il modello migliore della storia.

Anche perché Sam Altman aveva lasciato intendere questo in diverse interviste.

Ma è stato davvero così? In realtà no.

Ci sono state diverse lamentele da parte della community riguardo al cambiamento.

Non tanto per il fatto che non ci fosse il salto di qualità, ma più perché ci sono stati dei cambiamenti che portano quasi ad avere un’esperienza peggiore rispetto a prima.

1️⃣ Non c’è più (ma questo è già cambiato) la necessità di selezionare quale modello usare

Una delle novità iniziali è che non dovevi più selezionare il modello da usare dalla tendina classica perché lo strumento capiva da solo “quanto pensare” e se “pensare” in base alla complessità della tua richiesta. 💡

Questo, sulla carta, serviva a semplificarci la vita dato che per chi non è esperto non sempre è chiaro quale modello scegliere.

Ma c’è un piccolo dettaglio da ricordare: un modello aggiornato cambia anche comportamento.

GPT-5 è stato addestrato in modo che non allucinassepraticamente mai, e questo si riflette in tutti i comportamenti del modello.

Molte persone della community si sono lamentate di questo cambiamento, perché non c’è stato un cambiamento graduale.

Infatti, molti dicevano che avrebbero cancellato l’abbonamento e hanno chiesto a Sam Altman se potessero ripristinare l’accesso agli altri modelli.

E alla fine, hanno reso disponibile (nuovamente) anche GPT-4o. 🙌

Molti, però, hanno cambiato visione su OpenAI accusandola di essere interessata più al far usare GPT-5 agli utenti e non tanto al capire quali fossero le effettive necessità della community.

2️⃣ La scrittura dei prompt ora è più complessa

Sicuramente l’output ora è più preciso…ma dall’altra parte, a noi utenti è richiesto di scrivere dei prompt più lunghi e strutturati.

Se fai un prompt fatto molto bene ottieni risposte più precise rispetto ad altri modelli.

Però, bisogna essere molto chiari in tutto il prompt.

Prima, invece, era possibile anche essere più diretti nel prompt e fare tante iterazioni e si ottenevano ottimi risultati lo stesso.

Quindi GPT-5 fa schifo? 🤔

Assolutamente no. 🙅‍♂️

Sicuramente ha avuto qualche problema in fase di lancio, ma è un ottimo modello.

Nonostante molti abbiano detto in questi giorni cose come: “abbiamo aspettato GPT-5 per 2 anni e ci siamo ritrovati con un aggiornamento da niente”, non è così.

GPT-5 ha portato un cambiamento leggero se lo confrontiamo con o3 di 6 mesi fa, ma dire che non ci sia stato alcun progresso in 2 anni non è assolutamente vero.

Cosa ne pensiamo noi e come lo abbiamo testato in Datapizza? 🍕

GPT-5 ha una qualità maggiore rispetto agli altri modelli dell’azienda per quanto riguarda il coding, la gestione di chat molto lunghe e il contesto molto ampio.

La qualità per la redazione di documenti sembra essere leggermente inferiore rispetto a 4o.

Durante la live di presentazione, il modello non era ancora disponibile, ma poteva essere utilizzato su Crusor.

Mirko del nostro team di AI Adoption era già lì a testarlo e aveva già notato un miglioramento evidente rispetto ai modelli precedenti a livello di coding.

Infatti, lo ha provato per un bug che ancora non era riuscito a risolvere e con GPT-5 lo ha risolto.

Unico dubbio che rimane è che in generale rispetto ai competitor non ci sono cambiamenti radicali.

Infatti, molti di noi stanno comunque continuando ad usare i modelli di Anthropic per il coding.

Un altro test che abbiamo fatto è nella creazione di Frontend utilizzando sia Opus di Anthropic che GPT-5 di OpenAI.

In questo caso vediamo che la qualità è leggermente superiore con GPT-5.

📌 Opus

📌 GPT-5 

Insomma, per chiudere, diciamo che il salto di qualità sotto alcuni aspetti c’è ma non è nulla di rivoluzionario come molti si aspettavano in queste settimane. 👀

Noi continueremo a testarlo e a raccontarti altri casi d’uso nelle prossime settimane! 🙂


Giacomo Ciarlini - Head of Content & Education - Datapizza

Alexandru Cublesan - Media Manager & Creator - Datapizza