OpenAI表示,GPT-5.5 Instant已取代GPT-5.3 Instant,成為所有ChatGPT用戶的日常預設模型,API端則同步更新為「chat-latest」。
根據OpenAI內部測試,新模型在醫療、法律、金融等高風險領域的錯誤資訊產生率,比前代GPT-5.3 Instant降低52.5%;在曾被用戶標記為「事實錯誤」的高難度對話中,不準確內容也減少37.3%。
官方也公開一段數學題案例,比較兩代模型差異。GPT-5.3 Instant雖發現答案不正確,但最後錯誤判定「無解」;GPT-5.5 Instant則能進一步回頭檢查推導過程,找出真正的代數錯誤,重新解出正確答案。OpenAI表示,這代表新模型不只會「發現錯誤」,也更擅長「修正錯誤」。
從多項AI基準測試來看,GPT-5.5 Instant整體能力也全面提升。在AIME 2025數學競賽中,準確率從65.4%提升至81.2%;博士級科學推理測試GPQA則從78.5%提高到85.6%。
另外,在理解科學圖表的CharXiv測試中,準確率從75%提升至81.6%;多模態推理能力MMMU-Pro則從69.2%進步至76%。至於文件解析能力OmniDocBench,平均錯誤率也從14.6%下降至12.5%。
除了準確度提升,OpenAI也同步調整ChatGPT的回應風格。官方指出,GPT-5.5 Instant現在會減少不必要追問、過度排版與大量Emoji,讓回答更直接、更精簡,但仍保留自然對話感與個性。
OpenAI也展示了一組「如何叫同事不要一直講話」的案例。相較於GPT-5.3 Instant提供大量條列與長篇建議,GPT-5.5 Instant能以更少字數給出更自然、實際且符合職場情境的回答,同時保留幽默感與界線感。官方統計,新模型在該案例中使用的字數減少30.2%、行數減少29.2%。
另一項更新重點則是個人化能力。OpenAI表示,GPT-5.5 Instant現在更能有效利用過去聊天紀錄、上傳文件與已連結Gmail資訊,提供更貼近個人需求的推薦與建議。
官方以「推薦茶店」為例指出,舊版模型只能給出較大眾化的清單;新版則能根據使用者過去偏好的高山茶、台灣茶風格與常去店家,提供更精準且更像「真的懂你」的推薦。
同時,OpenAI也推出「記憶來源」功能。當ChatGPT使用過去記憶來生成回答時,用戶將能查看哪些對話、筆記或上下文影響了該回覆,並可自行刪除、修改或標記是否相關。
OpenAI強調,分享聊天內容時,這些記憶來源不會同步分享;若使用「臨時對話」,ChatGPT也不會讀取或更新記憶資料。
目前GPT-5.5 Instant已開始向所有ChatGPT用戶陸續推送。付費用戶仍可在未來三個月內切換回GPT-5.3 Instant。至於基於聊天紀錄、檔案與Gmail的進階個人化功能,現階段先開放Plus與Pro方案網頁版,之後才會擴展至手機版與其他方案。
點擊閱讀下一則新聞