GPT-5.2在多項測試中刷新紀錄,包括跨44種職業的GDPval知識工作基準,Thinking版本勝率達70.9%,遠高於上一代;在SWE-bench與GPQA等軟體工程、科學問答、抽象推理領域也全面提升,ARC-AGI-1突破90%門檻,是目前唯一達到此水準的模型。OpenAI強調,新模型在建立試算表、簡報、程式碼審查、圖像解讀、跨工具自動化流程與多步驟專案管理中的表現明顯更穩定,生成速度快、成本僅為專業人力的1%,適合作為專業人士的日常助手。

這一代特別強化長篇上下文能力,能同時消化報告、合約、研究論文與多檔案專案,不僅可精準抽取資訊,也能保持邏輯一致性。視覺能力也同步升級,解析UI介面與科學圖表的錯誤率減半,在電子零件定位、資料圖拆解等任務上比GPT-5.1更接近人類專家。在程式開發方面,GPT-5.2顯著改善前端開發與複雜UI生成能力,並能更可靠地進行跨語言除錯與大型程式碼庫的結構重寫。多家早期合作夥伴表示,新模型在代理程式編碼方面的跳躍幅度「遠高於版本號所暗示的」,能讓多代理架構被整合成更高效率的單代理系統,降低延遲與成本。

GPT-5.2同時具備更高的事實準確度,在匿名查詢測試中幻覺下降38%。OpenAI也同步強化安全性,包括敏感對話處理、情緒支持與未成年內容保護,並逐步導入年齡推測模型,避免未成年接觸不適內容。

OpenAI表示,GPT-5.2 Instant、Thinking與Pro今日起將逐步在ChatGPT上線,優先提供Plus、Pro、Go、Business與Enterprise用戶使用。API同步開放,並加入「xhigh」最高推理級別,適用科學研究、金融模型等重度場景。Token費用略高於GPT-5.1,但由於推理效率提升,整體成本反而更低。

新模型依舊由OpenAI、NVIDIA與Microsoft共同打造,使用Azure資料中心與H100、H200、GB200等最新GPU架構進行訓練。OpenAI強調,GPT-5.2只是前沿模型演進中的一站,未來仍將持續提升推理能力、可靠性與安全性,並讓AI在科學、工程與知識工作的價值更具體落地。

GPT-5.2在主機板影像定位上的表現更精準,能清楚標出CPU位置、RAM插槽、PCIe、VRM電源區與各種I/O埠,相較GPT-5.1只辨識少量零件,新模型在細節理解與空間定位上大幅進步。OpenAI官網
GPT-5.2在主機板影像定位上的表現更精準,能清楚標出CPU位置、RAM插槽、PCIe、VRM電源區與各種I/O埠,相較GPT-5.1只辨識少量零件,新模型在細節理解與空間定位上大幅進步。OpenAI官網

點擊閱讀下一則新聞 點擊閱讀下一則新聞
《時代》雜誌「年度風雲人物」 黃仁勳、蘇姿丰獲選