您的位置:首页精文荟萃综合新闻 → OpenAI 推出 GPT-5.2!衝著取代專業人士、幻覺更低,API 費用整理

OpenAI 推出 GPT-5.2!衝著取代專業人士、幻覺更低,API 費用整理

时间:2025/12/15 0:01:43来源:www.pc6.com作者:学臣我要评论(0)

OpenAI 今晨無預警發布 GPT-5.2,直攻真實世界應用的專業產能,與 Google Gemini 3 正面衝突。
(前情提要:ChatGPT 將於 2026 年支援 PayPal 直接付款,Openai 電商帝國的最後一塊拼圖 )
(背景補充:Openai 原生瀏覽器「ChatGPT Atlas」三大功能一次看,AI 代理人能撼動 Chrome 霸權? )

本文目錄

新模型鎖定「經濟價值」

發布節奏讀出「紅色警戒」

長文本與代理人,開發生態質變

算力成本

O

penAI 於今(12)日無預警推出旗艦模型 GPT-5.2,市場將這次更新定位為對 Gemini 3 的直接反擊。新模型主打與過去偏重對話體驗不同,GPT-5.2 聚焦真實工作流的「經濟價值」,執行長 Sam Altman 定位其為一名隨時能打卡上班的數位員工。

新模型鎖定「經濟價值」

為了量化價值,OpenAI 捨棄學術基準,推出自研 GDPval 指標。根據 RD World 分析,GDPval 涵蓋 44 種知識工作,GPT-5.2 Thinking 在測試中有 70.9% 的任務表現優於或持平人類專家,前代僅 38.8%。這意味著處理 Fortune 500 財務三表或華爾街常見的 LBO 模型時,GPT-5.2 以不到 1% 的人力成本、快 11 倍速度完成交付。

它一次能讀取並理解數百個關聯表格,此外模型可將數據直接轉化為簡報圖表,並透過 Microsoft 365 Copilot 即時交付,對企業來說是一種可即插即用的產能。

根據官方說明,GPT-5.2 引入 Instant、Thinking、Pro 三種變體,核心在於主動工作能力。新的 Tool Calling 機制讓模型可自動串接外部軟體,從詢問需求一路做到交付結果。於真實軟體工程任務 SWE-bench Pro 測試中,Thinking 版本得分 55.6%,Verified 版本更達 80%。Triple Whale 執行長評論:

「將脆弱的多代理系統整合成單一大型代理……就像魔法一樣。」

同時,ScreenSpot-Pro 測試顯示模型能解析科學圖表與 UI 介面,為企業自動化鋪路。

發布節奏讀出「紅色警戒」

短短四個月內,OpenAI 先後釋出 GPT-5、5.1 與 5.2。Altman 公開表示:

「我們正處於紅色警戒階段,這種狀態至少持續到 2026 年 1 月。」

在模擬軟體工程任務的 SWE-Bench Pro 測試中,GPT-5.2 Thinking 以 55.6% 成績刷新紀錄,超越 Gemini 3,成為「最佳工程師助手」。然而,Gemini 3 仍於 GPQA Diamond 與 ARC-AGI 測試保有優勢,顯示雙方各據要塞。OpenAI 選擇優先強化能直接帶來營收的編程與商業邏輯能力,暫把學術向任務拉回第二順位。

長文本與代理人,開發生態質變

GPT-5.2 支援 256k context window,可一次解析完整程式庫。早期合作夥伴 Databricks 與 Cognition 反映,錯誤偵測率降低 38%,讓 AI 代理人首次具備進入生產環境的穩定性。企業不再只是詢問模型如何寫程式,而是讓模型直接執行重構與除錯。

隨 2026 年新政府即將上任,AI 競爭焦點正從純技術跑分轉向對全球勞動力市場的重塑。對華爾街與企業主而言,問題已不再是誰的模型更聰明,而是誰能最快把 AI 轉化為資產負債表上的利潤。

算力成本

GPT-5.2 的 API 定價為輸入每百萬 Token 1.75 美元、輸出 14 美元。

GPT-5.2-pro 定價為輸入每百萬 Token 21 美元、輸出 168 美元。


相关阅读:

http://www.pc6.com/infoview/Article_207521.html

http://www.pc6.com/infoview/Article_327599.html

http://www.pc6.com/infoview/Article_327705.html

http://www.pc6.com/infoview/Article_327690.html

http://www.pc6.com/infoview/Article_327671.html


相关视频

    没有数据

相关阅读 GAEA Chat 新加坡圆满落幕—— Token2049 全球峰会期间的一场产业Sentient 项目深度研究报告GAIB 研报:AI 基建的链上金融化之路 - RWAiFi一文了解 Raiku:Solana 的高性能边缘计算层Hyperliquid 市占率跌至 8%,它的“护城河”还在吗?Vlad Tenev 谈 Robinhood 的三条曲线:链上金融、散户投资与 AIStripe 的万亿美元赌注:稳定币如何改写全球支付版图Stripe的万亿美元赌注:稳定币如何改写全球支付版图

文章评论
发表评论

热门文章 白銀站上 63 美元再創以太坊隱私新基建:深中本聰雕像進駐華爾街好萊塢導演Carl Rinsc

最新文章 OpenAI 推出 GPT-5.2!加密投资公司 Blockst 比特币自美联储会议后低点反弹至93,000美元乏味的比特币绿色信号时刻即将来临?从同步走向滞后,比特币有望追赶小盘股高点这三项指标显示比特币在接近 80,000 美元时

人气排行 重装win7系统后键盘鼠标怎么都不能用怎么办2018性能最好的手机前十位 2018性能最好手机呵男人什么意思 呵男人表情包 呵男人呵女人6家共享单车倒闭是哪六家 6家共享单车倒闭什最全的nba历史得分榜和nba历史得分排名微信小程序是什么 微信小程序怎么申请单反相机什么牌子好?单反相机入门推荐支付宝转账限额多少钱 支付宝为什么限额