OpenAI 近日宣佈推出新型人工智慧模型 o1-preview,這是該公司計劃中「推理」模型系列的首款產品。o1 模型旨在回答更複雜的問題,且速度快於人類。同時發布的還有較小型、更經濟實惠的 o1-mini 版本。
o1 模型採用了全新的訓練方法。OpenAI 研究主管 Jerry Tworek 表示:「o1 使用了全新的優化算法和特別為其量身打造的訓練資料集」。這種新方法使用強化學習技術,透過獎勵和懲罰來教導系統。o1 模型還使用「思維鏈」來處理查詢,類似人類逐步解決問題的方式。Tworek 指出,這種新的訓練方法使模型更加準確,「幻覺」問題有所減少,但仍未完全解決。
OpenAI 首席研究官 Bob McGrew 表示,o1 模型在解決複雜問題方面表現出色,特別是在程式設計和數學領域。在國際數學奧林匹克競賽的資格考試中,o1 模型得分率達到 83%,遠高於 GPT-4o 的 13%。在線上程式設計競賽 Codeforces 中,o1 模型的表現達到參與者的前 89%。OpenAI 聲稱,該模型的下一個更新版本在物理、化學和生物學等具挑戰性的基準任務中,將達到與博士生相似的水平。
目前,o1 模型僅向部分用戶開放。ChatGPT Plus 和 Team 用戶從即日起可以使用 o1-preview 和 o1-mini,而企業和教育用戶將於下週初獲得使用權限。OpenAI 計劃未來向所有 ChatGPT 免費用戶開放 o1-mini 的使用權限。
雖然 o1 模型擁有許多性能上的優勢,但在某些領域的能力不及 GPT-4o,如事實性知識和網頁瀏覽等功能。然而,OpenAI 認為這代表了一種全新的能力類別,並將其命名為 o1 以表示「將計數器重置回 1」。
這一新模型的發布標誌著人工智慧技術在數學和程式設計領域的重大突破,同時也為未來 AI 技術的發展方向提供了新的思路。