響應之前的Chatgpt現在“推理”：這是O1，是Openai的最新人工智能模型

Openai已經發布了一種新的人工智能模型O1這是一系列“推理”模型中的第一個，旨在以比人更快，更有效的方式回答複雜問題。與O1一起，還發布了一個較小且更便宜的版本O1-Mini。

對於Openai而言，O1代表著朝著建立類似人類的人工智能的長期目標邁出的一步。實際上，與以前的模型相比，該模型能夠更有效地編寫代碼並更有效地解決多階段問題。但是，它也比GPT-4更昂貴和緩慢。 Openai將O1的輸出定義為強調其初始開發狀態的“預覽”。

Chatgpt Plus和團隊用戶可立即使用O1-Preiview和O1 Mini，而企業用戶和ED將從下週開始訪問它。 OpenAI計劃還可以擴展對O1-Mini的訪問，以免費提供ChatGpt用戶，但尚未確定確切的日期。開發人員的訪問O1很貴：在API中，O1-preiview的100萬個輸入令牌和每100萬美元的產出代幣的價格為15美元，而GPT-4的價格為每100萬美元的投入代幣5美元，100萬個產出令牌的價格為15美元。

O1培訓過程與其前輩的培訓過程基本不同。 OpenII使用了一種新的優化算法和專門為該模型設計的新培訓數據。 O1並沒有簡單地模仿培訓數據的模型，而是使用一種稱為“通過強化學習”的技術來獨立解決問題，該技術通過獎品和懲罰來教授系統。此外，使用“思想鏈”處理請求，類似於人類逐步面對問題的方式。

多虧了這種新的培訓方法，OpenAI指出，該模型應該更準確，更不願傾向於“幻覺”，或者產生虛假或誤導性的響應。但是，幻覺的問題尚未完全解決。

將O1與GPT-4區分開的主要特徵是它以比其前任更有效的方式面對複雜問題（例如編碼和數學）的能力，還提供了對推理的詳細說明。 Openi在復雜的數學問題上測試了O1，並且比GPT-4取得了明顯更好的結果。在國際數學奧林匹克運動會（IMO）的合格考試中，GPT-4O僅正確地解決了問題的13％，而推理模型的得分為83％。他們的編碼技能在比賽中進行了評估，並在Codeforces比賽中獲得了第89個百分位數。