Openai已經發布了一種新的人工智能模型O1這是一系列“推理”模型中的第一個,旨在以比人更快,更有效的方式回答複雜問題。與O1一起,還發布了一個較小且更便宜的版本O1-Mini。
對於Openai而言,O1代表著朝著建立類似人類的人工智能的長期目標邁出的一步。實際上,與以前的模型相比,該模型能夠更有效地編寫代碼並更有效地解決多階段問題。但是,它也比GPT-4更昂貴和緩慢。 Openai將O1的輸出定義為強調其初始開發狀態的“預覽”。
Chatgpt Plus和團隊用戶可立即使用O1-Preiview和O1 Mini,而企業用戶和ED將從下週開始訪問它。 OpenAI計劃還可以擴展對O1-Mini的訪問,以免費提供ChatGpt用戶,但尚未確定確切的日期。開發人員的訪問O1很貴:在API中,O1-preiview的100萬個輸入令牌和每100萬美元的產出代幣的價格為15美元,而GPT-4的價格為每100萬美元的投入代幣5美元,100萬個產出令牌的價格為15美元。
O1培訓過程與其前輩的培訓過程基本不同。 OpenII使用了一種新的優化算法和專門為該模型設計的新培訓數據。 O1並沒有簡單地模仿培訓數據的模型,而是使用一種稱為“通過強化學習”的技術來獨立解決問題,該技術通過獎品和懲罰來教授系統。此外,使用“思想鏈”處理請求,類似於人類逐步面對問題的方式。
多虧了這種新的培訓方法,OpenAI指出,該模型應該更準確,更不願傾向於“幻覺”,或者產生虛假或誤導性的響應。但是,幻覺的問題尚未完全解決。
將O1與GPT-4區分開的主要特徵是它以比其前任更有效的方式面對複雜問題(例如編碼和數學)的能力,還提供了對推理的詳細說明。 Openi在復雜的數學問題上測試了O1,並且比GPT-4取得了明顯更好的結果。在國際數學奧林匹克運動會(IMO)的合格考試中,GPT-4O僅正確地解決了問題的13%,而推理模型的得分為83%。他們的編碼技能在比賽中進行了評估,並在Codeforces比賽中獲得了第89個百分位數。
但是,O1在許多其他領域都沒有GPT-4的能力。它在世界上沒有相同的事實知識,也無法瀏覽網絡或流程文件和圖像。儘管如此,該公司認為O1代表了一種新的能力類,並稱O1表示“回到起點”。
L'介面O1的設計旨在顯示推理的段落,而模型闡述了請求,從而產生了人類思想的幻想。但是,OpenII強調了該模型實際上不是在思考,也不是人類。該界面可以展示該模型如何將更多時間用於處理和加深問題。
儘管大型語言模型尚未特別聰明,但OpenII看到了一個未來,即自主系統或代理人將能夠做出決策並代表用戶採取行動。對於人工智能研究人員而言,推理能力的發展代表了在人類層面上邁向情報的重要一步,並在醫學和工程等領域具有革命性的應用。
你怎麼認為?我們正在接近真正聰明的人工智能嗎?在下面的評論中告訴我們您。