OpenII呈現GPT-4O：從這一刻起，Chatgpt看起來越來越像“她”

OpenII推出了GPT-4O，這是一種著名型號的新版本，該版本為其主要產品提供chatgpt。

昨天的廣告直播期間，該公司的首席技術官Mira Murati強調，更新的模型“更快”，並解釋了該名稱的“ O”如何代表”Omni“，指示多模式領域的進展以及改進的“處理文本，視頻和音頻的技能”。

OpenII宣布，GPT-4O的功能“將以迭代方式分發”，但其文字和圖像技能將立即在Chatgpt中提供，並且所有用戶都可以免費訪問，享受付費的用戶”提高自由用戶的技能五倍。 ”

GPT-4O以更大的反應性和管理圖像，外語和情感識別的能力為特徵，設計用於更流暢和個性化的人類互動，而“記住”過去的對話。

斯嘉麗，是嗎？

OpenAI首席執行官Sam Altman將GPT-4O描述為“本地可加入”。

這個新模型具有更大的能力，可以通過語音，文本或圖像來生成內容或理解控件，最重要的是人聲模式的新功能在chatgpt。
現在聊天機器人可以充當元音助手實時響應並觀察周圍的環境：立即喚起電影“她”的呼籲的能力，在其中，斯嘉麗·約翰遜（Scarlett Johansson）將聲音借給了ia。

過去，模型的人聲模式有限，能夠一次對單個提示做出響應，並且僅根據被授予的聲音進行操作；由於需要使用單獨的音頻轉錄和人聲合成，因此需要平均延遲2.8秒（GPT-3.5）或5.4秒（GPT-4）。
GPT-4O整合了這些過程，允許對輸入和輸出進行更有效的管理：它僅延遲供應和答案之間的232毫秒，這在人類時代相當大。

在現場演示期間，GPT-4O還表明了其提供有關數學問題的建議，分析IT代碼和解釋面部表情的情緒。
儘管不便，例如對未經請求的圖像和倡議的解釋不正確，但GPT-4O的潛力已被證明是強烈的前衛。

在安全條款，OpenAI在其設計中採用了預防措施，包括過濾訓練數據以及通過信息後改善模型的行為。
此外，該公司還與外部專家合作，以識別和減輕與人聲輸出等新功能相關的風險。