甚至十年前,自動學習的微小碎片都在我們所有人的數字生活中默默地暗示。
我們正在談論的更多小“技巧”,例如識別受試者在相機或短語公式有可疑的公用事業。
今天,當我們接近生成人工智能的頂點時,這方面的聲音越來越多地發出噪音。正是在這種情況下,Google使用其新的“多模式”模型(Gemini)提高了標準。
Google於2023年12月6日與Gemini首次亮相,在三個維度上提供了它:極端主義者,更強大,目前由廣泛的商業用途保留Proe奈,後者致力於在移動設備中實現。
近年來,這家研究巨頭一直在努力應對OpenAI,GPT的熱情以及IA提供給其核心業務的服務的潛在威脅。
具有管理一個互聯網的大量信息,用戶本可以在單個網頁上使用單個問題獲得所需的答案。
與Google搜索相比,使所有事物更容易,更快。
這一想法引起了山景視圖的關注,尤其是考慮到可以擺脫廣告的眾多外觀,因此客戶支付了相當大的數字。
在神話和虛假之間
直到今天,大型語言模型或LLM,他們通過分析輸入方式來以中等格式擴展某種類型的語音。
例如,OpenAI或GPT GPT生成性生成模型文本交換,而文本在圖像中的提示翻譯。
每個LLM將針對一種輸入類型和輸出類型進行調節。
這是有關雜物性的討論發揮作用的地方:雙子座可以接收文本(包括代碼),圖像,視頻和音頻,並具有一定的指示,以任何這些格式返回新事物。
換句話說,從理論上講,多模式LLM可以執行幾個專用的單學科LLM的任務。
這個演講給了一個想法陰影關於這種類型的模型,經過體面訓練的模型可以進行完善的相互作用。
但是,警告是很好的,因為所討論的視頻尤其是其優雅的組裝很容易欺騙。
實際上,這些互動都沒有如此迅速正如您在屏幕上看到的那樣。
正如Google還承認的那樣,視頻演示不是通過人聲建議實時進行的。相反,使用了粗糙鏡頭中固定圖像的框架,然後將後來的文本建議插入了雙子座回复的內容。
他的目的是展示表現出的雙子座的技能,包括他天生的能力,基於對圖像的識別來詳細闡述聲樂對話建議。
與其他聊天機器人相比,這將構成Google提案的重大分歧。
特殊性在將來提供的視角中是:個人與雙子座進行流暢的聲音對話的能力,實時觀察並獲得有關周圍環境中發生的事情的回應。
小型預覽
該模型的一種稱為Gemini Pro的變體現在是集成到Bard聊天機器人。
擁有8個Pro Pixel的用戶Google的智能手機已經可以使用Gemini版本的矮人,以生成人工智能對WhatsApp建議的文本響應,並且很快在Gobaild上,這是加利福尼亞公司開發的虛擬鍵盤。
目前,吟遊詩人只有一個簡化版本與原始吟遊詩人相比,Gemini的作品,但仍然是向前邁出的一個了不起的一步,該吟遊詩僅限於文本輸入。
應當指出的是,目前,Gemini僅以英語提供,但是Google計劃在不久的將來對其他語言進行支持。
與以前對Google生成人工智能的更新類似,Gemini Pro在歐盟尚未提供。
要訪問雙子座專業人士,有必要使用VPN,該VPN提供了可以使用Gemini的IP地址,例如美國或澳大利亞等,這一點足以擁有Google帳戶。