Google Gemini是重新定義人工智能的新型多模式模型

Lenore

甚至十年前，自動學習的微小碎片都在我們所有人的數字生活中默默地暗示。
我們正在談論的更多小“技巧”，例如識別受試者在相機或短語公式有可疑的公用事業。

今天，當我們接近生成人工智能的頂點時，這方面的聲音越來越多地發出噪音。正是在這種情況下，Google使用其新的“多模式”模型（Gemini）提高了標準。

Google於2023年12月6日與Gemini首次亮相，在三個維度上提供了它：極端主義者，更強大，目前由廣泛的商業用途保留Proe奈，後者致力於在移動設備中實現。

近年來，這家研究巨頭一直在努力應對OpenAI，GPT的熱情以及IA提供給其核心業務的服務的潛在威脅。

具有管理一個互聯網的大量信息，用戶本可以在單個網頁上使用單個問題獲得所需的答案。

與Google搜索相比，使所有事物更容易，更快。
這一想法引起了山景視圖的關注，尤其是考慮到可以擺脫廣告的眾多外觀，因此客戶支付了相當大的數字。

在神話和虛假之間

Logo di Google Gemini

Google Gemini徽標

直到今天，大型語言模型或LLM，他們通過分析輸入方式來以中等格式擴展某種類型的語音。

例如，OpenAI或GPT GPT生成性生成模型文本交換，而文本在圖像中的提示翻譯。
每個LLM將針對一種輸入類型和輸出類型進行調節。

這是有關雜物性的討論發揮作用的地方：雙子座可以接收文本（包括代碼），圖像，視頻和音頻，並具有一定的指示，以任何這些格式返回新事物。

換句話說，從理論上講，多模式LLM可以執行幾個專用的單學科LLM的任務。

這個演講給了一個想法陰影關於這種類型的模型，經過體面訓練的模型可以進行完善的相互作用。

但是，警告是很好的，因為所討論的視頻尤其是其優雅的組裝很容易欺騙。
實際上，這些互動都沒有如此迅速正如您在屏幕上看到的那樣。

正如Google還承認的那樣，視頻演示不是通過人聲建議實時進行的。相反，使用了粗糙鏡頭中固定圖像的框架，然後將後來的文本建議插入了雙子座回复的內容。

他的目的是展示表現出的雙子座的技能，包括他天生的能力，基於對圖像的識別來詳細闡述聲樂對話建議。

與其他聊天機器人相比，這將構成Google提案的重大分歧。
特殊性在將來提供的視角中是：個人與雙子座進行流暢的聲音對話的能力，實時觀察並獲得有關周圍環境中發生的事情的回應。

小型預覽

Presentato il 6 dicembre, Gemini Pro è ora integrato in Google Bard, ma non è ancora disponibile nell'Unione Europea — Gemini Pro於12月6日提出，現在已集成在Google Bard中，但歐盟尚未提供

該模型的一種稱為Gemini Pro的變體現在是集成到Bard聊天機器人。

擁有8個Pro Pixel的用戶Google的智能手機已經可以使用Gemini版本的矮人，以生成人工智能對WhatsApp建議的文本響應，並且很快在Gobaild上，這是加利福尼亞公司開發的虛擬鍵盤。

目前，吟遊詩人只有一個簡化版本與原始吟遊詩人相比，Gemini的作品，但仍然是向前邁出的一個了不起的一步，該吟遊詩僅限於文本輸入。

應當指出的是，目前，Gemini僅以英語提供，但是Google計劃在不久的將來對其他語言進行支持。
與以前對Google生成人工智能的更新類似，Gemini Pro在歐盟尚未提供。

要訪問雙子座專業人士，有必要使用VPN，該VPN提供了可以使用Gemini的IP地址，例如美國或澳大利亞等，這一點足以擁有Google帳戶。