DeepSeek,中國初創公司的崛起,他挑戰了Openii的領域語言模型R1,已經就該公司設法以低成本取得如此驚人的成果的方式進行了國際辯論。
作為一家中國公司,謠言集中在據稱收購數千名NVIDIA GPU H100的謠言中,這只是時間問題,該公司向中國的出售被美國特定的法規禁止。假設DeepSeek已經對出口進行了檢查以獲取必要的硬件,那麼技術領域的熱情數據(例如Alexandr Wang(Scale AI)和無所不在的Elon Musk等熱情的數據都會促進飼料的猜測。
Nvidia的答案
謠言開始流傳不受控制,重新啟動了“行為”的假設通過新加坡將我們的商品帶到中國,NVIDIA已決定通過官方聲明做出回應。據該公司稱,DeepSeek會利用一種名為的創新技術“測試時間縮放”,這允許完全遵守國際法,使用現有且廣泛可用的計算資源開發新的人工智能模型。
這種方法被添加到用於訓練前和培訓後的縮放策略中,將證明可以獲得如何獲得高性能,而不必訴諸最新一代硬件或非法實踐。推斷或使用訓練的模型仍然需要大量的NVIDIA GPU和高性能網絡,但並不意味著訪問禁止的技術。
NVIDIA的立場旨在安撫爭議,但也提出了有關GPU市場未來的問題。如果“測試時間縮放”應該被證明是一個有效且易於適用的解決方案,則領先的硬件需求可能會經歷收縮對Nvidia本人等公司的重大影響。並非偶然新聞傳播後,該公司的股票記錄了17%的證券交易所,讓Nvidia在世界上資本最多的公司的排名中喪生。
但是,“測試時間擴展”對人工智能行業的長期影響會有什麼?它將能夠使訪問日益強大且精緻的語言模型民主化嗎?在下面的評論中告訴我們您的DeepSeek R1挑戰Openai。