• logo

DeepSeek-V4二度驚嚇矽谷 全面使用大陸晶片、一次處理百萬文字

梁文鋒創立的深度求索24日再次推出升級版大型語言模型DeepSeek-V4,全面採取大陸晶片並大幅提升處理效率及成本。圖/取自大公文匯網
梁文鋒創立的深度求索24日再次推出升級版大型語言模型DeepSeek-V4,全面採取大陸晶片並大幅提升處理效率及成本。圖/取自大公文匯網

4月24日晚上,DeepSeek-V4大型語言模型預覽版正式上線,這是「深度求索」繼去年1月推出DeepSeek-R1後,再一次關鍵升級;根據官網公布的訊息,DeepSeek-V4至少有兩項重要的技術突破,一是一次可以處理百萬個文字,二是全面使用大陸自產晶片進行運算,大陸媒體普遍認為,DeepSeek-V4將改寫美中AI產業競賽的格局。

去年1月,DeepSeek-R1推出後,美國科技股重挫,那斯達克股價一天跌3%,其中AI晶片大廠輝達股價更單日重挫逾16%,市值蒸發近6000億美元;25日收盤的美股則是在英特爾的領軍下暴衝,不僅激勵輝達(NVIDIA)和台積電ADR同創新高,費城半導體指數更是連18日上漲,標普500指數和那斯達克指數再創歷史新高。

綜合陸媒的分析,DeepSeek-V4最大的技術突破是採用MoE架構,使V4的推理效率達到V3的35倍,能耗降低40%。而且,DeepSeek官方宣佈,從今往後,1M(100萬)Token的上下文長度,將是DeepSeek所有官方服務的標配。目前,100萬上下文是Gemini企業版的最大賣點,其他各家大模型基本都在128K或256K的區間裡,現在,DeepSeek直接100萬起步了。

100萬Token大約相當於15到20本長篇小說,或者一個中型軟體公司的基礎代碼庫。這使得DeepSeek-V4-Flash的輸入價格是0.2元人民幣(下同)/百萬Token,輸出2元/百萬Token;DeepSeek-V4-Pro,輸入1元/百萬Token,輸出24元/百萬Token。以西方同等水準的閉源模型laudeOpus4.6為例,輸入價格是5美元(34.2元人民幣)/百萬Token,輸出25美元(171元人民幣)/百萬Token。laudeOpus4.6的使用成本是DeepSeek-V4-Pro的7倍到34倍。

大陸自媒體「雲海觀星社」還發現,在DeepSeek公告價格表上面,有一串需要用放大鏡才能看清的小字:受限於高端算力,目前DeepSeek-V4-Pro的服務吞吐十分有限,預計下半年昇騰950超節點批量上市後,Pro的價格會大幅下調。這暗示下半年起,DeepSeek-V4-Pro將大量使用華為的昇騰950晶片。

從2022年10月起,美國開始封鎖中國大陸的AI算力,到2026年1月,最新的晶片法案規定禁止向中國出售輝達Blackwell晶片;華為昇騰950應運而生,在600W功耗下實現1.56PFP4算力,推理性能已達到輝達H20晶片的近3倍。

為了解決單顆晶片不及輝達的問題,華為推出Atlas 950 SuperPoD超節點,將數千顆昇騰950DT晶片通過高速互聯技術整合成一個邏輯上的巨型AI電腦,專門應對萬億參數級大模型的訓練和推理。

因此,DeepSeek-V4-Pro的推出反映一個最讓美國政府頭痛的問題:即使暫時無法獲取最先進的晶片,大陸也能透過晶片串聯技術,獲得同等的算力。再加上平均只有美國一半的電價,大陸AI算力完全可以與美國競爭。