/朝聞通/近日,在COMPUTEX展會上,英偉達正式發布RTX Spark PC超級芯片,标志着其算力布局從雲端服務器全面下沉至終端PC場景。此前,英偉達宣布計劃率先在其下一代Vera Rubin AI平台上導入“GPU發起直接存儲訪問”(GIDS)技術、谷歌在2026 Google Cloud Next推出訓推分離的第八代TPU,全球AI算力産業迎來密集技術疊代窗口。行業逐步形成新的分工:通用GPU承接全場景與端側算力需求,專用TPU聚焦雲端大模型訓推核心任務,兩者協同的産業架構加速落地,TPU賽道迎來規模化産業化窗口期。
巨頭雙線縱深布局:英偉達打通端雲算力,谷歌TPU憑專用性形成技術互補
英偉達持續完善全棧算力版圖,在服務器端依托GIDS技術讓GPU直連SSD,大幅降低數據搬運延遲與功耗損耗;在終端依靠全新RTX Spark PC芯片,實現本地端側AI推理落地,強化了通用算力從雲到端的場景覆蓋能力。
與之形成差異化互補的是,谷歌持續深耕專用算力賽道,推出TPU 8t訓練芯片與TPU 8i推理芯片。其中TPU 8t綜合性能較上代提升2倍、算力提升3倍,适配超大規模千億、萬億級大模型訓練;TPU 8i實現每美元性能提升80%,有效降低雲端規模化推理成本,精準解決大模型商業化落地的高能耗、高成本痛點。
商業化層面,谷歌TPU生态已對外開放。Anthropic承諾未來五年投入約2000億美元采購TPU算力,黑石集團聯合谷歌成立AI雲公司、将TPU作為核心算力底座。頭部客戶落地采購,證明TPU已擺脫内部自用屬性,與英偉達GPU形成通用兜底、專用提效的互補格局。在Token經濟加速普及的背景下,能效比、單位算力成本成為行業選型核心标準,也讓TPU的專用技術優勢進一步凸顯。
市場重構,算力時代催生GPU、TPU雙主流格局
過去,英偉達GPU長期壟斷AI算力市場,市占率一度超90%,谷歌TPU以谷歌内部自用為主,市場規模有限。如今,市場将迎來重構。市場預測,2026年谷歌TPU出貨量将達600萬片,與英偉達同期700萬至750萬片的出貨量合計占據全球約80%的市場份額。
在性能方面,GPU勝在通用性、靈活性、終端适配性,覆蓋圖形渲染、通用計算、端側輕量化AI任務;TPU依托脈動陣列架構,在超大規模集群訓練、高密度雲端推理場景具備壓倒性能效優勢。以谷歌TPU v7為例,公開信息顯示,其峰值算力與英偉達B200相當,能效比達後者2至4倍,每美元性能高出1.4倍,搜索類負載速度可達5倍,大規模集群算力還能線性擴展,适配AI大模型長期穩定訓推需求。
當前,Meta、蘋果、亞馬遜等全球頭部科技企業,紛紛入局專用TPU芯片自研與規模化采購,進一步印證GPU與TPU深度協同已成為全球AI算力布局的主流标準與産業共識。
國産破局,中昊芯英填補自主算力版圖空白
放眼國内算力市場,當前AI芯片領域呈現通用GPU與TPU專用算力協同發展的格局,而TPU賽道尚處在規模化落地的成長階段,仍有廣闊提升與發展空間。“如果中國在TPU路線上長期缺失,不僅會錯失全球AI算力結構轉型的窗口期,更可能在未來形成新的‘卡脖子’節點。”業内人士指出。
在此背景下,中昊芯英作為國内唯一掌握高性能TPU架構AI專用算力芯片核心技術并實現芯片量産落地的本土企業,率先填補國内賽道空白。據了解,中昊芯英自研的刹那TPU芯片已于2023年實現規模化量産,目前企業已搭建完善軟件适配與行業生态,全面兼容DeepSeek、Qwen、GLM等國内主流大模型,在多個千卡級算力集群先後落地,賦能金融、傳媒、教育、醫療等行業,為國産TPU商業化應用蹚出可行路徑。
補齊TPU專用算力短闆,是完善國内AI算力産業體系、實現GPU與TPU雙核并行的關鍵一步。以中昊芯英為代表的本土企業率先實現技術落地與規模化商用,正在穩步填補國内産業鍊短闆。未來,國産TPU如若依托産業政策引導、市場化資本賦能持續完善軟硬件生态,完成全産業鍊突圍,國内算力産業将形成GPU、TPU雙線并行、協同互補的完整布局,進一步夯實我國AI産業自主根基,在全球AI主權競争中掌握更多發展主動權。