DeepSeek AI是什麼?超低成本AI模型震撼全球

分享

DeepSeek AI是什麼?

DeepSeek AI是一家誕生於中國的新創公司,由量化對沖基金幻方量化所成立,並致力開發出來的「大語言模型」,包括了2024年底先行公布的DeepSeek V3版本,以及今年1月20日正式亮相的DeepSeek R1模型。

DeepSeek 超低成本AI模型問世

DeepSeek AI引發熱議,最主要的原因在於它以相對低廉的成本訓練出大型AI模型,根據該團隊的研究說明,V3的訓練開銷大約僅需6百萬美元,且使用的是Nvidia H800晶片,而非高階H100。這意味著在美國政府對中國祭出高階AI晶片出口管制後,DeepSeek仍能用受限版本的晶片做出成效不遜於OpenAI ChatGPT的系統。

有市場分析人士指出,過去AI產業普遍仰賴「晶片等硬體資源無限制擴充」的思維,而DeepSeek選擇了截然不同的道路,透過精準的軟體優化與分散式計算架構,成功突破硬體門檻,縮短訓練時間並大幅降低成本。

衝擊美國科技巨頭與「Magnificent 7」

「Magnificent 7」是指美國股市中七家市值龐大、表現優異的科技巨頭,包括 Apple、Microsoft、Alphabet(Google 母公司)、Amazon、Meta(Facebook 母公司)、Tesla 和 Nvidia。這七家公司因其在全球科技市場的領導地位以及對美國經濟的重大影響而得名。

而「Magnificent 7」企業,原本都預期靠著龐大的資本投入來擴大AI領先優勢,但如今DeepSeek證明,即使在缺乏先進H100晶片的情況下,仍能打造出具備極高商業競爭力的模型。若DeepSeek未來不斷更新開源模型,並持續優化成本結構,將使得美國大廠花費巨額投資AI基礎建設的成效受到質疑。

OpenAI與美國政府共同承諾要在未來四年內投入高達5000億美元在AI相關領域,但若競爭者只用了一小部分資本就能逼近、甚至超越美國模型水平,那麼「Magnificent 7」的獲利前景與AI布局策略都可能遭到重估,進而衝擊整體科技股走勢。

日本與亞洲市場

不只美國科技股因此感到壓力,亞洲市場更是出現快速反應。例如日本半導體設備供應商如Advantest、東京威力科創等公司股票在消息爆出後跌幅明顯,因為這些企業原本受惠於Nvidia等美企在AI基礎建設的龐大採購,但若美國晶片廠、資料中心業者的投資計畫遭到質疑或放緩,日本相關供應鏈就可能面臨需求縮減。

DeepSeek AI 後勢看好還是曇花一現?

有些人認為,DeepSeek的成功或許只是美國對中國晶片制裁政策的「意外結果」,因為這家公司在有限硬體條件下,反而激發了對演算法與軟體優化的極度重視,使得整個開發策略與西方科技巨頭截然不同。

部分專家也提到,若DeepSeek後續能保持開源模式並吸引全球開發者共同參與,其技術累積速度不容小覷。此外,DeepSeek在App Store免費榜單登頂,也顯示消費者對新一代AI服務的強烈興趣。未來,如果DeepSeek將更多精力投向商業落地,可能具備相當發展潛力。

推薦閱讀

你可能也喜歡

其他人都在看