中國已採取措施,在新的一年繼續其在2025年於人工智慧領域所取得的積極進展。根據報導,DeepSeek發表了一篇技術論文,由包括其執行長兼創辦人梁文鋒在內的19人共同撰寫,內容關於「流形約束超連接」。
該論文討論了大規模訓練人工智慧系統的通用框架,為該國基礎模型的未來發展指出了一個充滿希望的方向。這次發表向世界發出了提醒,尤其是在節慶高峰期間,展現了中國AI企業對創新的高度關注,以及在快速發展的產業中保持領先地位的決心。
該論文的發表時間與去年DeepSeek向全球宣布自己的時間相同。該平台在發表其大型語言模型(LLM)DeepSeek V3後開始引起世界關注。數週後,該公司於1月20日發表了其推理模型DeepSeek-R1。這兩個模型在一系列基準測試中與競爭對手的模型相匹敵或超越其表現,這是另一個吸引全球目光的指標。
此外,它們的建構成本和運算能力僅為美國主要科技公司建構LLM所投資成本的一小部分。DeepSeek的亮相導致1月27日出現大規模拋售,科技股市值蒸發近1兆美元,其中Nvidia單獨就錄得6,000億美元的損失。同時,分析師預測,由於北京的政策支持,中國的AI公司今年有動能繼續展現其令人印象深刻的實力。
除了有利的政策外,這些企業還享有改善的融資前景、各產業對AI系統採用率提升,以及越來越多的人才被招募到這些專案中。
一位匿名的國內AI新創公司聯合創辦人預測,中國可能在2027年超越美國,成為全球領先的AI強國。該聯合創辦人指出中國的人才庫是其在競賽中的主要優勢。
中國國家主席習近平在新年賀詞中提到,市場上出現許多大型AI模型在競相爭先,同時指出國內半導體發展也取得了突破。他強調,所有這些使中國成為創新能力成長最快的經濟體之一。
談到中國的創新,紐約大學法學院兼任教授、專注於AI和數位經濟的Winston Ma提到,該國已為2026年的政策驅動創新做好準備。Ma補充說,考慮到AI被置於中國經濟議程和產業升級計畫的中心,事情可能會進展順利。
根據史丹佛大學DigiChina專案的資料,中國目前擁有一個強大的AI產業參與者群體,正在開發除DeepSeek之外的強大開源模型。該專案目前隸屬於該校的國際安全與合作中心和以人為本的人工智慧研究所,負責編制年度AI指數報告。
其中包括Qwen模型開發商阿里雲,以及Moonshot AI、MiniMax和智譜AI等新創公司,智譜AI在國際上被稱為Z.ai。
根據報告,中國的開源AI模型在能力和採用率方面可能已經趕上甚至超越了美國的同類產品。例如,據稱Facebook的母公司Meta Platforms正在使用阿里雲的開源Qwen模型來訓練一個名為Avocado的新模型。
立即註冊Bybit獲得50美元免費交易加密貨幣


