人工智慧新創公司和研究公司 人類的 該公司宣布推出 Claude Fable 5,這是一款被歸類為「神話級」的全新人工智慧模型,現已適配面向大眾商業用戶。該公司稱該模型是迄今為止功能最強大的公開可用系統,在軟體工程、知識工作、科學研究、視覺任務和長上下文推理等領域都取得了顯著進展。
據 Anthropic 公司稱,Claude Fable 5 在眾多行業基準測試中均優於先前的 Claude 模型,尤其是在處理複雜和擴展性任務方面。然而,該公司指出,該模型的高級功能也帶來了潛在風險,尤其是在網路安全等領域。為了解決這些擔憂,Anthropic 實施了安全控制措施,將某些敏感查詢重定向到功能稍弱的 Claude Opus 4.8 模型。這些安全措施旨在限制濫用,同時允許廣泛的訪問,但該公司也承認,某些良性請求偶爾可能會受到影響。
與 Fable 5 一同發布的還有 Claude Mythos 5,它是基於相同底層模型但移除了部分安全措施的版本。最初,Mythos 5 的存取權限僅限於參與「玻璃之翼計畫」(Project Glasswing)的網路安全機構和基礎設施供應商。 「玻璃之翼計畫」是與美國政府合作開發的。 Anthropic 表示,未來計劃透過更廣泛的可信任存取框架來擴大其可用性。
該公司發布的效能測試結果凸顯了其在軟體工程方面的重大進步。在測試過程中,金融科技公司 Stripe 報告稱,該模型僅用一天時間就完成了跨越 50 萬行程式碼庫的大規模遷移,而這項任務通常需要工程師團隊花費數月時間才能完成。 Anthropic 也表示,Fable 5 在旨在衡量複雜生產級軟體任務效能的程式碼評估中取得了領先成績。
知識推理是該模型展現出卓越性能的另一個領域。 Anthropic公司報告稱,Fable 5在財務和分析基準測試中取得了最高分,在文件分析、圖表解讀、問題解決和決策等方面均有所提升。該公司還稱Fable 5是一款領先的視覺模型,能夠從科學圖表中提取詳細信息,根據屏幕截圖重建軟體應用程序,並處理複雜的圖像處理挑戰。
Anthropic 強調了該模型在超大規模場景和長時間工作流程中保持效能的能力。該公司表示,Fable 5 可以比先前的 Claude 模型更有效地利用持久內存,從而實現更強大的長期推理和任務執行能力。
該公司還強調了Mythos 5在科學研究方面的強大能力。據報道,內部測試表明,該模型將藥物研發流程的部分環節速度提高了約十倍,並能獨立完成通常由人類研究人員執行的任務。 Anthropic公司進一步指出,Mythos 5能夠產生全新的分子生物學假設,這些假設通常比早期模型產生的假設更受研究人員青睞。在基因組學研究方面,據報道,該模型自主開展了一項涉及138種動物數百萬個細胞的長期研究,並開發出一套機器學習系統,儘管其體積遠小於近期發表的科學模型,但其性能卻優於後者。
Anthropic公司表示,Fable 5和Mythos 5的定價分別為每百萬個輸入代幣10美元和每百萬個輸出代幣50美元,相比Claude Mythos Preview的價格大幅降低。 Claude Fable 5現已可透過Anthropic的平台和API立即獲取,而Mythos 5的存取權限目前仍僅限於經批准的網路安全合作夥伴和特定研究機構,直至建立更廣泛的可信任存取計劃。
Source link


