最高智力一家計算和基礎設施平台公司宣布,其「Lab」系統已從測試版過渡到正式版。
該平台旨在為能夠自我改進的人工智慧代理提供訓練環境,並將完整的模型改進工作流程整合到一個系統中。它使用戶能夠 defi在一個整合管道中完成 ne 任務、配置評估環境、運行模型評估、使用獎勵訊號進行訓練、查看執行追蹤、部署適配器和執行推理。
該系統圍繞著公司所稱的「環境」構建,這些環境將資料集、工具、模擬器和評估框架打包在一起。 defi需要製定成功指標。這些環境可應用於多種用例,包括基準測試、編碼任務、基於瀏覽器的工作流程、遊戲模擬、客戶支援場景以及更長期的自主代理。同一框架支援本地實驗、託管評估、合成資料生成、提示最佳化和強化學習過程。
該實驗室包含多個核心組件,例如用於大規模強化學習的託管訓練基礎設施、評估系統、環境中心、適配器部署工具、推理服務和沙盒執行環境。託管訓練透過輕量級設定檔進行配置,並透過命令列工具執行,系統負責模型權重的編排、擴充、部署產生和同步。訓練運作採用強化學習工作流程,並產生可部署的LoRa適配器,推理過程會隨著模型的改進而持續更新。
該平台旨在支援迭代循環,其中模型在真實任務上進行評估,利用收集到的獎勵訊號進行訓練,並重新部署以進一步優化。公告稱,在測試階段,研究人員、新創公司和大型團隊在數學、軟體開發和企業自動化工作流程等領域進行了超過 10,000 次訓練運行。參與者還創建了自訂環境和訓練設置,超出了平台最初的預期。
隨著正式發布,Lab 將擴展其對多個提供者和架構的模型支持,並將自身定位為建立持續模型改進流程的基礎設施。更廣泛的發展路線圖包括多模態智能體、長時域推理任務和企業級自動化系統的應用,以及持續開發開放的研究工具和協作訓練環境。
Source link


