买币行情现货交易合约GOLD 理财活动中心

更多

SkyRL推出视觉语言强化学习，助力多模态任务的可扩展训练。了解这对AI发展的影响。（阅读更多）SkyRL推出视觉语言强化学习，助力多模态任务的可扩展训练。了解这对AI发展的影响。（阅读更多）

SkyRL 为多模态模型新增视觉语言强化学习支持

来源：BlockChain News

2026/04/25 00:33

阅读时长 5 分钟

分享

如需对本内容提供反馈或相关疑问，请通过邮箱 crypto.news@mexc.com 联系我们。

SkyRL 为多模态模型增添视觉语言强化学习支持

Joerg Hiller 2026年4月24日 16:33

SkyRL 引入视觉语言强化学习，为多模态任务实现可扩展训练。了解这将如何影响人工智能发展。

SkyRL 为多模态模型增添视觉语言强化学习支持

SkyRL 是由加州大学伯克利分校 Sky Computing Lab 与 Anyscale 联合开发的强化学习（RL）库，近日宣布支持视觉语言模型（VLM）的后训练。此次更新允许团队使用监督微调（SFT）和 RL 工作流程训练多模态模型，满足市场对能够同时处理视觉与文本数据的模型日益增长的需求。

计算机视觉任务、机器人技术及智能体推理等多模态工作负载，要求模型处理视觉输入、执行动作并根据反馈进行调整。SkyRL 的新功能将 VLM 提升为其训练栈中的一等公民，提供工具以在本地 GPU 或多节点集群上扩展训练规模。这建立在 SkyRL 现有基础设施之上，该基础设施已支持复杂的智能体任务，如软件工程基准测试和 Text-to-SQL 生成。

此次更新的主要功能

视觉语言任务中强化学习的核心挑战之一，是保持训练与推理之间的一致性。SkyRL 通过引入解耦管道，解决了处理视觉输入时常见的对数概率漂移问题。该平台以 vLLM 推理栈作为唯一可信来源，确保词元化和输入准备在各工作流程中保持一致。

这种方式不仅稳定了训练过程，还允许独立扩展用于输入处理的 CPU 工作节点，确保 GPU 吞吐量不会成为瓶颈。此次更新还支持开箱即用的任务方案，如 Maze2D 导航和 Geometry-3k——一个需要视觉几何推理的数据集。早期结果显示，即使在较大的模型规模下（如 Qwen3-VL 8B Instruct），训练稳定性也有所提升。

对人工智能发展的影响

SkyRL 正将自身定位为多模态模型训练中可扩展 RL 和 SFT 的首选平台。通过与 Tinker API 等工具集成，用户可在自有基础设施上部署 RL 工作流程，减少对外部服务商的依赖。考虑到训练大型模型的计算需求不断增加，这一点尤为重要。

这些进展恰逢多模态人工智能系统在实际应用中需求旺盛之际。需要序贯决策、视觉推理和适应性的任务——如自主导航和与工具的动态交互——将从中大为受益。SkyRL 的模块化设计也支持快速原型开发，使研究人员和开发者能够尝试新算法和训练范式。

展望未来

SkyRL 的路线图包括序列打包、Megatron 后端支持以及具有上下文并行性的长上下文训练等功能。这些升级预计将进一步增强其处理复杂智能体工作负载的能力。对于渴望深入 VLM 训练的开发者，SkyRL 提供教程和文档以助其快速上手。

随着人工智能行业日益将多模态系统纳入实际应用场景，高效训练和微调此类模型的能力将成为关键差异化因素。SkyRL 的最新更新体现了其在这一演进浪潮中保持前沿地位的承诺，为前沿 RL 研究与部署提供可扩展的模块化框架。

图片来源：Shutterstock

skyrl
强化学习
视觉语言模型
人工智能训练

错过等一年！U狂欢$200,000奖池开抢

错过等一年！U狂欢$200,000奖池开抢

错过等一年！U狂欢$200,000奖池开抢

拉宝箱赢U/黄金/BNB，质押U享12%APR，新用户再领$200

免责声明: 本网站转载的文章均来源于公开平台，仅供参考。这些文章不代表 MEXC 的观点或意见。所有版权归原作者所有。如果您认为任何转载文章侵犯了第三方权利，请联系 crypto.news@mexc.com 以便将其删除。MEXC 不对转载文章的及时性、准确性或完整性作出任何陈述或保证，并且不对基于此类内容所采取的任何行动或决定承担责任。转载材料仅供参考，不构成任何商业、金融、法律和/或税务决策的建议、认可或依据。

您可能也会喜欢

美国轰炸伊朗核设施，铀储量命运未卜

美国轰炸伊朗核设施，铀储量命运未卜

美国轰炸伊朗核设施，铀库存命运未卜一文发布于 BitcoinEthereumNews.com。美国已轰炸伊朗核设施，留下

BitcoinEthereumNews2026/04/25 14:33

巴西禁止非金融预测市场合约

巴西禁止非金融预测市场合约

巴西禁止非金融预测市场合约一文发布于 BitcoinEthereumNews.com。要点：巴西国家货币委员会禁止

BitcoinEthereumNews2026/04/25 13:56

一家从 Crypto 世界来的 VC，说 AI 太疯狂，他们很保守

一家从 Crypto 世界来的 VC，说 AI 太疯狂，他们很保守

原文：elsewhere 很多人说，AI行业，某些方面越来越像Crypto行业。 Impa Ventures的Jingwen，一个曾经就在Crypto行业的人说，相比于今天的A…

BlockWeek2026/04/25 13:14

邀請好友，双方各得 $60！

$100,000 静待领取，先到先得！

热门新闻

Saylor的买币永动机卡壳，STRC百元锚点失守，高息策略失效？

Bitcoin、Ethereum ETF 在美伊紧张局势中录得 3,780 万美元净流入

Pi Network领导人参加迈阿密共识大会，探讨区块链与AI

'预防措施'- Wrapped Bitcoin (wBTC) 在 KelpDAO 2.93亿美元漏洞事件后加强安全措施

美国驱逐舰拦截伊朗船只，影响霍尔木兹海峡市场

实时快讯

BSB 暴涨超 70%，回调到 0.5，整体走势偏多头，盘口行为相对可控，中途伴随多次洗盘。

作者：Seven.七七15:55

BTC 对比 1972 年的黄金。杠杆正在上升，预期可能出现市场出清。市场波动性被进一步凸显。

作者：無名先生15:34

CoinGecko 的工具支持多资产图表对比，为散户用户提升了分析 $XLM 的效率。

作者：Celes 🦋15:30

资金正流向新的叙事方向。BLEND 主网启动、空投以及交易所相关活动，正在推动集中的买盘兴趣。

作者：奶牛叔15:18

SOL 分析突出了关键支撑位和阻力位，以及潜在的突破情景，指示出市场结构和趋势演变的可能性。

作者：Nehal14:53

快速阅读

BEEG 2026年价格预测：已经见顶了吗？还是行情没来？

BEEG 2026深度解析：巨鲸正在悄悄建仓？

XRP ETF创2026年最长连涨纪录，机构资金强势回流

DOGE 多头蓄势待发！$0.1028 能否一举突破？

什么是 Peace Frog(PEACE)？加密货币介绍

加密货币价格

比特币图标

比特币

BTC

$77,544.69$77,544.69

-0.63%

以太坊图标

以太坊

ETH

$2,317.62$2,317.62

-0.26%

Tradoor 图标

Tradoor

TRADOOR

-87.36%

USDCoin 图标

USDCoin

USDC

0.00%

Solana 图标

Solana

SOL

-0.04%

掷骰赢 1 BTC！

邀请好友掷骰子，争夺 500,000 USDT！