上证报中国证券网讯(记者杨翔菲)4月15日,小红书AI平台团队正式开源Relax——一款面向全模态与Agentic场景设计的大模型强化学习训练引擎。
据悉,Relax基于Megatron-LM和SGLang高性能后端构建,以协同设计为核心理念,将全模态数据支持、服务化容错架构和异步训练流水线三个维度统一解决。在Qwen3-Omni-30B上,Relax验证了图像、文本、音频和视频四种模态的RL(强化学习)训练稳定收敛;在16xH800多机下,训练全异步相比Colocate基线端到端提速76%,相比veRL的全异步端到端提速20%。
