同花顺 Logo
AIME助手
问财助手
为“龙虾”装上眼睛 智谱发布原生多模态Coding基座模型GLM-5V-Turbo
2026-04-02 10:20:49
来源:中证网
分享
AIME

问财摘要

1、4月2日,智谱发布首个原生多模态Coding基座模型GLM-5V-Turbo。该模型最大突破在于深度融合视觉与编程能力,能够原生处理文本、图片、视频等多模态信息,同时擅长编程、长程规划、操作执行等复杂任务。
免责声明 内容由AI生成
文章提及标的
智谱--

4月2日,智谱(HK2513)发布首个原生多模态Coding基座模型GLM-5V-Turbo。该模型最大突破在于深度融合视觉与编程能力,能够原生处理文本、图片、视频等多模态信息,同时擅长编程、长程规划、操作执行等复杂任务。

多模态Coding能力是AI Agent走向实用化的关键一环。智谱(HK2513)介绍,GLM-5V-Turbo能够深度适配Agent工作流,能够与Claude Code、OpenClaw等Agent深度协同,让Agent具备真正的视觉能力,能看懂屏幕上的信息,从而完成“看懂环境→规划动作→执行任务”的完整闭环。目前该模型已通过智谱(HK2513)MaaS平台开放接入。

由此,“龙虾”等智能体的任务边界将被大幅拓宽,例如可以浏览网页和文档,生成图文并茂的报告、PPT,还可以查询并解读K线图等复杂图表,可以说为“龙虾”装上了眼睛。

3月10日智谱(HK2513)上线AutoClaw(中文名“澳龙”),支持用户一键安装的本地版OpenClaw应用。目前AutoClaw已上线“股票分析师”Skill,利用GLM-5V-Turbo的原生视觉能力,“龙虾”能直接看懂K线走势、估值区间图和券商研报图表,实现四路数据源60秒并行采集,输出图文交错的研报。

除视觉编程与“龙虾”任务外,GLM-5V-Turbo在多模态搜索、深度研究、GUI Agent、感知Grounding等更广泛的Agentic场景中也实现了显著的性能提升,为此智谱(HK2513)也提供了一组官方Skills,帮助用户在更多场景中释放模型的多模态潜力。

免责声明:风险提示:本文内容仅供参考,不代表同花顺观点。同花顺各类信息服务基于人工智能算法,如有出入请以证监会指定上市公司信息披露平台为准。如有投资者据此操作,风险自担,同花顺对此不承担任何责任。
homeBack返回首页
不良信息举报与个人信息保护咨询专线:10100571涉企侵权举报

浙江同花顺互联信息技术有限公司版权所有

网站备案号:浙ICP备18032105号
证券投资咨询服务提供:浙江同花顺云软件有限公司 (中国证监会核发证书编号:ZX0050)
AIME
举报举报
反馈反馈