你的位置:AG庄闲游戏官网首页 > 走进公司 > AG庄闲游戏官网首页 智谱发布 GLM-5V-Turbo 多模态 Coding 基座模子, 为龙虾安上眼睛

AG庄闲游戏官网首页 智谱发布 GLM-5V-Turbo 多模态 Coding 基座模子, 为龙虾安上眼睛

时间:2026-04-02 09:57 点击:170 次

AG庄闲游戏官网首页 智谱发布 GLM-5V-Turbo 多模态 Coding 基座模子, 为龙虾安上眼睛

IT之家4月2日音问,本日,智谱发布面向视觉编程打造的多模态Coding基座模子GLM-5V-Turbo。其具备以下性情:原生多模态Coding基座,兼顾视觉与编程才能,并深度适配ClaudeCode与龙虾场景。

据先容,GLM-5V-Turbo从预测验阶段深度交融视觉与文本才能,让编程不再局限于纯文本输入。模子能看懂贪图稿、截图、网页界面,并据此生成竣工可运转的代码,信得过作念到看得懂画面、写得出代码。

IT之家附中枢重点如下:

原生多模态Coding基座:原生相识图片、视频、贪图稿、文档版面等多模态输入,并复古画框、截图、读网页等多模态器具调用,凹凸文窗口推广至200k,将Agent的感知-行径链路从纯文本延长到视觉交互。

兼顾视觉与编程才能:在多模态Coding、ToolUse、GUIAgent等中枢基准上得回跳跃施展。通过多任务协同RL等时候技巧,确保纯文本场景下的编程、推理、器具调用等才能不退化。

深度适配ClaudeCode与龙虾场景:与ClaudeCode、OpenClaw/AutoClaw等Agent深度协同,188金宝博复古“看懂环境→琢磨作为→施行任务”的竣工闭环,并提供全套官方Skills,开箱即用。

在多模态Coding、Agentic任务以及纯文本Coding维度的评测基准上,GLM-5V-Turbo均以更小尺寸得回了跳跃施展。

GLM-5V-Turbo在贪图稿规复、视觉代码生成、多模态检索与问答、视觉探查等基准上均得回跳跃施展;在测度果真GUI环境操控才能的AndroidWorld、WebVoyager等基准上相通施展卓越。在纯文本Coding才能方面,GLM-5V-Turbo在CC-Bench-V2的Backend、Frontend和RepoExploration三项中枢基准测试中均保握褂讪施展,标明视觉才能引入后,纯文本编程与推理才能保握了同等水准。

在AutoClaw等龙虾Agent中接入GLM-5V-Turbo后,AG游戏官网龙虾具备了信得过的视觉才能,能看懂屏幕上的信息。模子在测度龙虾Agent任求施行质料的PinchBench、ClawEval和ZClawBench上得回优异收成,考据了其在复杂任求施行场景中的轮廓才能。

典型场景展示:

图像即代码

前端复刻:发送草图、贪图稿、参考网站的截图或录屏,模子就能径直相识布局、配色、组件层级与交互逻辑,生成竣工可运转的前端工程,准确规复版式、配色、动效等视觉细节。

GUI自主探索复刻:琢磨ClaudeCode等框架,GLM-5V-Turbo能凭借自己遍及的GUIAgent才能自主探索宗旨网站,浏览页面结构、梳理各页面之间的跳转相关、收罗视觉素材与交互细节,终末基于纪录的探索成果径直生成代码复现扫数站点,达成从“看图复刻”到“GUI探索复刻”的才能跃升。

为龙虾安上眼睛

龙虾的任务边界被大幅拓宽,举例不错浏览网页和文档,生成图文并茂的评释、PPT,还不错查询并解读K线图等复杂图表。

AutoClaw已上线“股票分析师”Skill,运用GLM-5V-Turbo的原生视觉才能AG庄闲游戏官网首页,龙虾能径直看懂K线走势、估值区间图和券商研报图表,达成四路数据源60秒并行收罗,输出图文交错的研报。立即在AutoClaw中切换至GLM-5V-Turbo,试试发问“帮我分析今天XXX的股价,生成专科分析评释”。

斗鱼体育app中国官网下载
回到顶部
服务热线
官方网站:http://www.yzyuxin.com/
工作时间:周一至周六(09:00-18:00)
联系我们
QQ:888888888
邮箱:@http://www.yzyuxin.com/
地址:武汉东湖新技术开发区光谷大道国际企业中心
关注公众号

Copyright © 1998-2026 AG庄闲游戏官网首页™版权所有

yzyuxin.com 备案号 备案号: 苏ICP备11053647号-1

技术支持:®ag庄闲游戏  RSS地图 HTML地图