体育游戏app平台GLM-4.5 V 就给我推了个最具性价比的手机壳-开云(中国)Kaiyun·官方网站 登录入口

发布日期:2025-08-17 06:20    点击次数:74

体育游戏app平台GLM-4.5 V 就给我推了个最具性价比的手机壳-开云(中国)Kaiyun·官方网站 登录入口

凌晨 2 点 25 分体育游戏app平台,作家顶着熊猫眼,把智谱最新开源的 GLM-4.5V 大模子狠狠测了一遍,论断是——这 106B 参数的多模态“怪兽”不仅看得懂、算得快,还干得漂亮。保姆级教程、装置包、API 白嫖指南全打包,5 分钟让你的电脑也长出 AI 眼睛和大脑。

我确凿有点服,智谱又又又发布了新模子。

然后又给开源了。坐褥队的驴齐不带这样卷的,我齐怀疑智谱是不是嗑药了。

7 月初开源 GLM-4.1V-Thinking,上周开源 GLM-4.5 和 GLM-4.5-Air,今天又开源了个 GLM-4.5 V。

晚上我听了他们的直播发布会,几个青涩的年青东说念主给先容了此次发布的模子,时辰很短,但却不不祥。

我想第二天一定会有超等多的东说念主来测,来玩,导致卡的无法使用。基于前车之鉴,我已经盘算今晚就给测完,更生的体验下它的智力,

面前是凌晨 2 点 25,终于测完结,还好,此次没到五点,证实有非常,否则翌日去上海怕是顶不住。

先说我测试下来的论断吧:GLM-4.5V 模子在多模态智力上阐述很好,特殊是在图像/视频团结、视觉定位上阐述优异。

面前雷同可以在 z.ai 体验,但看成开导者,我更倾向于用 API 面孔来考证一些东西。

正好他们开源了个桌面助手 vlm-helper,于是以下我所有的测评齐基于该桌面助手。

我也会在著作后头给出该桌面助手的装置包以及教程。

天然,按照成例,在放确实测评前,已经要放一放模子的跑分情况(诚然各人齐看麻了)

可以看出在 42 个公开视觉多模态榜单中空洞恶果达到同级别开源模子 SOTA 性能,涵盖图像、视频、文档团结及 GUI 任务等常见任务。

据官方先容,GLM-4.5V 是基于智谱新一代旗舰文本基座模子 GLM-4.5-Air,延续 GLM-4.1V-Thinking 技艺道路,是一个领有106B总参数,12B激活的视觉推理模子。

但口说无凭,确实体验如何,还得施行测试。底下开整。

前端复刻

官方直播的视频放出了复刻带有交互的知乎网站。况且是通过录屏的面孔,看着挺利害的。

但像这类公开的网站早就不知说念被大模子老师了几许次了,参考道理不大。

于是,我灵机一动,何不复现时我的开源名目 PmHub?这够小众吧。

于是,我也对着 PmHub 录了个屏,也便是通俗点击页面的功能。然后吧视频丢给 vlm-helper,GLM-4.5 V 识别团结视频内容和操作,然后按照条件输出代码。

我的教导词是这个:

请证据提供的多张网页 UI 截图,复刻出完好的交互式网页,终了通盘网页的点击、跳转、交互等功能,请戒备,每一张UI截图齐会对应某个操作,请务必终了点击、跳转等交互操作,不要在thinking经由中想考html code怎样写。最终复返一个完好html code。

我把前端恶果作念了个对比:

就单单从前端复刻智力上,没啥兴味,因为像 Weavefox 和same.new 这样的器具作念的细节会更到位。

但就从视频团结通盘页面交互,这个就很吊了。这种嗅觉就好像 GLM-4.5 V 长了个眼镜,又带了个大脑,能看能团结,终末还能咔咔一顿编码输出。

图像团结

底下是对多模态智力进行测试,但因为是 AI 桌面助手,我合计在咱们的测评中已经要以施行的职责学习场景张开。

是以以下 case,均模拟确实需求场景。

1、找出性价比最高的商品

最近在厦门抽了中了个手机,一直想着买个手机壳,但一搜,就蹦出一堆出来,容易让东说念主挑花了眼。

我其实就一个需求,选个性价比高的,就够了。

于是我一截图,输入需求然后一趟车,GLM-4.5 V 就给我推了个最具性价比的手机壳。

这里测验的是模子对图片的团结智力,以及逻辑运筹帷幄智力。GLM-4.5 V 阐述可以。

2、微信陈述

我每天对着电脑要猝然特殊多的时辰在微信上,或许候是职责,或许候是摸鱼吹水。

就比如在吹水群,好一又友 kk 际遇仙葩的抱怨,看成钢铁直男,我一时不知说念该怎样陈述好。

于是我让桌面助手捕捉我的屏幕中微信聊天纪录,它就给了我一个没那么难受的陈述。

讲真,淌若我要回,我算计是先扬声恶骂帮致意一下这仙葩,但 GLM-4.5 V 团结到了,此时,kk 不祥更需要的是共情以及安危。

诚然它还没法径直帮我发音信,但这个情商是比大大齐直男齐高的(包括老苍何)

3、一又友圈旅游照定位

一又友圈不竭会看到旅游照,或许候除了调治除外,也特殊想知说念这是去的哪儿耍呀,但又不好兴味评述区或者私信径直问。

或许败露了我方穷屌丝的施行,面前,我将一又友圈分享给 GLM-4.5 V,然后问它:这是哪儿。

GLM-4.5 V 凭借对图片特征的提真金不怕火,能给出是那里。

不瞒你说,就 kk 发的这个图,我一时还真没猜测会是在青岛,诚然,我在青岛呆了 4 年。。。

顺带,让懂事的 GLM-4.5 V 给 kk 来个陈述评述吧,真好,有了 AI,倒是省去了许多我不必要的想考。

4、考证码任务完成

诚然我是作念软件的,我能团结许多网站为了安全加固,会可爱搞相比曲折的考证,来诠释我方是个东说念主。

就比如智谱他们自家的这个登录考证:

关于我这目光不好的来说,每次已经挺云尔的。

面前好了,把这个丢给 GLM-4.5 V,它径直把谜底给你标注出来,这家伙,合营上 Agent,不是全自动化绕过考证?

你感受一下:

确实说念高一尺魔高一丈,算计智谱法务得好好加班照看照看随意之策了,否则像 12306 这种最祸害的考证面孔,不也能分分钟破解?

你还别说,基于此,我还真就作念了个爱惜具,让你绕过所有的强制性考证。

视频团结

除了图片团结,我合计更难的是视频的团结智力,而最为进犯的亦然视频团结的智力。

因为咱们的物理寰宇是三维的,而非二维的,对视频的团结,是通过 AGI 的进犯技巧。

底下看几个相比有效的 case:

1、视频课程学习

上传一个 7 分多钟,大小 19.7 M 的 java 学习视频,来拷打一下:

让它帮我梳理回顾下这个课程的内容:

回顾的可以,可惜我往时学习 Java,没这浅薄。这个场景在学习办公下齐特殊有效。

咱们可以回顾会议内容,电视剧剧情,电影经典场地等。

3、GitHub 名目学习

我不竭会逛 GitHub 充电学习,但许多的开源名目齐是英文的,看起来不顺畅,就比如 GLM-4.5 V 这个开源名目,默许亦然英文。

面前,我让桌面助手中的 GLM-4.5 V 径直帮我先容这个名目,特殊实用。

翻译

天然还有个场景便是翻译,关于非网页类的场景,翻译起来还真禁绝易,需要先截图,然后 OCR 识别,终末再找翻译器具。

这个经由一度很祸害,面前无谓,径直让桌面助手来解决,分分钟翻译好了。

表格/图表调度

我合计还相比实用的场景是作念表格/图表调度。

基于 GLM-4.5 V 的图像团结智力,能准确识别表格和图表信息,然后按照指定步骤输出。

特殊浅薄,况且无谓器具切来切去,就用桌面助手就 OK。

视觉定位

GLM-4.5 V 的视觉定位智力很强,况且这个的行使场景会特殊多。

比如我要在繁密复杂的场景中,精准找到妥当的东说念主物:找到桥下的一条船,船上有两个东说念主

归正这,我要找,如实得找半天。

再比如,在东说念主多的市集,找到背着双肩包穿灰色短袖的年青须眉。

嗅觉 GLM-4.5 V 接入安防监控,会是特殊好的场景啊。

我想 GLM-4.5 V 开源后,一堆的硬件落地产物又会出来了。

况且为了考考 GLM-4.5V 看图猜位置的智力,智谱让 GLM-4.5V 进入了图寻游戏的全球积分赛,和国内最顶尖的两万多名东说念主类玩家确实对战。

GLM-4.5V 就打败了 99% 的玩家。

GUI Agent

这个智力嗅觉是为了之后的 AutoGLM 铺垫的,也便是能通过看到的 GUI,合营 Agent,完胜指定的操作。

我录了个官方的视频先容,不得不说,期待性径直拉满。

好啦,测评就收尾了,你可以看到,此次 GLM-4.5 V 的更新,也雷同的有点超出预期了。

底下,是如何部署 AI 桌面助手的教程,主打一个有手就行。

部署教程

大开装置包径直装置。

装置包可以后台留言下载:vlm-helper

打第一次开会报这个错:

不紧要,结尾中输入以下号令抓⾏安全截止拆除号令,然后重启行使就好。xattr -rd com.apple.quarantine /Applications/vlm-helper.app

接下来,设置一下 API,点击右上角的建立,选拔模子建立。(这里有个小 tips,一定要开启「智谱 Mass 步地」,天然默许便是开启的,不要手滑关掉就好啦)

点击右侧的获取 API Key,就会跳转到智谱的 BigModel 平台。

面前新用户可以免费领取 2000 万 tokens 体验包,够玩一阵了。

把新建的 API Key 复制到 Vlm-helper 客户端, 点击保存就算完成。

除此还可以进行行使建立和系统教导词建立。有不少快捷键已经很有匡助的。

先试试是否奏效:

该说不说,陈述真的好快。

这样就奏效啦。

在 AI 的路上,有些东说念主,用劲的冲了。

但因为没短期得回他们想要的,他们又撤了。

但有另外一群东说念主,他们从一驱动就在冲。

不论外面的风雨如何变化,

他们永久敬佩 AGI 会到来,并为之不休奋勉。

我合计智谱这帮东说念主便是这样一群东说念主。

天然,我也但愿屏幕前的你和我雷同亦然这类东说念主。

咱们永久敬佩:AGI 一定会到来的。

本文由东说念主东说念主齐是产物司理作家【汪仔6818】,微信公众号:【苍何】,原创/授权 发布于东说念主东说念主齐是产物司理,未经许可,禁绝转载。

题图来自Unsplash体育游戏app平台,基于 CC0 合同。



相关资讯