值得信赖的区块链资讯!
比推数据  |  比推终端  |  比推英文  |  比推 APP  | 

下载比推 APP

值得信赖的区块链资讯!
iPhone
Android

微软开源创新框架:可将 DeepSeek-R1 等模型变成 AI Agent

比推消息,微软在官网发布了视觉 Agent 解析框架 OmniParser 最新版本 V2.0,可将 DeepSeek-R1、GPT-4o、Qwen-2.5VL 等模型,变成可在计算机使用的 AI Agent。与 V1 版本相比,V2 在检测较小的可交互 UI 元素时准确率更高、推理速度更快,延迟降低了 60%。在高分辨率 Agent 基准测试 ScreenSpot Pro 中,V2+GPT-4o 的准确率达到了惊人的 39.6%,而 GPT-4o 原始准确率只有 0.8%,整体提升非常大。除了 V2,微软还开源了 omnitool,这是一个基于 Docker 的 Windows 系统,涵盖屏幕理解、定位、动作规划和执行等功能,也是将大模型变成 Agent 的关键工具。

说明: 比推所有文章只代表作者观点,不构成投资建议

比推快讯

更多 >>

下载比推 APP

24 小时追踪区块链行业资讯、热点头条、事实报道、深度洞察。

邮件订阅

金融科技决策者们都在看的区块链简报与深度分析,「比推」帮你划重点。