Vision Sandbox
基于 Gemini 原生代码执行沙盒的智能体视觉,用于空间定位、视觉数学和 UI 审计。
SkillHub4,947 下载1v1.1.0更新于 2026-03-26
codeskills install vision-sandbox该技能详情正在完善中。
查看原文获取完整内容基于 Gemini 原生代码执行沙盒的智能体视觉,用于空间定位、视觉数学和 UI 审计。
codeskills install vision-sandbox该技能详情正在完善中。
查看原文获取完整内容基于分类和标签推荐
豆包图像分析技能:调用豆包(字节跳动)视觉大模型,分析图片内容。AI agent 调用时,必须使用 --output 将结果写入临时文件(如 /tmp/doubao_result.txt),再通过读文件工具获取结果,禁止直接解析 stdout。
通过USB或网络控制真实安卓手机,使用GPT-4o视觉执行打开应用、输入文字、点击及自动化脚本等操作。
通过CLIProxyAPI分析图片(jpg、png、gif、webp)和PDF——该Claude Max代理通过您的订阅路由请求,零额外费用。使用此...
捕获学习经验、错误和修正以实现持续改进。使用时机:(1) 命令或操作意外失败时,(2) 用户纠正Claude时