如何安装 Multimodal Asset Tagger？

运行命令：codeskills install geo-multimodal-tagger

返回发现

数据分析 nlp vision voice video audio image file

Multimodal Asset Tagger

为图片、视频及音频资源生成AI优化的Alt文本、文件名、标题和Schema标记，提升在Google Lens等平台的AI可发现性。

SkillHub202 下载v1.0.0更新于 2026-03-25

codeskills install geo-multimodal-tagger

查看原文

该技能详情正在完善中。

查看原文获取完整内容

相关技能

基于分类和标签推荐

数据分析llm

Markdown Converter

使用 markitdown 将 PDF、Word(.docx)、PowerPoint(.pptx)、Excel(.xlsx/.xls)、HTML、CSV、JSON、XML、图片(含EXIF/OCR)、音频(含转录)、ZIP压缩包、YouTube链接或EPub转换为Markdown格式，便于LLM处理或文本分析。

24,189117

数据分析nlp

Youtube Knowledge Extractor

通过音频（转录文本）与视觉（帧提取+图像分析）双通道进行多模态YouTube视频分析，特别适用于教程类视频

5242

内容创作nlp

UGC Manual

根据图片和用户录音生成对口型视频。 ✅ 适用场景： - 用户提供自己的音频文件（录音） - 需将图片与特定音频同步 - 用户自行录制了脚本 - 需保留精确音频时间 ❌ 不适用场景： - 用户提供文本脚本（非音频）→ 使用 veed-ugc - 需AI生成语音 → 使用 veed-ugc - 尚无音频文件 → 使用 veed-ugc 配合脚本输入：图片 + 音频文件（用户录音）输出：MP4视频，对口型匹配所提供音频关键区别：veed-ugc = 脚本 → AI语音 → 视频 ugc-manual = 用户音频 → 视频（无语音生成）

8052

效率提升vision

BizyAir 文件上传

BizyAir 文件上传助手。当用户需要将本地图片、音频、视频等资源上传到 BizyAir 服务器时使用此技能。支持快速上传并获取可访问的 URL。触发场景：用户提到"上传到 BizyAir"、"BizyAir 上传"、"上传图片到 BizyAir"，或者需要获取 BizyAir input resource U...