Multimodal Asset Tagger
为图片、视频及音频资源生成AI优化的Alt文本、文件名、标题和Schema标记,提升在Google Lens等平台的AI可发现性。
SkillHub202 下载v1.0.0更新于 2026-03-25
codeskills install geo-multimodal-tagger该技能详情正在完善中。
查看原文获取完整内容为图片、视频及音频资源生成AI优化的Alt文本、文件名、标题和Schema标记,提升在Google Lens等平台的AI可发现性。
codeskills install geo-multimodal-tagger该技能详情正在完善中。
查看原文获取完整内容基于分类和标签推荐
使用 markitdown 将 PDF、Word(.docx)、PowerPoint(.pptx)、Excel(.xlsx/.xls)、HTML、CSV、JSON、XML、图片(含EXIF/OCR)、音频(含转录)、ZIP压缩包、YouTube链接或EPub转换为Markdown格式,便于LLM处理或文本分析。
通过音频(转录文本)与视觉(帧提取+图像分析)双通道进行多模态YouTube视频分析,特别适用于教程类视频
根据图片和用户录音生成对口型视频。 ✅ 适用场景: - 用户提供自己的音频文件(录音) - 需将图片与特定音频同步 - 用户自行录制了脚本 - 需保留精确音频时间 ❌ 不适用场景: - 用户提供文本脚本(非音频)→ 使用 veed-ugc - 需AI生成语音 → 使用 veed-ugc - 尚无音频文件 → 使用 veed-ugc 配合脚本 输入:图片 + 音频文件(用户录音) 输出:MP4视频,对口型匹配所提供音频 关键区别:veed-ugc = 脚本 → AI语音 → 视频 ugc-manual = 用户音频 → 视频(无语音生成)
BizyAir 文件上传助手。当用户需要将本地图片、音频、视频等资源上传到 BizyAir 服务器时使用此技能。支持快速上传并获取可访问的 URL。触发场景:用户提到"上传到 BizyAir"、"BizyAir 上传"、"上传图片到 BizyAir",或者需要获取 BizyAir input resource U...