Transcribe
使用本地Whisper(Docker)将音频转录为文本。适用于语音消息、音频文件(.mp3/.m4a/.ogg/.wav/.webm)及转录需求。
SkillHub2,855 下载2v1.0.2更新于 2026-03-25
codeskills install transcribe该技能详情正在完善中。
查看原文获取完整内容使用本地Whisper(Docker)将音频转录为文本。适用于语音消息、音频文件(.mp3/.m4a/.ogg/.wav/.webm)及转录需求。
codeskills install transcribe该技能详情正在完善中。
查看原文获取完整内容基于分类和标签推荐
从 YouTube 及 yt-dlp 支持站点下载视频、音频、字幕与整洁段落式转录文本。用于“下载视频”“保存片段”“提取音频”“获取字幕/转录”或排查 yt-dlp/ffmpeg 及格式/播放列表问题。
使用Telnyx语音转文本API将音频文件转录为文本。适用于录音、语音消息等口语内容的文字转换。
飞书/Lark 机器人 API 封装,支持文本、图片、音频、文件、富文本、交互式卡片等全类型消息发送与完整交互功能。
根据图片和用户录音生成对口型视频。 ✅ 适用场景: - 用户提供自己的音频文件(录音) - 需将图片与特定音频同步 - 用户自行录制了脚本 - 需保留精确音频时间 ❌ 不适用场景: - 用户提供文本脚本(非音频)→ 使用 veed-ugc - 需AI生成语音 → 使用 veed-ugc - 尚无音频文件 → 使用 veed-ugc 配合脚本 输入:图片 + 音频文件(用户录音) 输出:MP4视频,对口型匹配所提供音频 关键区别:veed-ugc = 脚本 → AI语音 → 视频 ugc-manual = 用户音频 → 视频(无语音生成)