内容创作 nlp voice docker audio file

Transcribe

使用本地Whisper（Docker）将音频转录为文本。适用于语音消息、音频文件（.mp3/.m4a/.ogg/.wav/.webm）及转录需求。

SkillHub2,855 下载2v1.0.2更新于 2026-03-25

codeskills install transcribe

该技能详情正在完善中。

查看原文获取完整内容

相关技能

基于分类和标签推荐

内容创作nlp

Video Transcript Downloader

从 YouTube 及 yt-dlp 支持站点下载视频、音频、字幕与整洁段落式转录文本。用于“下载视频”“保存片段”“提取音频”“获取字幕/转录”或排查 yt-dlp/ffmpeg 及格式/播放列表问题。

内容创作nlp

Telnyx Stt

使用Telnyx语音转文本API将音频文件转录为文本。适用于录音、语音消息等口语内容的文字转换。

内容创作nlp

Pywayne Lark Bot

飞书/Lark 机器人 API 封装，支持文本、图片、音频、文件、富文本、交互式卡片等全类型消息发送与完整交互功能。

内容创作nlp

UGC Manual

根据图片和用户录音生成对口型视频。 ✅ 适用场景： - 用户提供自己的音频文件（录音） - 需将图片与特定音频同步 - 用户自行录制了脚本 - 需保留精确音频时间 ❌ 不适用场景： - 用户提供文本脚本（非音频）→ 使用 veed-ugc - 需AI生成语音 → 使用 veed-ugc - 尚无音频文件 → 使用 veed-ugc 配合脚本输入：图片 + 音频文件（用户录音）输出：MP4视频，对口型匹配所提供音频关键区别：veed-ugc = 脚本 → AI语音 → 视频 ugc-manual = 用户音频 → 视频（无语音生成）