Step Asr
通过 Step ASR 流式 API (HTTP SSE) 将音频文件转录为文本。支持中英文及多种音频格式(PCM、WAV、MP3、OGG/OPUS),实时...
SkillHub184 下载1v1.0.0更新于 2026-03-25
codeskills install step-asr该技能详情正在完善中。
查看原文获取完整内容通过 Step ASR 流式 API (HTTP SSE) 将音频文件转录为文本。支持中英文及多种音频格式(PCM、WAV、MP3、OGG/OPUS),实时...
codeskills install step-asr该技能详情正在完善中。
查看原文获取完整内容基于分类和标签推荐
通过Inworld.ai API实现文本转语音。用于生成语音、创建语音回复或转换为MP3/音频文件。支持多音色、语速调节及长文本流式传输。
通过Groq兼容OpenAI的语音转文本API转录音频,适用于用户发送语音消息或音频文件时的快速云端语音识别。
通用语音识别 Skill。支持多种音频格式(ogg/mp3/wav/m4a),使用硅基流动 SenseVoice API 进行语音转文字。当用户发送语音消息、音频文件,或需要转录音频时触发。
使用科大讯飞 API 将音频/视频转换为文字。支持本地音频文件转录、YouTube 视频下载并转文字。适用于会议记录、视频字幕、语音笔记等场景。当用户需要语音转文字、音频转录、YouTube 视频转文字时触发。