Groq Voice Transcribe
通过Groq兼容OpenAI的语音转文本API转录音频,适用于用户发送语音消息或音频文件时的快速云端语音识别。
SkillHub122 下载v1.0.1更新于 2026-03-25
codeskills install groq-voice-transcribe该技能详情正在完善中。
查看原文获取完整内容通过Groq兼容OpenAI的语音转文本API转录音频,适用于用户发送语音消息或音频文件时的快速云端语音识别。
codeskills install groq-voice-transcribe该技能详情正在完善中。
查看原文获取完整内容基于分类和标签推荐
基于Azure OpenAI GPT Realtime Mini模型,通过WebSocket实时生成播客风格AI音频叙事。适用于文本转语音、音频内容生成、播客制作及Realtime API集成。涵盖React前端到Python FastAPI后端的全栈流式实现。
使用Google Gemini API或Vertex AI转录音频文件
全平台多模态统一接口:通过nous-genai CLI/SDK统一调用文本/图像/音频/视频/嵌入,支持OpenAI、Gemini、Claude等。
通过Inworld.ai API实现文本转语音。用于生成语音、创建语音回复或转换为MP3/音频文件。支持多音色、语速调节及长文本流式传输。