Google Gemini Media
使用Gemini API(Nano Banana图像生成、Veo视频、Gemini TTS语音及音频理解)构建端到端多模态媒体工作流,提供「生成+理解」代码模板。
SkillHub3,581 下载5v1.0.1更新于 2026-03-26
codeskills install google-gemini-media该技能详情正在完善中。
查看原文获取完整内容使用Gemini API(Nano Banana图像生成、Veo视频、Gemini TTS语音及音频理解)构建端到端多模态媒体工作流,提供「生成+理解」代码模板。
codeskills install google-gemini-media该技能详情正在完善中。
查看原文获取完整内容基于分类和标签推荐
通过RunningHub API(170+端点)生成图像、视频、音频及3D模型,或基于webappId运行任意RunningHub AI应用(自定义ComfyUI工作流)。
使用MiniMax文本、语音、视频和音乐API,通过模型路由、兼容SDK及安全多模态工作流进行构建。
全平台多模态统一接口:通过nous-genai CLI/SDK统一调用文本/图像/音频/视频/嵌入,支持OpenAI、Gemini、Claude等。
基于MCP的比特币AI工具市场,支持图像生成(Flux、Seedream、Recraft)、文本生成(Kimi K2.5、DeepSeek、GPT-OSS)、视频生成(Kling V3)及音乐语音合成。