LLMWhisperer
使用LLMWhisperer API提取图片和PDF中的文本与布局,擅长手写内容和复杂表单。
SkillHub2,873 下载1v0.0.7更新于 2026-03-25
codeskills install llmwhisperer该技能详情正在完善中。
查看原文获取完整内容使用LLMWhisperer API提取图片和PDF中的文本与布局,擅长手写内容和复杂表单。
codeskills install llmwhisperer该技能详情正在完善中。
查看原文获取完整内容基于分类和标签推荐
集成OpenAI API,支持聊天补全、嵌入、图像生成、音频转录、文件管理、微调及助手功能。
The cheapest AI media API on the market. Transcribe YouTube videos, generate images with Flux and Z-Image models, convert text to speech in 54+ voices across 8 languages, extract text with OCR, create videos, remove backgrounds, upscale images, apply style transfer - all through one unified API. Free $5 credit on signup - enough for hundreds of hours of transcription or thousands of generated images. Fraction of the cost of any alternative.
使用OpenAI Sora API生成视频。适用于文本或图像生成视频场景,支持图生视频及自动尺寸调整。
基于2slides API的AI演示文稿生成。支持文本生成幻灯片、参考图风格匹配、文档转演示。适用于用户请求"创建演示""制作幻灯片""生成演示文档"或基于内容/文档/图片生成演示的场景。支持主题选择、多语言及同步/异步生成模式。