multimodal-parser
统一多模态解析器,支持图像、PDF、DOCX及音频的自动OCR识别与语音转录,输出结构化文本供LLM处理
SkillHub150 下载v1.0.1更新于 2026-03-25
codeskills install multimodal-parser该技能详情正在完善中。
查看原文获取完整内容使用示例
快速上手这个技能
示例 1
参数说明
可配置的选项
| 参数 | 说明 | 默认值 |
|---|---|---|
parser | 统一多模态解析器,支持图像、PDF、DOCX及音频的自动OCR识别与语音转录,输出结构化文本供LLM处理 | 无 |