CodeSkills
返回发现

multimodal-parser

统一多模态解析器,支持图像、PDF、DOCX及音频的自动OCR识别与语音转录,输出结构化文本供LLM处理

SkillHub150 下载v1.0.1更新于 2026-03-25
codeskills install multimodal-parser
查看原文

该技能详情正在完善中。

查看原文获取完整内容

使用示例

快速上手这个技能

示例 1

参数说明

可配置的选项

参数说明默认值
parser统一多模态解析器,支持图像、PDF、DOCX及音频的自动OCR识别与语音转录,输出结构化文本供LLM处理

相关技能

基于分类和标签推荐

查看更多