DOCX Toolkit
从 .docx 和传统 .doc 文件中提取文本、表格及图片,支持大型文档、CJK 文本与复杂表格结构,包含去重功能。
SkillHub289 下载v1.0.0更新于 2026-03-25
codeskills install docx-toolkit该技能详情正在完善中。
查看原文获取完整内容从 .docx 和传统 .doc 文件中提取文本、表格及图片,支持大型文档、CJK 文本与复杂表格结构,包含去重功能。
codeskills install docx-toolkit该技能详情正在完善中。
查看原文获取完整内容基于分类和标签推荐
基于Ollama GLM-OCR的智能PDF与图片转Markdown工具,支持文本/表格/图片智能识别
使用 Mistral OCR API 从 PDF(包括扫描版)中提取文本、表格和图片。当用户要求对 PDF/图片进行 OCR 或提取文本时使用。
使用MinerU本地(CPU)解析PDF为Markdown/JSON,假设按文档创建输出文件夹,支持表格与图片提取。
使用Mistral OCR API提取PDF或图像中的文本、表格和图像,输出Markdown、JSON或HTML格式。