MinerU 是一款全能的文档解析神器,专门解决各种格式文件里的文字、表格、图片等信息提取难题。它支持 PDF、Word、Excel、PPT、图片(含扫描件)、HTML 甚至带复杂排版的电子书,能从杂乱的版面中准确抓出结构化内容。
用起来很省心:上传或拖入文件,它会自动识别文字层级、表格行列、图片位置,并输出可直接编辑的文本或可导入 Excel 的表格,还能保留原有的标题、段落、列表结构。内置 OCR 引擎,连扫描版 PDF 或拍照文档也能精准识文字。对于需要处理大量报告、合同、论文或数据的用户,它可以省掉手动复制粘贴、重新排版的繁琐步骤。
MinerU 提供桌面版和在线版,操作界面简单,响应快,对批量任务也很友好。
