PDF转Markdown软件MinerU 1.1.0版整合包,PDF文件转MD格式工具
本次和大家分享的是当前最新V1.1.0版PDF转markdown软件mineru一键启动整合包。当前版本更新内容还是挺重要的,提升了解析准确率和效率,同时更新了模型,所以需要重新下载模型才行,性能得到提升。
·首先到我网盘内将模型文件下载到本地电脑上并解压。上个版本我制作了模型下载程序,有些人也不知道点,还问我为什么找不到模型,索性这次直接把模型打包进来了,直接双击启动软件就可以了。
·首先选择待处理PDF文档,以官方示例文档为例,将PDF文档鼠标左键按住拖动到窗口里,选择输出结果保存位置,点击开始处理按钮即可开始识别转换PDF文件内容。此过程处理时长由电脑配置决定,处理完成后会显示结果保存位置并按任意键继续。
·这就是最终识别转换后的markdown文件,看一下原PDF文档内容,原文档里面除了文本内容还包含图片、表格和公式,属于内容比较复杂的文档类型。把识别转换结果复制粘贴到markdown编辑器中预览一下,结果公式和表格都识别转换出来了,总体来说效果还是不错的。
·PDF中提取的图片被保存到了images文件夹中,软件还有其它一些参数可以调节,处理方法里可以选择纯文本模式还是OCR模式,也可以让软件自动选择。
·PDF语言就是要处理的PDF文档内容是什么语言,默认可留空。起始页就是从PDF的哪页开始,默认页数从0开始计数。结束页就是处理到哪页结束,后面的文档内容不再处理。这里可以自行操作一下,了解软件是如何计数的。
·也可以根据文档实际内容选择是否开启或关闭表格识别与公式识别功能,功能开的越多对电脑配置要求越高,处理速度越慢。高级用户也可以设置通义千问API辅助优化生成结果,新手小白无需设置此项。
本软件总体来说是比较强大的,效果也很不错,有需要的可以自行下载体验。