Convert PDF to HTML without losing text or format.
效果相当好的一个PDF转HTML程序,生成的结果和原始PDF几乎一模一样。
其背后是利用的Chrome Headless,让Chrome渲染PDF,再导出成HTML,甚至图片都转成了 base64 字符,所以一个网页就可以包含完整的文本、字体和图片等内容
需要一定的折腾能力,不是一个直接安装使用的软件,需要执行sh脚本。
软件截图
软件教程
https://github.com/pdf2htmlEX/pdf2htmlEX/wiki/Quick-Start
软件获取
开源地址:https://github.com/pdf2htmlEX/pdf2htmlEX
网站链接:https://pdf2htmlex.github.io/pdf2htmlEX/
声明:本站为个人非盈利博客,资源均网络收集且免费分享无限制,无需登录。资源仅供测试学习,请于24小时内删除,任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集。请支持正版!如若侵犯了您的合法权益,可联系我们处理。