本文更新于: 2024年5月27日
APP喵前言:OCR工具很多,大多数是识别文字,在线识别版面、表格、图片、文字、数学公式少,今天阿喵就给大家分享一个好用的开源多功能图像内容识别工具Pix2Text,支持python执行和网页端使用
软件介绍
Pix2Text是一款开源 Python3 工具,可以识别图片中的版面、表格、图片、文字、数学公式等内容,并整合所有内容后以 Markdown 格式输出。Pix2Text 首先利用图片分类模型来判断图片类型,然后基于不同的图片类型,把图片交由不同的识别系统进行文字识别,后续图片类型会依据应用需要做进一步的细分。
截图
特色
它是 Mathpix (https://mathpix.com/) 的免费替代品,可将视觉内容无缝转换为基于文本的表述,支持 80 多种语言。
P2T 也可以把一整个 PDF 文件(PDF 的内容可以是扫描图片或者其他任何格式)转换为 Markdown 格式。
网页版每人每天可以免费识别 10000 个字符,正常使用应该够用了。
软件下载
https://github.com/breezedeus/Pix2Text/releases
在线网站:https://p2t.breezedeus.com/
声明:本站为个人非盈利博客,资源均网络收集且免费分享无限制,无需登录。资源仅供测试学习,请于24小时内删除,任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集。请支持正版!如若侵犯了您的合法权益,可联系我们处理。