本文更新于: 2022年12月21日
一个基于PyQT5开源的、本地的、安全的、支持全文检索的搜索器。
软件截图
软件简介
一款开源的全文搜索工具,支持常见 Office 文档、PDF、.TXT,以及 ePub 和 Mobi 电子书。是本地的、安全的、开源的、支持全文检索的搜索器。
使用提示
- 利用
空闲时间
,提前建立索引
缓存很重要,将大大加快之后的搜索。(本项目并没有强制要求建立索引缓存,还是由你自己决定是否建立索引缓存,如果你经常进行全盘随机搜索,推荐建立索引缓存) - 如果
搜索进行
中,预览
可能会卡顿。如果卡顿,请等待一下。(出现卡顿的原因是当前搜索速度过快加上用户频繁操作导致的Ui阻塞,通常情况不会出现这种卡顿) - 在
第一次搜索
某个文件目录时,搜索速度很慢,但是下次搜索相同目录
将会很快。(原因就是第一次搜索的时候还没有建立索引缓存) - 实际上
索引缓存
就是以文件的MD5值
命名的Text
文本文件,存放目录就在安装目录下的.temp
文件夹下.(这意味这如果更新软件,你可以直接将.temp
文件复制到新安装路径下,而不用耗费时间重新索引
。) - 在
搜索进行
中,必须退出正在打开的word、excel、ppt
文档,退出Microsoft Office
或WPS Office
程序,因为本程序强行关闭Office可能会影响你的文档。(原因是当doc
、xls
、ppt
在经过antiword
、xlrd
处理失败后,将选择通过系统中的Office组件
进行再处理) - 搜索
图像元数据
,pyexiv2
不支持32位,请务必缩小
搜索范围,最好选择具体的文件夹,因为Windows
系统中图片太多,全盘搜索非常浪费时间。
关于速度
搜索时间大部分都是消耗在第一次处理文件,也就是建立索引缓存那个过程。所以有时你在第一次搜索某个目录的时候感觉不是很快,但是如果你第二次搜索相同的目录将会很快。 原理是我在第一次处理文件时留下缓存文件,之后的搜索会根据文件md5值判断文件是否改变,如果文件内容没有改变直接读取缓存,如果文件内容改变将重新处理,这样就会大大提示搜索速度。 最后,推荐大家在空闲时间要提前建立索引,这样下次搜索会很快。
关于项目
这实际上是一个仿照AnyTxT写的项目,只是因为AnyTxT不开源,由于保密原则,某些环境下无法使用,所以自己写了一个开源项目,如果你单位也有保密原则,不妨试试,本项目所有依赖和包都是开源的,你也可以查看项目代码,自行打包。 由于不太懂设计美化,但是项目里面界面都是.ui
文件,如果有会qss
美化的可以帮忙fork
美化一下。
软件下载
开源地址:https://github.com/Gaoyongxian666/OpenSearcher
声明:本站为个人非盈利博客,资源均网络收集且免费分享无限制,无需登录。资源仅供测试学习,请于24小时内删除,任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集。请支持正版!如若侵犯了您的合法权益,可联系我们处理。