本文更新于: 2024年6月18日
APP喵前言:一个可视化,几分钟设计一个爬虫/浏览器自动化测试任务的开源、免费、无广告软件。
软件简介
易采集 EasySpider 是一个可视化浏览器自动化测试/数据采集/爬虫软件,它允许用户通过图形界面无代码地设计和执行数据采集任务。别名:ServiceWrapper,面向Web应用的智能化服务封装系统。
截图
功能
适合任意人群办公:像使用Excel一样可视化的设计和执行爬虫/浏览器自动化测试任务,不论有没有代码经验。
支持配置云服务器:可以配置好云服务器地址用来统一保存任务信息,统一管理。
定义任意复杂的任务:支持无限循环嵌套和判断条件,还可以执行自定义JavaScript指令和系统指令,可将退出循环的Break语句插入流程图任意位置。
特性
- 开源免费无广告:代码开源,软件所有功能均免费(商用除外),且没有任何弹窗和外部广告。
- 跨平台:软件可以在Windows,MacOS和Linux上运行。
- 简单快速:图形化的设置和执行爬虫任务,通常一个爬虫任务只需要2-5分钟即可设计完成。
- 安全:不需要注册,所有任务和数据均保存在本地,不经过任何第三方服务器。
- 灵活:可任意添加浏览器插件,执行JavaScript指令,使用Selenium语句直接操纵浏览器。
- 并行多开:可开启任意数量的执行程序,实现大规模数据的并行采集。
- 动态调试:点击/双击设计完成的操作可自动标记/试运行,方便定位和调试问题,节省修改任务时间。
- 自定义插件:支持外挂自定义插件,实现任意的自定义功能。
- 验证码识别:支持多种验证码识别方案,如图形验证码,reCAPTCHA验证码等。
- 元素截图和OCR识别:支持元素截图和OCR识别,以及图片下载。
- 代理IP:支持切换隧道IP,私有IP等。
- 局域网使用:支持在没有互联网的局域网内使用。
- 外部程序调用:可以任意调用系统外部程序,从而问完成任意复杂的需求。
- API调用:可以通过API调用执行任务,实现高级的自动化采集。
- 定时执行:支持定时执行任务,成为贴心生活小助手。
- 暂停运行:随时暂停任务执行以便手工调试页面和输入验证码。
- Python环境自定义:可任意修改执行时的Python环境,如可自定义变量,并将变量值写入任意代码语句。
- 移动端模拟:支持模拟手机端设备,实现手机网页采集。
- 灵活导入:支持读取Excel文件以导入大批量输入参数。
- 自由导出:可导出为Excel/CSV/TXT文件,支持写入MySQL数据库。
- 任务迁移:任务可任意复制和迁移到其他机器,无视操作系统环境。
- 页面滚动:可以设置页面滚动来获取需要滚动加载的内容。
- IFRAME支持:支持采集在iframe标签内的数据,包括多层嵌套的iframe。
- Cookies修改:可获取和修改页面Cookies值。
- 命令行执行:直接以命令行的方式执行任务,无缝嵌入到其他程序中。
- 无头模式:支持无头模式,可在后台运行,不会弹出浏览器窗口。
- 正则表达式:支持正则表达式,可在任意位置使用正则表达式。
- 修改网页内容:可修改网页内容,实现更加精密的采集需求定制。
- 代码调试:软件包自带执行源码,可用Python直接运行和调试代码。
- JSON支持:支持JSON格式的数据采集。
- 下载文件:支持下载文件,可下载图片、PDF、压缩包等文件。
- 弹窗处理:支持处理浏览器的Alert和Confirm弹窗。
软件下载
主页:https://www.easyspider.net/
项目地址:https://github.com/NaiboWang/EasySpider
声明:本站为个人非盈利博客,资源均网络收集且免费分享无限制,无需登录。资源仅供测试学习,请于24小时内删除,任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集。请支持正版!如若侵犯了您的合法权益,可联系我们处理。