首页 > 软件 > 内容
网络神采
更新:2023-04-11 00:18:59
语言:简体
类别:网页辅助
授权:免费软件
立即下载(12.2M)
精品推荐
网络神采是一款轻量级的采集软件,用于快速采集、下载网页数据。软件速度快、好用、免费。网络神采破解版支持智能采集、可视化采集,支持二次开发、分布式部署。如果您正需要进行网页采集,使用这款网络神采即可。

网络神采

基本简介

  《网络神采》是一款轻量级的采集软件,用于快速采集、下载网页数据。软件速度快、好用、免费。支持智能采集(不用配规则)、可视化采集(不用看源文件),支持二次开发、分布式部署。为用户的大数据分析、信息化平台,提供稳定、持续、准确的数据资源。

功能介绍

  1、采集强度

  支持JS解析、POST分页、登录采集、跨层采集。对于疑难采集页面,有成熟的解决方案。

  2、速度快

  支持多任务同时运行,每个任务又可以设置多线程,确保运行效率。

  3、规模化

  支持任务多级分类、批量管理。支持云服务器分布式部署,管理员团队协合。

  4、流程化

  支持定时采集,任务定时自动启动。通过二次开发,实现流程化的信息采集、信息处理。

  5、运行稳定

  系统运行稳定,要求“0 bug”。目标网页改版后,自动通知管理员。

  6、准确性

  定制好任务后,采集准确率可达100%,即一条不漏。

更新日志

  2019-08-13 V6.3.15

  可视化采集配置,放大、缩小范围时:

  1、提取下一网址:默认为连续 * 号,按Ctrl键为单个 * 号

  2、循环采集:按Shift键,支持连续 * 号

  3、多个 * 号时,加亮显示

  可视化采集配置,操作细节:

  1、显示完整XPath:选中后,不再取消当前元素,而是直接切换

  2、废除选项:复制XPath时覆盖现有,改为:复制XPath时,按Shift键可覆盖现有内容

  3、Gecko内核:换回 xulrunner_60.0.26,低版本 xulrunner_45.0.34 仍会出现 COM 断开,体验太差

  修复bug:

  1、循环采集:整条数据或“关键规则”采集失败后,URL被回收多次

  2、切换动态层:从当前层切换到动态层时,如果动态层使用了“模拟点击”,而当前层未使用,会导致“提取下一层XPath时出错: 未将对象引用设置到对象的实例”。

显示全部
猜你喜欢
相关下载

玩家评论