八爪鱼采集器是一个技术领先的网页采集软件,这款软件使用先进的分布式云计算平台,为用户在很短的时间内,轻松从不同网站、页面获取大量内容,使用简单,方便快捷。
八爪鱼采集器采用自主研发的分布式云计算,以最快的方法,从任何网页提取数据,帮助用户实现数据自动采集,自动修改、规范化,减轻操作人员的工作压力,减少人工,节省成本。
【功能介绍】
简单来讲,使用八爪鱼可以非常容易的从任何网页精确采集你需要的数据,生成自定义的、规整的数据格式。八爪鱼数据采集系统能做的包括但并不局限于以下内容:
1、金融数据,如季报,年报,财务报告, 包括每日最新净值自动采集;
2、各大新闻门户网站实时监控,自动更新及上传最新发布的新闻;
3、监控竞争对手最新信息,包括商品价格及库存;
4、监控各大社交网站,博客,自动抓取企业产品的相关评论;
5、收集最新最全的职场招聘信息;
6、监控各大地产相关网站,采集新房二手房最新行情;
7、采集各大汽车网站具体的新车二手车信息;
8、发现和收集潜在客户信息;
9、采集行业网站的产品目录及产品信息;
10、在各大电商平台之间同步商品信息,做到在一个平台发布,其他平台自动更新。
【使用说明】
八爪鱼如何使用规则
使用从规则市场下载的规则
一般从规则市场下载的规则是otd为后缀的规则文件,4.*以后的版本中会自动导入下载的规则文件。以前的版本中需要手动导入下载的规则文件。 手动导入方式:八爪鱼规则文件(。OTD)直接双击即可打开导入向导,或者打开八爪鱼采集器, 快速开始 -> 导入规则,然后按照向导提示导入规则。 但有时候会下载到。zip为后缀的压缩文件,压缩文件解压后包含多个。otd规则文件,需要先解压,然后导入。
如何下载采集规则
为了避免配置采集规则的重复工作,八爪鱼采集器内置了规则市场,由用户分享配置好的采集规则,互帮互助。 使用规则市场下载规则的好处显而易见,可以不用花费时间研究和配置采集流程。很多网站的采集规则都可以在规则市场中搜索到,下载运行即可采集。 下载规则需要使用八爪鱼采集器,具体操作步骤:打开八爪鱼采集器->采集规则->规则市场。
【常见问题】
八爪鱼采集器能采集匿名账户信息吗?
如果你没有权限查看匿名的数据就不可以,八爪鱼可以代替人工更加自动和智能的收集数据,但不会协助你收集你没有权限浏览的数据,比如别人的密码等隐私数据。
问题八爪鱼采集器能采集别人的后台数据吗?
不能采集,后台数据需要有后台访问权限,正规的采集软件不会提供此类侵权服务。但您可以采集自己的后台数据。
问题八爪鱼能采集QQ号码、邮箱、电话号码之类的吗?
能采集,任何你在网页上能看见的数据都可以采集,八爪鱼采集器内置的规则市场中也有很多此类规则可下载,无需配置,运行规则就可以提取到这些数据。
【更新日志】
主要体验改进
【云采集】新增云采集实况功能,展现任务的云端运行情况,如任务的拆分,分配节点,采集数据等过程
【云采集】新增云采集通知功能,可针对每个任务设置采集完成 、采集停止时进行邮件通知程
【云采集】新增单个子任务重启功能,对采集量较少或状态是已停止的子任务进行重启,可减少数据遗漏
Bug修复
修复「重试次数设置不生效」问题
修复「循环URL异常」问题
修复「最后一个字段,修改字段名保存无效」问题
提升性能,修复若干卡顿问题