后羿采集器
是一款专为Mac系统用户打造的网页数据采集器,不需要专业知识和培训,拥有可视化点选特点,任何人都可以快速上手使用,可视化、全免费、极快速是它最大的优点。
采用了最先进的人工智能技术,用户只需要在页面上输入网页地址就能够通过智能识别要抽取的数据和分页,简直就是最简单的网页采集方式。
该软件全程可视化操作,点选修改要抽取的数据等,简单的操作方式即使是电脑初学者也能够轻易使用。
后羿采集器拥有多种采集模式(智能和高级采集,满足不同采集需求),任何网站都能采,包括XPATH,JSON,HTTP和POST等。
【软件特色】
1、【智能采集】智能分析并抽取列表/表格数据,并且能自动识别分页。 免配置一键采集各种网站,包括分页、滚动加载、登录采集、AJAX等等。
2、【多种数据导出】一键导出采集的所有数据。支持CSV, EXCEL和HTML等,同时也支持导出数据到数据库。
3、【云端账号】采集任务自动保存到云端,不用担心任务丢失。一个账号多终端操作,可随时随地创建和修改采集任务等。
4、【跨平台支持】后羿采集器支持各种操作系统,包括Windows, Mac和Linux。 不管是个人采集,还是团队/企业使用,都能满足您的各种需求。
【操作方式】
1、【输入正确的网址】输入了正确的网址,这个采集任务就成功了一半。后羿采集器支持单网址和多网址采集,也支持从本地TXT文件中导入网址。
2、【选择页面类型及设置分页】在智能模式下,后羿采集器会默认按照列表类型进行识别,如果您输入的是单页类型,此时会出现识别错误;或者由于其他原因,即使是列表类型的网页,智能识别也出现了偏差(我们会一直进行优化智能识别功能)。此时您可以手动选择页面类型和设置分页,从而辅助软件识别出正确的结果。
3、【预登录】在数据采集过程中,我们有时候会遇到需要登录才能查看内容的网页,这时我们需要用到预登录功能,登录成功之后就能进行正常的数据采集。
4、【切换浏览器模式】在数据采集过程中,可以使用不同的浏览器模式来优化采集效果,具体使用场景需要根据实际情况来判断。
5、【设置提取字段】智能模式下,软件会自动识别网页中的数据并展示到采集结果预览窗口,用户可以根据自己的需求对字段进行设置。
6、【采集任务的基础设置】在启动采集任务之前,我们需要对采集任务进行设置,包括一些基础设置和防屏蔽设置。
7、【采集任务的高级设置:定时采集】定时采集功能属于采集任务的高级设置,该功能可实现在用户设置的时间周期内,在固定的时间点开启和停止数据采集任务。如果您设置了定时采集,请保证软件一直处于工作状态(不能关机)。
8、【采集任务的高级设置:自动入库】自动入库功能属于采集任务的高级设置,该功能可实现在数据采集的同时,自动发布采集结果到数据库,而无需等到任务结束才能够导出数据。自动入库功能搭配定时采集功能,能够极大的节约时间,提高工作效率。
9、【采集任务的高级设置:下载图片】下载图片属于采集任务的高级设置,该功能可以实现在采集数据的同时,将网页上的图片下载到本地。
10、【查看采集结果及导出数据】如果您未使用自动入库功能,则需要手动导出采集结果。完成上述设置之后,我们就可以启动采集任务了。在设置任务的过程中,采集任务会被自动保存,在采集任务结束之后,用户可以查看采集结果并导出数据。后羿采集器对采集结果导出不做任何限制,无需积分,完全免费,大家可以放心使用。
【常见问题】
注册和登录:
如果您未收到手机验证码?
第一步:请您确认一下填写的手机号码是否正确。
第二步:如果号码填写正确,请您到拦截短信里查看一下,验证码短信有可能在被拦截短信里。
第三步:如果拦截圾短信里没有找到验证码,请您查看一下发送验证码的移动号码是否被拉入手机黑名单,您可以将该号码加入白名单,然后再在登陆界面点击“获取短信验证码”。
第四步:如果以上步骤未能解决您的问题,请直接联系官方客服,我们会在第一时间解决您的问题。
如果您未收到账号激活邮件?
第一步:请您确认一下填写的邮箱地址是否正确。
第二步:如果邮箱地址正确,请您查看一下垃圾箱,激活邮件有可能在垃圾箱里。
第三步:如果邮件不在垃圾箱中,请您查看一下是否设置邮件地址黑名单,激活邮件有可能被邮箱拦截,请您将后羿采集器加入白名单,然后再在登陆界面点击“发送邮件”。
第四步:如果以上步骤未能解决您的问题,请直接联系官方客服,我们会在第一时间解决您的问题。
如果您未收到账号激活邮件?
第一步:请您确认一下填写的邮箱地址是否正确。
第二步:如果邮箱地址正确,请您查看一下垃圾箱,激活邮件有可能在垃圾箱里。
第三步:如果邮件不在垃圾箱中,请您查看一下是否设置邮件地址黑名单,激活邮件有可能被邮箱拦截,请您将后羿采集器加入白名单,然后再在登陆界面点击“发送邮件”。
第四步:如果以上步骤未能解决您的问题,请直接联系官方客服,我们会在第一时间解决您的问题。
【更新说明】
更新日期:2019-09-02
新增获取任务总数和任务采集结果数量的API
优化导出到数据库和网站的设置流程
优化自动切换代理和自动检测验证码
优化自动登录
[重要]修复自动导出在某些情况下会丢失及无法创建的bug