網友評分:
9.7分
后羿采集器是一款專為Mac系統用戶打造的網頁數據采集器,不需要專業知識和培訓,擁有可視化點選特點,任何人都可以快速上手使用,可視化、全免費、極快速是它最大的優點。
采用了最先進的人工智能技術,用戶只需要在頁面上輸入網頁地址就能夠通過智能識別要抽取的數據和分頁,簡直就是最簡單的網頁采集方式。
該軟件全程可視化操作,點選修改要抽取的數據等,簡單的操作方式即使是電腦初學者也能夠輕易使用。
后羿采集器擁有多種采集模式(智能和高級采集,滿足不同采集需求),任何網站都能采,包括XPATH,JSON,HTTP和POST等。
1、【智能采集】智能分析并抽取列表/表格數據,并且能自動識別分頁。 免配置一鍵采集各種網站,包括分頁、滾動加載、登錄采集、AJAX等等。
2、【多種數據導出】一鍵導出采集的所有數據。支持CSV, EXCEL和HTML等,同時也支持導出數據到數據庫。
3、【云端賬號】采集任務自動保存到云端,不用擔心任務丟失。一個賬號多終端操作,可隨時隨地創建和修改采集任務等。
4、【跨平臺支持】后羿采集器支持各種操作系統,包括Windows, Mac和Linux。 不管是個人采集,還是團隊/企業使用,都能滿足您的各種需求。
1、【輸入正確的網址】輸入了正確的網址,這個采集任務就成功了一半。后羿采集器支持單網址和多網址采集,也支持從本地TXT文件中導入網址。
2、【選擇頁面類型及設置分頁】在智能模式下,后羿采集器會默認按照列表類型進行識別,如果您輸入的是單頁類型,此時會出現識別錯誤;或者由于其他原因,即使是列表類型的網頁,智能識別也出現了偏差(我們會一直進行優化智能識別功能)。此時您可以手動選擇頁面類型和設置分頁,從而輔助軟件識別出正確的結果。
3、【預登錄】在數據采集過程中,我們有時候會遇到需要登錄才能查看內容的網頁,這時我們需要用到預登錄功能,登錄成功之后就能進行正常的數據采集。
4、【切換瀏覽器模式】在數據采集過程中,可以使用不同的瀏覽器模式來優化采集效果,具體使用場景需要根據實際情況來判斷。
5、【設置提取字段】智能模式下,軟件會自動識別網頁中的數據并展示到采集結果預覽窗口,用戶可以根據自己的需求對字段進行設置。
6、【采集任務的基礎設置】在啟動采集任務之前,我們需要對采集任務進行設置,包括一些基礎設置和防屏蔽設置。
7、【采集任務的高級設置:定時采集】定時采集功能屬于采集任務的高級設置,該功能可實現在用戶設置的時間周期內,在固定的時間點開啟和停止數據采集任務。如果您設置了定時采集,請保證軟件一直處于工作狀態(不能關機)。
8、【采集任務的高級設置:自動入庫】自動入庫功能屬于采集任務的高級設置,該功能可實現在數據采集的同時,自動發布采集結果到數據庫,而無需等到任務結束才能夠導出數據。自動入庫功能搭配定時采集功能,能夠極大的節約時間,提高工作效率。
9、【采集任務的高級設置:下載圖片】下載圖片屬于采集任務的高級設置,該功能可以實現在采集數據的同時,將網頁上的圖片下載到本地。
10、【查看采集結果及導出數據】如果您未使用自動入庫功能,則需要手動導出采集結果。完成上述設置之后,我們就可以啟動采集任務了。在設置任務的過程中,采集任務會被自動保存,在采集任務結束之后,用戶可以查看采集結果并導出數據。后羿采集器對采集結果導出不做任何限制,無需積分,完全免費,大家可以放心使用。
注冊和登錄:
如果您未收到手機驗證碼?
第一步:請您確認一下填寫的手機號碼是否正確。
第二步:如果號碼填寫正確,請您到攔截短信里查看一下,驗證碼短信有可能在被攔截短信里。
第三步:如果攔截圾短信里沒有找到驗證碼,請您查看一下發送驗證碼的移動號碼是否被拉入手機黑名單,您可以將該號碼加入白名單,然后再在登陸界面點擊“獲取短信驗證碼”。
第四步:如果以上步驟未能解決您的問題,請直接聯系官方客服,我們會在第一時間解決您的問題。
如果您未收到賬號激活郵件?
第一步:請您確認一下填寫的郵箱地址是否正確。
第二步:如果郵箱地址正確,請您查看一下垃圾箱,激活郵件有可能在垃圾箱里。
第三步:如果郵件不在垃圾箱中,請您查看一下是否設置郵件地址黑名單,激活郵件有可能被郵箱攔截,請您將后羿采集器加入白名單,然后再在登陸界面點擊“發送郵件”。
第四步:如果以上步驟未能解決您的問題,請直接聯系官方客服,我們會在第一時間解決您的問題。
如果您未收到賬號激活郵件?
第一步:請您確認一下填寫的郵箱地址是否正確。
第二步:如果郵箱地址正確,請您查看一下垃圾箱,激活郵件有可能在垃圾箱里。
第三步:如果郵件不在垃圾箱中,請您查看一下是否設置郵件地址黑名單,激活郵件有可能被郵箱攔截,請您將后羿采集器加入白名單,然后再在登陸界面點擊“發送郵件”。
第四步:如果以上步驟未能解決您的問題,請直接聯系官方客服,我們會在第一時間解決您的問題。
更新日期:2019-09-02
新增獲取任務總數和任務采集結果數量的API
優化導出到數據庫和網站的設置流程
優化自動切換代理和自動檢測驗證碼
優化自動登錄
[重要]修復自動導出在某些情況下會丟失及無法創建的bug