《爬山虎采集器》是一款非常實用的編程開發軟件,它能夠采集互聯網上的大部分網站數據,包括網頁表格數據、文檔、圖片及其他各種形式文件,并自動批量下載到本地電腦,還可以幫助用戶管理往后咱內的所有數據和信息,可以定時運行,自動發布,增量更新采集,完全實現自動化,有需要的用戶們趕緊來下載試試看吧!
功能特色:
1、向導模式
通過可視化界面、鼠標點擊即可采集數據、向導模式、用戶無需任何技術基礎,輸入網址,一鍵提取數據。
2、獨創高速內核
內置一套高速瀏覽器內核,加上HTTP引擎、JSON引擎模式,實現快速采集數據。
3、定時運行
可以按照每分鐘、每天、每周、以及CRON表達式。指定了計劃任務,任務就可以實現自動采集、自動發布,無需人工操作。
4、智能識別
通過智能算法,自動識別分頁,自動識別列表,一鍵采集數據。
5、支持文件下載
可以支持圖片、視頻、文檔等各種文件下載,支持自定義保存路徑、文件名。
6、多種數據導出
支持多格式數據導出,包括TXT、CSV、Excel、ACCESS、MySQL、SQLServer、SQLite及發布到網站接口(Api)。

爬山虎采集器怎么用:
一、如何使用【簡易模式】采集數據
第一步:打開客戶端,選擇簡易模式
選擇相應的采集模板
也可以根據入關鍵詞搜索,篩選對應的模板分類
第二步:預覽模板的采集字段和示例數據
根據提示,輸入對應的參數(此模板是輸入需要采集的關鍵詞)
第三步:運行并下載
開始即可查看加載的進程
任務列表中:選中任務/點擊查看
選擇合適的保存格式
二、如何使用高級過濾,篩選關鍵詞采集數據
第一步:新建任務,進入主頁,選擇“新建任務”輸入需要采集的網址。
第二步:抓取數據
采集器自動識別列表數據 自動識別分頁(需要采集多頁數據)
點擊標題列/右鍵/高級過濾(可以根據需求自定義添加刪除字段,修改名稱等)
必須包含
輸入關鍵詞:教學儀器設備,添加確定即可
可以看到,不包含關鍵詞的名稱已刪除,需要采集多頁:自動識別分頁
選中鏈接/深入此鏈接(需要采集關鍵詞的內容頁)
添加字段/點擊選中全文
第三步:設置 根據需要,自定義設置,可以大大提高加載速度及工作效率。
第四步:加載數據 任務列表中:選中任務/點擊開使
可以看到加載的進程 (點擊數據也可以查看剛加載的數據)
第五步:查看保存數據 任務列表中:選中任務/點擊查看
可以預覽剛加載的數據,并導出數據
特殊情況 :編輯內容,可以預覽全部數據(修改后統一下載 )

軟件功能:
向導模式
簡單易用,輕松通過鼠標點擊自動生成。
腳本定時運行
可按照計劃定時運行,無需人工。
獨創高速內核
自研的瀏覽器內核,速度飛快,遠超對手。
智能識別
對于網頁中的列表、表單結構(多選框下拉列表等)能夠智能識別。
廣告屏蔽
定制的廣告屏蔽模塊,兼容AdblockPlus語法,可添加自定義規則。