指定網(wǎng)站采集教程
一、批量分頁數(shù)網(wǎng)址獲取如下圖
列表是最常見的網(wǎng)頁樣式,我們可以通過以下2種方式:
(1) 直接輸入列表頁詳細如下圖
(2)通過我們軟件生成列表頁詳細如下圖
以下是舉例說明:
目標站列表頁: http://zb.bbqseo.com/?cate=2&page=2
點擊下一頁時網(wǎng)址變化為: http://zb.bbqseo.com/?cate=2&page=3
例:http://zb.bbqseo.com/?cate=2&page=[[分頁數(shù)]] 目標站有多少列表頁就生成多少頁
由此可以分析得出,page=2中的數(shù)字就是分頁碼,且是每次加1遞增。(變化的部分的數(shù)字我們用“[[分頁數(shù)]]”代替)根據(jù)目標站具體列表頁數(shù)生成,需這些網(wǎng)址間有著某種關系,比如等差遞增的變化。
二、點選需要采集的字段配置如下圖
三、列表頁標題獲取如下圖
四、點選需要采集的內(nèi)容字段如下圖
注:點擊空白處,觀察內(nèi)容是否全部包含。(部分網(wǎng)站不規(guī)范導致點選內(nèi)容不全面或標題內(nèi)容連在一起,可寫CSS精準選中)
補充:CSS選擇器寫法案例教程
五、采集成功如下圖
相關文章:CSS選擇器案例,指定網(wǎng)站登錄采集