指定網(wǎng)站滾動采集教程
快捷導(dǎo)讀:
隨著移動互聯(lián)網(wǎng)的到來,滾動加載更容易給予用戶無縫閱覽體驗(yàn),因此容易沉浸其中,替代了傳統(tǒng)意義上的“下一頁”數(shù)據(jù)加載,下面就給大家介紹一下滾動采集的配置方法。
我們軟件針對不同的網(wǎng)站展現(xiàn)類型,都有對應(yīng)的采集方式,傳統(tǒng)的“下一頁”我們選擇列表類型,這次的目標(biāo)站是滾動加載數(shù)據(jù)所以我們選擇【滾動頁面類型】。
我們只需要在分頁設(shè)置里填入我們需要采集的鏈接,軟件將自動向下滾動加載出更多的新數(shù)據(jù)便于我們采集。
根據(jù)自身的需求去點(diǎn)選我們需要采集的字段,也可以隨時(shí)對這些字段進(jìn)行修改、刪除!
當(dāng)我們點(diǎn)擊列表頁標(biāo)題后,軟件會自動識別該網(wǎng)頁下的所有標(biāo)題,我們只需要點(diǎn)擊預(yù)覽并設(shè)置內(nèi)容進(jìn)入下一個界面采集需要的數(shù)據(jù)(注:未識別網(wǎng)頁下的所有標(biāo)題,我們可用CSS選中器來識別網(wǎng)頁下的所有列表標(biāo)題)
參考資料【CSS選擇器寫法案例教程】
只需要點(diǎn)選我們設(shè)置的字段即可,點(diǎn)擊【已選標(biāo)簽】可再次點(diǎn)選對應(yīng)的數(shù)據(jù)。點(diǎn)選內(nèi)容時(shí)我們需觀察觀察內(nèi)容是否全部包含,未全部包含時(shí)盡量點(diǎn)擊空白處讓所有的段落包含其中(注:部分網(wǎng)頁不規(guī)范導(dǎo)致點(diǎn)選內(nèi)容不全面或標(biāo)題內(nèi)容連在一起,我們可用CSS選擇器精準(zhǔn)識別網(wǎng)頁中的標(biāo)題和內(nèi)容)
參考資料【CSS選擇器寫法案例教程】
保存好后我們將會進(jìn)入批量采集管理任務(wù)界面,找到配置好的任務(wù)點(diǎn)擊開始采集,我們也可以實(shí)時(shí)預(yù)覽采集的內(nèi)容。