ygbook自動采集發(fā)布無需編寫規(guī)則代碼
ygbook采集規(guī)則,ygbook采集規(guī)則難嗎?做過小說站的人應(yīng)該都知道,編寫采集規(guī)則都是需要一定的編程能力以及html代碼能力的。寫好的部分采集規(guī)則也會失效的,今天給大家分享一款免費(fèi)自動采集更新工具:全自動采集自動更新,只要初期設(shè)置好seo模板、輸入目標(biāo)站以及目標(biāo)模板等,后續(xù)什么都不用管,完全解放了你的個人時間的同時,又讓你有一個潛力無窮的小說站.
由于 YGbook采集規(guī)則奇缺的問題。這里使用軟件采集了26條的YGBook采集規(guī)則供分享給大家,大家可根據(jù)各自的情況篩選出5-6條權(quán)重高、更新快、質(zhì)量好的采集源,ygbook采集即可保證每天能自動采集、更新200-500+的小說。
YGBOOK基于ThinkPHP+MYSQL開發(fā),可以在大部分常見的服務(wù)器上運(yùn)行。
環(huán)境要求:PHP5.4以上,有偽靜態(tài)功能。推薦配置php7.2mysql5.6+
主機(jī)要求:IIS/APACHE/NGINX均可,虛擬主機(jī)/VPS/服務(wù)器/云服務(wù)器均可。
YGBOOK優(yōu)點(diǎn):
1.不保存任何數(shù)據(jù),小說以類似軟鏈接的形式存在。沒有版權(quán)紛爭。
2.因為是軟鏈接,所以對硬盤空間需求極小,成本低。
3.后臺預(yù)置廣告位, 添加廣告代碼極其簡單,想賺煙錢的老哥可以看一下。
4.可以掛機(jī)自動采集,簡單省事。
YGBOOK基于ThinkPHP+MYSQL開發(fā),可以在大部分常見的服務(wù)器上運(yùn)行。
環(huán)境要求:PHP5.4以上,有偽靜態(tài)功能。推薦配置php7.2mysql5.6+
主機(jī)要求:IIS/APACHE/NGINX均可,虛擬主機(jī)/VPS/服務(wù)器/云服務(wù)器均可。推薦使用linux系統(tǒng),apache inx均可
硬件要求:CPU/內(nèi)存/硬盤/寬帶大小無要求,但配置越高,采集效率會更好!
其他要求:如采集目標(biāo)站服務(wù)器在國內(nèi),而你的主機(jī)在國外,會產(chǎn)生采集效率低的問題。應(yīng)盡量選擇同區(qū)域的網(wǎng)站進(jìn)行采集,美國服務(wù)器宜選擇機(jī)房設(shè)在美國的小說站,國內(nèi)服務(wù)器則選擇國內(nèi)站點(diǎn),以盡可能提升網(wǎng)站速度。
ygbook采集[cate]對應(yīng)情況取源站頂部分類要中文的,比如玄幻小說 修真小說到最后恐怖小說依次對應(yīng)本站,如果分類出入太大的,可自行在后臺建分類再對應(yīng),最大頁碼為1.
規(guī)則列表頁碼這個很好理解,比如1|1|200的意思就是從第一頁開始到200頁,每次增加1頁。
ygbook采集無縮略圖標(biāo)志一般為nocover,如果不是你看下源站是什么自行改即可。
列表頁:鏈接CSS選擇器和列表頁:標(biāo)題CSS選擇器
這個怎么選,我們打開首頁看到最近更新列表,選取大區(qū)域:#newscontent 再去一個區(qū)域 .l 區(qū)別于下方最新入庫的的.r ,最后我們再去我們真正要去的區(qū)域.s2 a結(jié)束,組合就是#newscontent .l .s2 a,很多人喜歡這個樣子寫,ygbook采集就跟提示差不多 #newscontent li a 有些站是可以的,但是要分清楚。
文章頁的各個選項,如果是有360結(jié)構(gòu)化的站那么以下是通用的
標(biāo)題CSS選擇器 :meta[property=og:novel:book_name]|content
作者CSS選擇器 meta[property=og:novel:author]|content
縮略圖CSS選擇器 meta[property=og:image]|content
內(nèi)容CSS選擇器一般為#intro
因為源站簡介源碼一般為,如果不是 自行修改intro即可,ygbook采集完結(jié)標(biāo)志不用多說了。
章節(jié)目錄頁:區(qū)域CSS選擇器一般為:#list
自行查看源碼就知道了
章節(jié)目錄頁:采集規(guī)則也看源碼如biquge.com為,那么寫成即可。
如果有這樣子的: 你寫成,把不要的用[string]代替掉即可。
最后章節(jié)內(nèi)容頁:內(nèi)容CSS選擇器一般為#content 為什么上面也提到過 ygbook采集自行查看源碼就明白了。
通用替換 {filter replace='hostloc'}筆趣閣{/filter} 如果不替換只刪除的話刪除hostloc即可。
多欄目以:為例 這就不用解釋那么多了,累。。。
規(guī)則列表頁面為: [cate]/.html[cate]
ygbook采集對應(yīng)情況以網(wǎng)址為準(zhǔn)如:sort1 sort2 sort3 對應(yīng)玄幻 修真 都市 頁碼自己填
列表頁:鏈接CSS選擇器列表頁:標(biāo)題CSS選擇器為#newscontent .l .s2 a
ygbook采集此站沒有360結(jié)構(gòu)化 所以文章頁:標(biāo)題CSS選擇器為 h1 一般都是這個
文章頁:作者CSS選擇器為.infotitle i 并在文章頁:源碼預(yù)過濾規(guī)則填入{filter replace=''}作者:{/filter},多欄目無需寫分類。
ygbook采集文章頁:內(nèi)容CSS選擇器為 .intro 這有個問題我沒解決 .introygbook采集雖然可獲取 但是獲取的值太多 后面的東西是不想要的 提示也說了可用|分割過濾 但沒搞懂。
文章頁:縮略圖CSS選擇器為#fmimg img|src fmimg為值 img|src為圖片