如何使用火車(chē)頭進(jìn)行大量采集




火車(chē)頭是一款可以大量采集原創(chuàng)文章的軟件。
火車(chē)頭采集器有哪些好處?
1、通用性強(qiáng)
無(wú)論新聞、論壇、視頻、黃頁(yè)、圖片、下載類(lèi)網(wǎng)站,只要通過(guò)瀏覽器能看到的結(jié)構(gòu)化的內(nèi)容,通過(guò)指定匹配規(guī)則,都能采集到您所需要的內(nèi)容。
2、穩(wěn)定、高效
七年磨一劍,軟件不斷更新進(jìn)步,采集速度快,性能穩(wěn)定,占用資源少。
3、擴(kuò)展性強(qiáng)、適用范圍廣
自定義web發(fā)布,自定義主流的數(shù)據(jù)庫(kù)的保存和發(fā)布,自定義本地php及.net外部編程接口處理數(shù)據(jù),讓數(shù)據(jù)都能為你所用。
火車(chē)頭采集器怎么用?
1、首先打開(kāi)火車(chē)頭軟件,打開(kāi)之后在左邊空白處右鍵新建分組,在箭頭處隨便填寫(xiě)一個(gè)分組名稱,保存。如圖所示:
2、右鍵你剛才創(chuàng)建的分組,點(diǎn)擊新建任務(wù),會(huì)彈出一個(gè)窗口如下:任務(wù)名稱可以填寫(xiě)你網(wǎng)站的名稱,方便以后采集,站點(diǎn)多了好區(qū)分。自動(dòng)識(shí)別不用改,然后第一步點(diǎn)擊右邊的添加,把你要采集的網(wǎng)站網(wǎng)址添加進(jìn)去完成即可。下邊還一個(gè)添加是添加你要采集的規(guī)則,從哪個(gè)地方采集到哪個(gè)地方。比如:<ul>
<li>火車(chē)頭采集器</li>
<li>火車(chē)頭采集器</li>
<li>火車(chē)頭采集器</li>
<li>火車(chē)頭采集器</li>
<li>火車(chē)頭采集器</li>
</ul>
采集規(guī)則就這么填寫(xiě) 第一個(gè)框填寫(xiě)<ul>,第二個(gè)框就填寫(xiě)</ul>,明白了吧。
3、填寫(xiě)好之后點(diǎn)擊下邊的測(cè)試網(wǎng)址采集。就到了如下圖:點(diǎn)開(kāi)加號(hào)出現(xiàn)你要采集的文章。
4、隨便雙擊一個(gè)網(wǎng)址進(jìn)入第二步,如圖所示:左邊有標(biāo)題和內(nèi)容兩個(gè)板塊,需要你設(shè)置一下,就是你要采集的標(biāo)題和內(nèi)容,內(nèi)容的話,你可以點(diǎn)擊一篇文章查看源文件進(jìn)去看看文章的起始代碼位置,去截取這段代碼,放到里邊,跟第一步的設(shè)置規(guī)則類(lèi)似,這里就不詳細(xì)說(shuō)明了。設(shè)置好之后就可以點(diǎn)擊測(cè)試一下效果了。
5、弄好之后來(lái)到第三步,如圖所示:選中啟用這個(gè)框
6、點(diǎn)擊web發(fā)布配置管理進(jìn)入下一個(gè)窗口,選擇你要發(fā)布的模塊,選擇編碼,然后把你的網(wǎng)站后臺(tái)登錄地址寫(xiě)進(jìn)去,然后點(diǎn)擊在內(nèi)置瀏覽器登錄會(huì)出現(xiàn)一個(gè)小窗口,登錄后臺(tái)賬號(hào)密碼登錄成功后點(diǎn)擊確定回到當(dāng)天窗口,點(diǎn)擊獲取列表,會(huì)出現(xiàn)你網(wǎng)站的欄目。配置名寫(xiě)上你的網(wǎng)站名稱即可,點(diǎn)擊保存。關(guān)閉本窗口。
7、到這里火車(chē)頭采集器的規(guī)則就設(shè)置好了 接下來(lái)就要采集發(fā)布了。選中三個(gè)復(fù)選框,點(diǎn)擊發(fā)布軟件就可以開(kāi)始運(yùn)行了,采集發(fā)布成功后,進(jìn)你的網(wǎng)站后臺(tái)就可以看到你采集到的文章了。