| 核桃的QQ群中,大家交流了一下做采集站SEO的要點,現(xiàn)總結(jié)一下相關(guān)問題及討論結(jié)果: 
采集的內(nèi)容是否會收錄?如果是采集內(nèi)容的站,就會有不收錄的可能
哪種情況會導(dǎo)致站點不被收錄?太多相同內(nèi)容;
 一采就是成千上萬條內(nèi)容
采集的一些要點?一次采集不要太多,分批分段進(jìn)行;
 不要全部采集一個站的內(nèi)容:目的就是不要有太多相同的東西,最好每個欄目采不同的站。
如何選擇采集源?用80%的時間去找采集源,而用20%的時間做采集;
 比如你要采一個欄目,肯定你會看好幾個站,那么你要確定這幾個站里面哪一個質(zhì)量更好?;蛘叨疾惶?,就找一篇文章,在文章中拷貝一句話,在百度或者谷歌進(jìn)行搜索。只要是有這篇文章的網(wǎng)站,被收錄頁面的,都會被列出來。這時候肯定有一大堆標(biāo)題相同的頁面,還有一部分是編輯手工調(diào)整過標(biāo)題的,選擇后者做采集源。如果你采集那些標(biāo)題相同最少的站,可以確定跟你相同的肯定就少了,就兩三條信息,這是很正常的,搜索引擎目前不會太在意。
怎么處理采集回來的內(nèi)容?如果你有時間,適當(dāng)顛倒文章段落、適當(dāng)刪減某些無關(guān)緊要或羅嗦內(nèi)容、適當(dāng)增加一些沒有涉及到的相關(guān)內(nèi)容,都是有利的。或者至少把總量10%的內(nèi)容標(biāo)題進(jìn)行修改。如果沒有時間來組織這些標(biāo)題,可以直接選一句文章里的內(nèi)容來用。而description描述可以自己來寫,或者也取內(nèi)容的一段話進(jìn)來頂替(不要超過155個字符)
 然后,就是要在頁面里加一些干擾因素,比如在模板里可以寫上一些版權(quán)聲明(自己組織語言),2-30個字就行了,這個位置的版權(quán)聲明可以出現(xiàn)一些你想推的關(guān)鍵詞,比如出現(xiàn)首頁的關(guān)鍵詞,你就給它鏈接到首頁去。這也是一種內(nèi)部鏈接優(yōu)化。
內(nèi)部鏈接出現(xiàn)的次數(shù)如何把握?采集的內(nèi)容本身權(quán)重就不會太高,當(dāng)然是放得越少越好
 一篇文章建議放5個以內(nèi)的站內(nèi)鏈接,外部鏈接不要超過三個,否則權(quán)重基本沒什么了
采集與原創(chuàng)的比例控制在多少?適當(dāng)編寫一些原創(chuàng)內(nèi)容還是很有必要的。有說法是,采集與原創(chuàng)內(nèi)容比例最好控制在20:1以下。
 比例越大對網(wǎng)站權(quán)重積累越不利。
題外話:我的網(wǎng)站被采集了怎么辦?只要掌握足夠的證據(jù),就可以提交到搜索引擎進(jìn)行人工審核。7天左右,對方站點就會根據(jù)采集的量受到不同程度的處罰。
 最后談一下數(shù)據(jù)采集的弊端:搜索引擎總是希望為用戶提供更多,質(zhì)量更好的內(nèi)容。簡單說,這家伙就是喜新厭舊。如果某個網(wǎng)站被搜索引擎視為沒有原創(chuàng)內(nèi)容的網(wǎng)站,那這個網(wǎng)站基本上就等于判刑了。進(jìn)沙盒容易,再想出來很難。
 相關(guān)日志: |