|
百度收錄后,快照顯示是亂碼的問題,可能不多見,但筆者卻是遇上了,這個(gè)問題確實(shí)是很麻煩的,先上個(gè)圖,直觀的看一下問題是什么樣子的,請(qǐng)看下圖吧
這是筆者2010年11月份接手的一個(gè)網(wǎng)站,ASP+DIV+CSS全站靜態(tài)化,谷歌收錄一切正常,沒想到百度收錄卻是這個(gè)樣子,下面就把怎么解決這個(gè)問題的過程記一下,本來(lái)早想寫的,但是百度之前收錄的,有一兩百頁(yè),一直不更新,快照的緩存就一直是以亂碼顯示,不管怎么天天更新網(wǎng)站內(nèi)容,怎么做外鏈,百度就是不更新,這對(duì)于一個(gè)企業(yè)站,最初收錄的一兩百頁(yè)是亂碼真的很崩潰的,到后來(lái)實(shí)在沒辦法,只能換了個(gè)域名,所以說這個(gè)問題真的很麻煩,可能有朋友問為什么上線時(shí)看到亂碼不解決這個(gè)問題呢? 讓百度收錄了那么多才發(fā)現(xiàn)問題?這是因?yàn)榘俣葘?duì)于一個(gè)新站,一般是收錄了,但不放出來(lái)(就是不顯示出來(lái))查收錄時(shí)只能看到一個(gè)首頁(yè),而且百度天天來(lái)抓取網(wǎng)站,首頁(yè)的快照也是天天更新,大約是15天的時(shí)間,筆者就稱它為考察期吧,過了考察期,百度就會(huì)把這期間抓取的頁(yè)面全放出來(lái),也只有到這時(shí),筆者才發(fā)現(xiàn)收錄了的快照,競(jìng)?cè)蝗莵y碼,而且這往后的幾天,百度就不再收錄別的頁(yè)面,到這時(shí)真的是為時(shí)已晚,這是個(gè)教訓(xùn),希望對(duì)各位站長(zhǎng)有幫助,網(wǎng)站上線之前,一定要測(cè)試下,不要急于上線。 下面講一下解決問題的過程,因?yàn)榫W(wǎng)站上線前,筆者也是做測(cè)試,首先用蜘蛛模擬抓取器抓取測(cè)試,再就是用一個(gè)老域名來(lái)測(cè)試,收錄了幾個(gè)內(nèi)頁(yè)都正常后才上線的,只是測(cè)試時(shí)是在個(gè)人空間上試的,正式上線后,是把網(wǎng)站放在公司服務(wù)器上,所以可以肯定服務(wù)器環(huán)境與網(wǎng)站代碼的兼容性的問題,服務(wù)器還放著其它網(wǎng)站,不過是ASP.net寫的網(wǎng)站,難道服務(wù)器還選擇開發(fā)語(yǔ)言? 問了服務(wù)器供應(yīng)者,得到的答復(fù)是服務(wù)器環(huán)境是支持ASP與ASP.net這兩種語(yǔ)言的,這就可以排除了設(shè)計(jì)語(yǔ)言的問題,接下來(lái)是用放在服務(wù)器上的其它網(wǎng)站的具體頁(yè)面代碼與該網(wǎng)站代碼進(jìn)行對(duì)比,發(fā)現(xiàn)在網(wǎng)站的編碼上有個(gè)小區(qū)別,我們的網(wǎng)站編碼是Unicode,而其它網(wǎng)站都是Unicode(UTF-8),再問服務(wù)器供應(yīng)者,得到的結(jié)果是服務(wù)器環(huán)境默認(rèn)編碼全部是Unicode,再看一下我們的網(wǎng)站CSS默認(rèn)編碼是GB2312,頁(yè)面生成靜態(tài)頁(yè)時(shí)也沒指定編碼類型,所以生成的靜態(tài)頁(yè)面,就成了Unicode。 當(dāng)時(shí)在個(gè)人空間測(cè)試時(shí),個(gè)人空間的默認(rèn)編碼剛好是GB2312,所以就一切正常,而百度對(duì)Unicode編碼是不歡迎的,據(jù)說是因?yàn)閁nicode編碼的網(wǎng)頁(yè)太占資源,大家可以自已試一下,把Unicode編碼的頁(yè)面下載到本地 ,再用DW或者其它工具轉(zhuǎn)換成GB2312或者UTF-8編碼,會(huì)發(fā)現(xiàn) Unicode編碼的網(wǎng)頁(yè)體積比轉(zhuǎn)換后大了將近一倍,但Unicode卻能支持世界各國(guó)語(yǔ)言,所以谷歌支持,因?yàn)樗且粋€(gè)全球化的搜索引擎,這也從一個(gè)側(cè)面說明,百度有些小家子氣,想進(jìn)軍國(guó)外市場(chǎng)看來(lái)還有很長(zhǎng)的路要走,這是題外話了! 發(fā)現(xiàn)了問題就好辦了,只要指定一下生成頁(yè)面的編碼是Unicode(UTF-8)就行了,我們網(wǎng)站是在conn.asp文件中加下面的一段代碼:
之后,把網(wǎng)站所有頁(yè)面全部重新生成后,就等著百度收錄了,過幾天,百度才又開始收錄新的頁(yè)面,新收錄的頁(yè)面全部正常了,但之前收錄的快照卻一直不更新,等了三個(gè)月都不更新,直到現(xiàn)在也一直是讓它亂碼在那里,沒辦法,兩個(gè)月前只好換了個(gè)域名,新域名收錄一切都正常了。 對(duì)于筆者來(lái)說,這是個(gè)慘痛的教訓(xùn),現(xiàn)在把這個(gè)教訓(xùn)寫出來(lái),希望站長(zhǎng)朋友們不要重蹈筆者這樣的復(fù)轍! |
|
|