小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

百度收錄后快照顯示亂碼的解決方法

 shattermemo 2012-06-26

百度收錄后,快照顯示是亂碼的問題,可能不多見,但筆者卻是遇上了,這個(gè)問題確實(shí)是很麻煩的,先上個(gè)圖,直觀的看一下問題是什么樣子的,請(qǐng)看下圖吧

 

這是筆者2010年11月份接手的一個(gè)網(wǎng)站,ASP+DIV+CSS全站靜態(tài)化,谷歌收錄一切正常,沒想到百度收錄卻是這個(gè)樣子,下面就把怎么解決這個(gè)問題的過程記一下,本來(lái)早想寫的,但是百度之前收錄的,有一兩百頁(yè),一直不更新,快照的緩存就一直是以亂碼顯示,不管怎么天天更新網(wǎng)站內(nèi)容,怎么做外鏈,百度就是不更新,這對(duì)于一個(gè)企業(yè)站,最初收錄的一兩百頁(yè)是亂碼真的很崩潰的,到后來(lái)實(shí)在沒辦法,只能換了個(gè)域名,所以說這個(gè)問題真的很麻煩,可能有朋友問為什么上線時(shí)看到亂碼不解決這個(gè)問題呢?

讓百度收錄了那么多才發(fā)現(xiàn)問題?這是因?yàn)榘俣葘?duì)于一個(gè)新站,一般是收錄了,但不放出來(lái)(就是不顯示出來(lái))查收錄時(shí)只能看到一個(gè)首頁(yè),而且百度天天來(lái)抓取網(wǎng)站,首頁(yè)的快照也是天天更新,大約是15天的時(shí)間,筆者就稱它為考察期吧,過了考察期,百度就會(huì)把這期間抓取的頁(yè)面全放出來(lái),也只有到這時(shí),筆者才發(fā)現(xiàn)收錄了的快照,競(jìng)?cè)蝗莵y碼,而且這往后的幾天,百度就不再收錄別的頁(yè)面,到這時(shí)真的是為時(shí)已晚,這是個(gè)教訓(xùn),希望對(duì)各位站長(zhǎng)有幫助,網(wǎng)站上線之前,一定要測(cè)試下,不要急于上線。

下面講一下解決問題的過程,因?yàn)榫W(wǎng)站上線前,筆者也是做測(cè)試,首先用蜘蛛模擬抓取器抓取測(cè)試,再就是用一個(gè)老域名來(lái)測(cè)試,收錄了幾個(gè)內(nèi)頁(yè)都正常后才上線的,只是測(cè)試時(shí)是在個(gè)人空間上試的,正式上線后,是把網(wǎng)站放在公司服務(wù)器上,所以可以肯定服務(wù)器環(huán)境與網(wǎng)站代碼的兼容性的問題,服務(wù)器還放著其它網(wǎng)站,不過是ASP.net寫的網(wǎng)站,難道服務(wù)器還選擇開發(fā)語(yǔ)言?

問了服務(wù)器供應(yīng)者,得到的答復(fù)是服務(wù)器環(huán)境是支持ASP與ASP.net這兩種語(yǔ)言的,這就可以排除了設(shè)計(jì)語(yǔ)言的問題,接下來(lái)是用放在服務(wù)器上的其它網(wǎng)站的具體頁(yè)面代碼與該網(wǎng)站代碼進(jìn)行對(duì)比,發(fā)現(xiàn)在網(wǎng)站的編碼上有個(gè)小區(qū)別,我們的網(wǎng)站編碼是Unicode,而其它網(wǎng)站都是Unicode(UTF-8),再問服務(wù)器供應(yīng)者,得到的結(jié)果是服務(wù)器環(huán)境默認(rèn)編碼全部是Unicode,再看一下我們的網(wǎng)站CSS默認(rèn)編碼是GB2312,頁(yè)面生成靜態(tài)頁(yè)時(shí)也沒指定編碼類型,所以生成的靜態(tài)頁(yè)面,就成了Unicode。

當(dāng)時(shí)在個(gè)人空間測(cè)試時(shí),個(gè)人空間的默認(rèn)編碼剛好是GB2312,所以就一切正常,而百度對(duì)Unicode編碼是不歡迎的,據(jù)說是因?yàn)閁nicode編碼的網(wǎng)頁(yè)太占資源,大家可以自已試一下,把Unicode編碼的頁(yè)面下載到本地 ,再用DW或者其它工具轉(zhuǎn)換成GB2312或者UTF-8編碼,會(huì)發(fā)現(xiàn) Unicode編碼的網(wǎng)頁(yè)體積比轉(zhuǎn)換后大了將近一倍,但Unicode卻能支持世界各國(guó)語(yǔ)言,所以谷歌支持,因?yàn)樗且粋€(gè)全球化的搜索引擎,這也從一個(gè)側(cè)面說明,百度有些小家子氣,想進(jìn)軍國(guó)外市場(chǎng)看來(lái)還有很長(zhǎng)的路要走,這是題外話了!

發(fā)現(xiàn)了問題就好辦了,只要指定一下生成頁(yè)面的編碼是Unicode(UTF-8)就行了,我們網(wǎng)站是在conn.asp文件中加下面的一段代碼:

Public Function WriteToTextFile(FileName,body)
‘On Error Resume Next
‘If InStr(FileName, “:”) = 0 Then FileName = Server.MapPath(FileName)
Dim oStream
Set oStream = CreateObject(“ADODB.Stream”)
oStream.Type = 2 ‘設(shè)置為可讀可寫
oStream.Mode = 3 ‘設(shè)置內(nèi)容為文本
oStream.Charset = “UTF-8″ ‘此處可控制編碼方式
oStream.Open
oStream.Position = oStream.Size
oStream.WriteText body
oStream.SaveToFile FileName, 2
oStream.Close
Set oStream = Nothing
‘If Err.Number <> 0 Then Err.Clear
End Function

之后,把網(wǎng)站所有頁(yè)面全部重新生成后,就等著百度收錄了,過幾天,百度才又開始收錄新的頁(yè)面,新收錄的頁(yè)面全部正常了,但之前收錄的快照卻一直不更新,等了三個(gè)月都不更新,直到現(xiàn)在也一直是讓它亂碼在那里,沒辦法,兩個(gè)月前只好換了個(gè)域名,新域名收錄一切都正常了。

對(duì)于筆者來(lái)說,這是個(gè)慘痛的教訓(xùn),現(xiàn)在把這個(gè)教訓(xùn)寫出來(lái),希望站長(zhǎng)朋友們不要重蹈筆者這樣的復(fù)轍!

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多