小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

得到網(wǎng)頁(yè)的最新更新時(shí)間

 ShangShujie 2010-05-08
zhengyun_ustc博客專(zhuān)家 發(fā)表于2007年3月29日 23:09:10  IP:舉 報(bào)回復(fù)
Incremental Web Search-Tracking Changes in the Web.pdf
這篇論文不知你看過(guò)沒(méi)有?也許有啟發(fā)。
zhengyun_ustc博客專(zhuān)家 發(fā)表于2007年3月29日 23:10:53  IP:舉 報(bào)回復(fù)
其實(shí)獲取http header最簡(jiǎn)單的就是用perl,幾句話就搞定:
use LWP::UserAgent;
my $ua = new LWP::UserAgent;
$ua->timeout(120);
my $url='http://blog.donews.com/banly/';
my $response = $ua->head($url);
if ($response->is_success) {
print $response->as_string."----";
}
zhengyun_ustc博客專(zhuān)家 發(fā)表于2007年3月29日 23:14:11  IP:舉 報(bào)回復(fù)
1:
你只給對(duì)方web服務(wù)器發(fā)送head命令,對(duì)方就不會(huì)給你網(wǎng)頁(yè)所有數(shù)據(jù),而僅僅是http header信息,很短。很多爬蟲(chóng)就是這么做的,不占用太多流量,就可以知道對(duì)方網(wǎng)頁(yè)有否更新。
2:
100%得知對(duì)方更新是不可能的。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶(hù)發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買(mǎi)等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶(hù) 評(píng)論公約

    類(lèi)似文章 更多