小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

Python抓取網(wǎng)頁圖片相關(guān)代碼編寫方法

 dinghj 2013-11-20

利用Python編程語言進(jìn)行網(wǎng)頁內(nèi)容的抓取是一個比較常用的編程技術(shù)。那么,今天我們將會為大家詳細(xì)介紹一下有關(guān)Python抓取網(wǎng)頁圖片的操作方法,以方便大家在實際應(yīng)用中獲得一些幫助。

Python抓取網(wǎng)頁圖片代碼示例:

  1. ImgDownloader  
  2. import win32com.client,time,win32inet,win32file,os  
  3. class ImgDownloader:  
  4. def __init__(self,url,dir):  
  5. self.__dir=dir  
  6. self.__ie=win32com.client.Dispatch('InternetExplorer.Application')  
  7. self.__ie.Navigate(url)  
  8. self.__wait__()  
  9. def __wait__(self):  
  10. while self.__ie.Busy:  
  11. time.sleep(0.1)  
  12. def start(self):  
  13. self.__wait__()  
  14. imgs=self.__ie.Document.getElementsByTagName('img')  
  15. for i in range(imgs.length):  
  16. try:  
  17. cachInfo=win32inet.GetUrlCacheEntryInfo(imgs[i].src)  
  18. if cachInfo:  
  19. path=cachInfo['LocalFileName']  
  20. pathpathinfo=path.split('\\')  
  21. pathinfo.reverse()  
  22. filename=('[%d]' % i) + pathinfo[0]  
  23. win32file.CopyFile(path,os.path.join(self.__dir,filename),True)  
  24. except:  
  25. pass  
  26. def close(self):  
  27. self.__ie.Quit()  
  28. if __name__=='__main__':  
  29. d=ImgDownloader('http://image.baidu.com/i?ct=201326592&cl=2&
    lm=-1&tn=baiduimage&pv=&word=boy&z=0','c:\\temp\\')  
  30. d.start()  
  31. d.close() 

原理:在Python使用com 接口運行IE瀏覽器,然后打開網(wǎng)頁,獲取網(wǎng)頁所有圖片的URL,最后利用win32api函數(shù)GetUrlCacheEntryInfo找出圖片相應(yīng)的本地緩存文件,復(fù)制到指定目錄。

以上就是我們?yōu)榇蠹医榻B的Python抓取網(wǎng)頁圖片的應(yīng)用方式。

【編輯推薦】

  1. Python AOP正確實現(xiàn)方法介紹
  2. Python解釋器正確調(diào)用方式簡介
  3. Python開發(fā)環(huán)境相關(guān)搭建方法介紹
  4. windows service運行Python相關(guān)操作技巧分享
  5. Python下劃線在實際應(yīng)用中功能體現(xiàn)
【責(zé)任編輯:曹凱 TEL:(010)68476606】

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約