什么是SeabornSeaborn是基于matplotlib的圖形可視化python包。它提供了一種高度交互式界面,便于用戶能夠做出各種有吸引力的統(tǒng)計圖表。 Seaborn是在matplotlib的基礎上進行了更高級的API封裝,從而使得作圖更加容易,在大多數(shù)情況下使用seaborn能做出很具有吸引力的圖,而使用matplotlib就能制作具有更多特色的圖。應該把Seaborn視為matplotlib的補充,而不是替代物。同時它能高度兼容numpy與pandas數(shù)據(jù)結構以及scipy與statsmodels等統(tǒng)計模式。 按照國際慣例,先裝一波什么報錯了,報錯是肯定的,seaborn包依賴于scipy包,所以要先裝scipy,解決方法如下: 升級pip解決了這個問題 seaborn APISeaborn 要求原始數(shù)據(jù)的輸入類型為 pandas 的 Dataframe 或 Numpy 數(shù)組,畫圖函數(shù)有以下幾種形式: sns.圖名(x='X軸 列名', y='Y軸 列名', data=原始數(shù)據(jù)df對象) sns.圖名(x='X軸 列名', y='Y軸 列名', hue='分組繪圖參數(shù)', data=原始數(shù)據(jù)df對象) sns.圖名(x=np.array, y=np.array[, ...])
barplot 將點估計和置信區(qū)間顯示為矩形條。 條形圖表示具有每個矩形的高度的數(shù)值變量的集中趨勢的估計,并且使用誤差條提供圍繞該估計的不確定性的一些指示 API介紹 Example for barplot 橫坐標為0-7的整數(shù),縱坐標表示這八個整數(shù)分別所占的權重,調整 palette 參數(shù)可以美化顯示風格 ![]() image
seaborn.barplot實戰(zhàn)1.數(shù)據(jù)集通過爬蟲爬取了貓眼上面,用戶對電影《狄仁杰之四大天王》的影評,如下圖所示,包括 ![]() image
2.代碼通過pandas,讀取出數(shù)據(jù)在 data中,評分在rate下面 ,data['rate'].value_counts(),統(tǒng)計出各分數(shù)的人數(shù),如下圖所示 ![]() image
最后橫坐標為rate.index(0.0,0.5,1.0,1.5....5.0),縱坐標為給出各分數(shù)的人數(shù)/總人數(shù),這很容易理解,最后算出的就是,這個評分所占的比例。 3.分析結果![]() image
看到超過40%的人給出了5.0的評分,超過85%的人給出了3.5以上的評分,至少說明這部電影在口碑方面上取得的成績是比較好的. 小結結合爬蟲爬取下來的電影數(shù)據(jù),根據(jù)評分來通過seaborn繪制出評分的發(fā)布直方圖,只介紹了seaborn的一種方法,不要著急,stpe by stpe.事實上一頭扎進文檔里,我相信看過5種繪圖方式,你就記不住了,方法學會了,之后,根據(jù)需求,查閱文檔,現(xiàn)學現(xiàn)用就行了 |
|
|