小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

描述統(tǒng)計學(xué)

 印度阿三17 2020-03-13

分類數(shù)據(jù)描述統(tǒng)計

頻數(shù)統(tǒng)計:

  • 單純對各個分類計數(shù)。count

  • 百分比。

 

數(shù)值數(shù)據(jù)描述統(tǒng)計

  • 統(tǒng)計度量:

    • 平均數(shù)

    • 中位數(shù)median(比平均數(shù)更真實反應(yīng)情況)。如果平均數(shù)<>中位數(shù),代表數(shù)值分布有傾斜,更多數(shù)值靠近中位數(shù)。

    • 眾數(shù),  出現(xiàn)頻率最高的數(shù)值。

    • 分位數(shù)

    • 標(biāo)準(zhǔn)差

  • 圖形

分位數(shù)

分位數(shù)(英語:Quantile),亦稱分位點,是指用分割點(cut point)將一個隨機變量概率分布范圍分為幾個具有相同概率的連續(xù)區(qū)間。

分割點的數(shù)量比劃分出的區(qū)間少1,例如3個分割點能分出4個區(qū)間。

常用的有中位數(shù)(即二分位數(shù))、四分位數(shù)(quartile)、十分位數(shù)(decile )、百分位數(shù)等。q-quantile是指將有限值集分為q個接近相同尺寸的子集。

分位數(shù)指的就是連續(xù)分布函數(shù)中的一個點,這個點對應(yīng)概率p。

四分位數(shù)(英語:Quartile)

統(tǒng)計學(xué)分位數(shù)的一種,即把所有數(shù)值由小到大排列,然后按照總數(shù)量分成四等份,即每份中的數(shù)值的數(shù)量相同,處于三個分割點位置的數(shù)值就是四分位數(shù)。

這3個數(shù)叫做:

  • 第一四分位數(shù),又稱較小四分位數(shù),等于該樣本中所有數(shù)值由小到大排列后第25%的數(shù)字。

  • 第二四分位數(shù),又稱中位數(shù),等于該樣本中所有數(shù)值由小到大排列后第50%的數(shù)字。

  • 第三四分位數(shù),又稱較大四分位數(shù),等于該樣本中所有數(shù)值由小到大排列后第75%的數(shù)字。

pandas.DataFrame.quantile()和numpy.percentile()計算結(jié)果一樣。

pandas中有describe方法顯示四分位數(shù)。

例子:

>>> ps = pd.DataFrame([1,2,3,4,5,6,7,8,9,10,11,12])
>>> ps.describe()
               0
count  12.000000
mean    6.500000
std     3.605551
min     1.000000
25%     3.750000    #分割點
50%     6.500000
75%     9.250000
max    12.000000
>>> ps.quantile(0.25)
0    3.75
 
>>> ps.quantile(0.5)
0    6.5
>>> np.percentile(ps, 50)
6.5

分析方法中的二八法則,結(jié)合分位數(shù)來使用。

標(biāo)準(zhǔn)差,方差

描述數(shù)據(jù)離散程度。數(shù)據(jù)的波動性。

  • 方差:統(tǒng)計中的方差(樣本方差)是每個樣本值與全體樣本值的平均數(shù)之差的平方值的平均數(shù)

  • 標(biāo)準(zhǔn)差:對方差開跟號。因為方差會消除數(shù)據(jù)的單位,比如:元,缺少了業(yè)務(wù)的含義,所以引入標(biāo)準(zhǔn)差。

例子:

a=[10,10,10,11,12,12,12]

b=[3,5,7,11,15,17,19]

a和b的中位數(shù)和平均數(shù)都11,但他們的方差不一樣,a的方差<b的方差。a數(shù)據(jù)集的離散程度小于b數(shù)據(jù)集。

均值 /-標(biāo)準(zhǔn)差,這個范圍的數(shù)據(jù)占了整個數(shù)據(jù)集的大部分,可以說數(shù)值大部分在這個范圍內(nèi)波動。

闡述:數(shù)據(jù)集的平均值是m, 大部分在m /-方差的范圍內(nèi)波動。

例子:

#還是??的數(shù)據(jù)
>>> ps.std()
0    3.605551

權(quán)重統(tǒng)計--數(shù)據(jù)標(biāo)準(zhǔn)化Z-Score

來源:https://www./content-4-658401.html

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多