分類數(shù)據(jù)描述統(tǒng)計頻數(shù)統(tǒng)計:
數(shù)值數(shù)據(jù)描述統(tǒng)計
分位數(shù)分位數(shù)(英語:Quantile),亦稱分位點,是指用分割點(cut point)將一個隨機變量的概率分布范圍分為幾個具有相同概率的連續(xù)區(qū)間。 分割點的數(shù)量比劃分出的區(qū)間少1,例如3個分割點能分出4個區(qū)間。 常用的有中位數(shù)(即二分位數(shù))、四分位數(shù)(quartile)、十分位數(shù)(decile )、百分位數(shù)等。q-quantile是指將有限值集分為q個接近相同尺寸的子集。 分位數(shù)指的就是連續(xù)分布函數(shù)中的一個點,這個點對應(yīng)概率p。 四分位數(shù)(英語:Quartile)是統(tǒng)計學(xué)中分位數(shù)的一種,即把所有數(shù)值由小到大排列,然后按照總數(shù)量分成四等份,即每份中的數(shù)值的數(shù)量相同,處于三個分割點位置的數(shù)值就是四分位數(shù)。 這3個數(shù)叫做:
pandas.DataFrame.quantile()和numpy.percentile()計算結(jié)果一樣。 pandas中有describe方法顯示四分位數(shù)。 例子: >>> ps = pd.DataFrame([1,2,3,4,5,6,7,8,9,10,11,12])
>>> ps.describe()
0
count 12.000000
mean 6.500000
std 3.605551
min 1.000000
25% 3.750000 #分割點
50% 6.500000
75% 9.250000
max 12.000000>>> ps.quantile(0.25) 0 3.75 >>> ps.quantile(0.5) 0 6.5 >>> np.percentile(ps, 50) 6.5 分析方法中的二八法則,結(jié)合分位數(shù)來使用。 標(biāo)準(zhǔn)差,方差描述數(shù)據(jù)離散程度。數(shù)據(jù)的波動性。
例子: a=[10,10,10,11,12,12,12] b=[3,5,7,11,15,17,19] a和b的中位數(shù)和平均數(shù)都11,但他們的方差不一樣,a的方差<b的方差。a數(shù)據(jù)集的離散程度小于b數(shù)據(jù)集。 均值 /-標(biāo)準(zhǔn)差,這個范圍的數(shù)據(jù)占了整個數(shù)據(jù)集的大部分,可以說數(shù)值大部分在這個范圍內(nèi)波動。 闡述:數(shù)據(jù)集的平均值是m, 大部分在m /-方差的范圍內(nèi)波動。 例子: #還是??的數(shù)據(jù) >>> ps.std() 0 3.605551 權(quán)重統(tǒng)計--數(shù)據(jù)標(biāo)準(zhǔn)化Z-Score來源:https://www./content-4-658401.html |
|
|