小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

《學(xué)點(diǎn)統(tǒng)計(jì)學(xué),讓工作起飛》|1. 快速了解統(tǒng)計(jì)學(xué)

 leafcho 2019-01-12

一、什么是統(tǒng)計(jì)學(xué)

綜合來(lái)講,統(tǒng)計(jì)學(xué)就是收集、處理、分析、解釋數(shù)據(jù)并從數(shù)據(jù)中得出結(jié)論的科學(xué)。

比如說,我們想知道中國(guó)男性和女性誰(shuí)的收入更高。全中國(guó)人民那么多,即使是官方機(jī)構(gòu)想要進(jìn)行一個(gè)總體的統(tǒng)計(jì)都不太現(xiàn)實(shí),更別提我們了。因此我們需要進(jìn)行抽樣,并統(tǒng)計(jì)我們抽中的樣本的數(shù)據(jù)情況,對(duì)數(shù)據(jù)進(jìn)行一些必要的處理(比如處理缺失值、異常值、重復(fù)數(shù)據(jù)等),然后對(duì)數(shù)據(jù)進(jìn)行分析,并對(duì)分析結(jié)果進(jìn)行解釋。最后,給出一個(gè)可靠的結(jié)論。

以上就是一項(xiàng)統(tǒng)計(jì)學(xué)任務(wù)的流程。其中,數(shù)據(jù)分析所使用的方法可以分為描述統(tǒng)計(jì)方法和推斷統(tǒng)計(jì)方法。

  • 描述統(tǒng)計(jì):Descriptive Statistics,研究的是數(shù)據(jù)收集、處理、匯總、圖表描述、概括與分析等統(tǒng)計(jì)方法。
  • 推斷統(tǒng)計(jì):Inferential Statistics,研究如何利用樣本數(shù)據(jù)來(lái)推斷總體特征的統(tǒng)計(jì)方法。

之后我們會(huì)詳細(xì)討論兩者的更多細(xì)節(jié)。

二、統(tǒng)計(jì)數(shù)據(jù)的類型

我們有必要先了解下數(shù)據(jù)的類型。

1. 按照計(jì)量尺度

  • 分類數(shù)據(jù):categorical data,能歸于某一類別的非數(shù)字型數(shù)據(jù),它是對(duì)食物進(jìn)行分類的結(jié)果,數(shù)據(jù)表現(xiàn)為類別,一般用文字來(lái)表述。比如人口分為男、女兩類等。為方便處理,我們經(jīng)常會(huì)用數(shù)字代碼來(lái)代替文字。
  • 順序數(shù)據(jù):rank data,能歸于某一有序類別的非數(shù)字型數(shù)據(jù)。比如考試成績(jī)可以分為優(yōu)、良、中、及格、不及格,一個(gè)人的受教育程度可以分為小學(xué)、初中、高中、本科、碩士、博士等。
  • 數(shù)值型數(shù)據(jù):metric data,按數(shù)字尺度測(cè)量的觀察值,其結(jié)果表現(xiàn)為具體的數(shù)值。數(shù)值型數(shù)據(jù)具體又可以分為等距數(shù)據(jù)和等比數(shù)據(jù)。在等距數(shù)據(jù)中,數(shù)據(jù)間的單位尺度是固定的,比如我們走路的步數(shù),可以是1步、2步、……、100步,但是不會(huì)是1.1步,因此等距數(shù)據(jù)屬于離散數(shù)據(jù);等比數(shù)據(jù)則是一種連續(xù)數(shù)據(jù),它的加減乘除均有意義。

2. 按照統(tǒng)計(jì)數(shù)據(jù)的收集方法

  • 觀測(cè)數(shù)據(jù):observational data,通過調(diào)查或觀測(cè)而收集到的數(shù)據(jù),這類數(shù)據(jù)是在沒有人為操控的情況下得到的。
  • 實(shí)驗(yàn)數(shù)據(jù):experimental data,實(shí)驗(yàn)中控制實(shí)驗(yàn)對(duì)象而收集到的數(shù)據(jù),這類數(shù)據(jù)是在人為操控的環(huán)境下得到的。

3. 按照被描述對(duì)象與時(shí)間的關(guān)系

  • 截面數(shù)據(jù):cross-sectional data,在相同或近似相同的時(shí)間點(diǎn)上收集的數(shù)據(jù)。我們常常提到的橫向?qū)Ρ?,事?shí)上就是對(duì)同一時(shí)期收集到的截面數(shù)據(jù)進(jìn)行對(duì)比。
  • 時(shí)間序列數(shù)據(jù):time series data,在不同時(shí)間收集到的數(shù)據(jù),這類數(shù)據(jù)是按照時(shí)間順序收集到的,用于描述現(xiàn)象隨時(shí)間變化的情況。我們常常提到的縱向?qū)Ρ?,就是指同一事物在不同時(shí)期的時(shí)間序列數(shù)據(jù)間的對(duì)比。時(shí)間序列分析可以單獨(dú)拆分為一門大學(xué)問,我們后續(xù)可能會(huì)單獨(dú)拆出一個(gè)系列來(lái)講解。

《學(xué)點(diǎn)統(tǒng)計(jì)學(xué),讓工作起飛》|1. 快速了解統(tǒng)計(jì)學(xué)

三、統(tǒng)計(jì)中的一些基本概念

1. 總體和樣本

總體:population,包含所研究的全部個(gè)體的集合。比如當(dāng)我們想要研究中國(guó)人民的人均身高時(shí),全中國(guó)人民就是總體??傮w分為有限總體無(wú)限總體,對(duì)于有限總體來(lái)說,元素的數(shù)目是可數(shù)的,而無(wú)限總體中的元素則是無(wú)限、不可數(shù)的。在無(wú)限總體中,每次抽取一個(gè)單位,并不影響下一次的抽樣結(jié)果,這是因?yàn)闊o(wú)限總體去除上一次抽取的樣本后,剩下的仍然是一個(gè)無(wú)限總體。因此無(wú)限總體中的每次抽樣總可以看做是獨(dú)立的。反之,在有限總體中,多次無(wú)放回的抽樣之間并不是相互獨(dú)立的

樣本:sample,從總體中抽取的一部分元素的集合,構(gòu)成樣本的元素的數(shù)目成為樣本量。抽樣的目的是根據(jù)樣本提供的信息推斷總體的特征。比如我們統(tǒng)計(jì)中國(guó)人民的人均身高時(shí),抽取了10000人的樣本來(lái)作為代表。那么全中國(guó)人民是我們的總體,這10000人就是我們的樣本,樣本量是10000。

2. 參數(shù)和統(tǒng)計(jì)量

  • 參數(shù):parameter,用來(lái)描述

    總體特征

    的概括性數(shù)字度量,它是研究者想要了解的總體的某種特征值。比如總體均值、總體標(biāo)準(zhǔn)差等。在統(tǒng)計(jì)中,總體參數(shù)通常用希臘字母表示,比如總體均值用μ表示,總體標(biāo)準(zhǔn)差用σ表示,總體比例用π表示等。
  • 統(tǒng)計(jì)量:statistic,用來(lái)描述

    樣本特征

    的概括性數(shù)字度量。樣本統(tǒng)計(jì)量常用英文字母來(lái)表示。

由于樣本已知,因此統(tǒng)計(jì)量可以輕松求得。抽樣的目的是根據(jù)樣本統(tǒng)計(jì)量來(lái)估計(jì)總體參數(shù)。比如用樣本標(biāo)準(zhǔn)差s估計(jì)總體標(biāo)準(zhǔn)差σ等。

一言以蔽之,參數(shù)相當(dāng)于總體中的統(tǒng)計(jì)量,統(tǒng)計(jì)量相當(dāng)于樣本中的參數(shù),它們的含義一致,只是分別應(yīng)用于總體和統(tǒng)計(jì)量,且樣本統(tǒng)計(jì)量可以直接通過描述統(tǒng)計(jì)得到,而總體參數(shù)往往是未知的,需要通過推斷統(tǒng)計(jì)來(lái)估計(jì)。

3. 變量

變量:variable,相信我們對(duì)變量都比較熟悉,我們最常使用的名稱有自變量和因變量,其中后者跟隨前者的變化而變化。不過今天我們會(huì)從其他的角度對(duì)變量進(jìn)行分類。

按照變量數(shù)據(jù)類型分類:

  • 分類變量:categorical variable,對(duì)應(yīng)分類數(shù)據(jù)。
  • 順序變量:rank variable,對(duì)應(yīng)順序數(shù)據(jù)。
  • 數(shù)值型變量:metric variable,對(duì)應(yīng)數(shù)值型數(shù)據(jù)??梢赃M(jìn)一步分為離散型變量(discrete variable)和連續(xù)性變量(continuous variable)。

其他分類角度

  • 隨機(jī)變量和非隨機(jī)變量
  • 經(jīng)驗(yàn)變量和理論變量

這部分后續(xù)我們會(huì)接觸到。

以上內(nèi)容是統(tǒng)計(jì)學(xué)的基礎(chǔ),不難,但是必須要記清楚,避免以后在某些問題上產(chǎn)生混淆。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多