機率與統計基本名詞

表示空間

母體 population
所有目標資料、個體、物件的集合。
樣本 Sample
母體內一部份的內容。
隨機樣本 Random sample
所有樣本的內容被選擇時皆具有相同的或是明確的機會。
事件 Event
母體或樣本中資料的特定組合。
離散 Discrete
整數、孤立、或是有明確差異的數值。
連續 Continuous
在有限的範圍裡,可以有無限的數值。

表示資料結果

統計量 statistic
對樣本的數字化描述(樣本平均數、樣本變異數…),多以英文字母表示。
參數(母體數) parameter
對母體的數字化描述(母體平均數、母體變異數…),多以希臘字母表示。
中央極限理論 CLT
當樣本夠大時,不論母體的分散程度有多大,樣本會趨近常態分佈,因此樣本平均數可以代表母體平均數。
標準分數 Standard Score

表示資料集中趨勢

平均數(期望值) mean
母體或樣本所有值的總和/母體或樣本的數量。
中位數 median
所有的數依照大小排序後,中間的數的值。
眾數 mode
出現頻率最高的數值

表示資料分散程度

範圍 range
範圍 range:最大值與最小值的差值,無法表示大型樣本或母體的內涵。
變異數 variance
利用最小平方法將每筆資料與平均數的差異平均。
標準差 Standard deviation
將變異數開根號以獲得與原資料相同的單位。

表示資料不對稱性

偏度 Skewness

表示資料極端程度

峰度Kurtosis

表示事件關係

補集 complement
事件不會發生的機率與會發生的機率為全部可能性。
互斥 mutually exclusive
兩事件不會同時發生。
獨立 (statistically) independent
目標事件的機率不會受到另一事件的已知與否影響。

離散機率函數

機率質量函數PMF f(X)
累積機率函數CDF F(X)

連續機率函數

機率密度函數PDF P(X)
累積機率函數CDF F(X)