什麼是正態分佈?
這常態分佈公式基於兩個簡單參數 - 意思是和標準偏差- 量化給定數據集的特徵。
均值表示整個數據集的“中心”或平均值,但標準偏差表示圍繞該平均值的數據點的“差異”或變化。
關鍵要點
- 正態分佈公式基於兩個簡單的參數 - 均值和標準偏差 - 量化給定數據集的特徵。
- 為了促進一種均勻的標準方法,以方便計算和對現實世界問題的適用性,引入了標準轉換為z值,這構成了正態分佈表的一部分。
- 正態分佈的特性包括:正常曲線對平均值是對稱的;平均值在中間,將區域分為一半。對於平均值= 0,曲線下的總面積等於1,而stdev = 1;並且分佈完全用其平均值和stddev描述。
- 正態分佈表用於證券交易中,以幫助識別上升趨勢或下降趨勢,支持或阻力水平以及其他技術指標。
正態分佈示例
考慮以下2個數據集:
- 數據集1 = {10,10,10,10,10,10,10,10,10,10,10}
- 數據集2 = {6、8、10、12、14、14、12、10、8、6}
對於DataSet1,平均值= 10和標準偏差(stddev)= 0
對於DataSet2,平均值= 10和標準偏差(STDDEV)= 2.83
讓我們繪製數據集的這些值:
同樣,數據集2:
紅色水平線在上面的兩個圖中,每個數據集的“平均值”或平均值(在兩種情況下為10)。第二個圖中的粉紅色箭頭指示數據值從平均值中的擴展或變化。在數據集2的情況下,這由2.83的標準偏差值表示。由於DataSet1的所有值相同(每個10),並且沒有變化,因此stddev值為零,因此不適用粉紅色箭頭。
STDDEV值具有一些重要且有用的特徵,這些特徵在數據分析中極有幫助。對於正態分佈,數據值在平均值的兩側對稱分佈。對於任何正態分佈的數據集,在水平軸上用stddev繪製圖形以及垂直軸上的數據值數量,將獲得以下圖。
正態分佈的特性
- 正常曲線對平均值是對稱的。
- 平均值在中間,將區域分為兩半。
- 對於平均值= 0,曲線下的總面積等於1,而stdev = 1;
- 該分佈完全用其平均值和stddev描述
從上圖可以看出,stddev表示以下內容:
- 68.3%數據值在內1個標準偏差平均值(-1至+1)
- 95.4%數據值在內2個標準偏差平均值(-2至+2)
- 99.7%數據值在內3個標準偏差平均值(-3至+3)
測量鐘形曲線下的面積表示給定範圍的所需概率:
- 小於x:例如,數據值的概率小於70
- 大於x:例如,數據值的概率大於95
- 在x之間1和x2:例如,65至85之間的數據值的概率
其中x是感興趣的值(以下示例)。
繪製和計算區域並不總是方便的,因為不同的數據集將具有不同的均值和stddev值。為了促進一種均勻的標準方法,用於簡化計算和對現實世界問題的適用性,引入了標準轉換為z值,這構成了該部分的一部分正態分佈表。
z =(x - 平均)/stddev,其中x是隨機變數。
基本上,這種轉換迫使平均值和stddev分別標準化為0和1,這使一組標準的z值集(從正態分佈表)用於簡單計算。包含概率值的標準Z值表的快照如下:
z |
0.00 |
0.01 |
0.02 |
0.03 |
0.04 |
0.05 |
0.06 |
0.0 |
0.00000 |
0.00399 |
0.00798 |
0.01197 |
0.01595 |
0.01994 |
… |
0.1 |
0.0398 |
0.04380 |
0.04776 |
0.05172 |
0.05567 |
0.05966 |
… |
0.2 |
0.0793 |
0.08317 |
0.08706 |
0.09095 |
0.09483 |
0.09871 |
… |
0.3 |
0.11791 |
0.12172 |
0.12552 |
0.12930 |
0.13307 |
0.13683 |
… |
0.4 |
0.15542 |
0.15910 |
0.16276 |
0.16640 |
0.17003 |
0.17364 |
… |
0.5 |
0.19146 |
0.19497 |
0.19847 |
0.20194 |
0.20540 |
0.20884 |
… |
0.6 |
0.22575 |
0.22907 |
0.23237 |
0.23565 |
0.23891 |
0.24215 |
… |
0.7 |
0.25804 |
0.26115 |
0.26424 |
0.26730 |
0.27035 |
0.27337 |
… |
… |
… |
… |
… |
… |
… |
… |
… |
要找到與0.239865的Z值相關的概率,將其第一輪倒入2個小數點位置(即0.24)。然後在行中檢查第一個2個有意義的數字(0.2),並在列中查看最小的數字(剩餘0.04)。這將導致價值為0.09483。
可以在此處找到完整的正態分佈表,具有概率值的精度最高為5個小數點(包括為負值的值)。
讓我們看看一些現實生活中的例子。大組中個體的高度遵循正態分佈模式。假設我們有一組100個個體,其高度被記錄,平均值和核心就是分別計算為66英寸和6英寸。
這裡有一些示例問題,可以使用z-Value表輕鬆回答:
該組中的一個人的可能性是70英寸或更少?
問題是找到累積價值p(x <= 70)IE在100個數據集中,有多少個值在0到70之間。
讓我們首先將70的X值轉換為等效的z值。
z =(x - 平均)/stddev =(70-66)/6 = 4/6 = 0.66667 = 0.67(圓形到2個小數位)
現在,我們需要找到P(z <= 0.67)=0。24857(從上面的z-table)
即,該組中的個人小於或等於70英寸的概率為24.857%。
但是請堅持下去 - 以上是不完整的。請記住,我們正在尋找從0到70到70的所有可能高度的概率。我們需要包括另一半(從0到66),以得出正確的答案。
由於0至66代表半部分(即一個極端到中間平均值),因此其概率僅為0.5。
因此,一個人是70英寸或更小的正確概率= 0.24857 + 0.5 =0。74857=74.857%
以圖形方式(通過計算區域),這是代表解決方案的兩個求和區域:
一個人的75英寸或更高的可能性是多少?
即找到互補累積p(x> = 75)。
z =(x - 平均)/stddev =(75-66)/6 = 9/6 = 1.5
p(z> = 1.5)= 1- p(z <= 1.5)= 1 - (0.5+0.43319)= 0.06681 = 6.681%
一個人在52英寸至67英寸之間的概率是多少?
查找p(52 <= x <= 67)。
p(52 <= x <= 67)= p [(52-66)/6 <= z <=(67-66)/6] = p(-2.33 <= z <= 0.17)
= p(z <= 0.17)–p(z <= -0.233)=(0.5+0.56749) - (.40905)=
這個正常的分配表(和z值)通常會發現用於對預期價格移動的任何概率計算的用途股市用於股票和指數。它們用於基於範圍的交易,識別升級或者下降,,,,支持或抵抗等級等技術指標基於平均值和標準偏差的正態分佈概念。