【四分位差怎么計(jì)算】四分位差(Interquartile Range,簡稱IQR)是統(tǒng)計(jì)學(xué)中用于衡量數(shù)據(jù)分布離散程度的一個(gè)重要指標(biāo)。它表示中間50%的數(shù)據(jù)范圍,即第三四分位數(shù)(Q3)與第一四分位數(shù)(Q1)之間的差值。相比極差(最大值減最小值),四分位差更能反映數(shù)據(jù)的集中趨勢和異常值的識(shí)別能力。
一、四分位差的定義
四分位差 = Q3 - Q1
其中:
- Q1(第一四分位數(shù)):將數(shù)據(jù)從小到大排列后,位于25%位置的數(shù)值。
- Q3(第三四分位數(shù)):將數(shù)據(jù)從小到大排列后,位于75%位置的數(shù)值。
二、四分位差的計(jì)算步驟
1. 將數(shù)據(jù)從小到大排序
確保數(shù)據(jù)按升序排列,這是計(jì)算四分位數(shù)的基礎(chǔ)。
2. 確定數(shù)據(jù)個(gè)數(shù)(n)
計(jì)算數(shù)據(jù)點(diǎn)的數(shù)量,以便后續(xù)計(jì)算位置。
3. 計(jì)算Q1和Q3的位置
- Q1的位置:(n + 1) × 0.25
- Q3的位置:(n + 1) × 0.75
4. 根據(jù)位置查找對(duì)應(yīng)的數(shù)值
如果位置為整數(shù),則直接取該位置的數(shù)值;如果為小數(shù),則使用插值法計(jì)算。
5. 計(jì)算四分位差
用Q3減去Q1即可得到四分位差。
三、示例說明
假設(shè)有一組數(shù)據(jù)如下(已排序):
```
12, 15, 18, 20, 22, 25, 28, 30, 32
```
共9個(gè)數(shù)據(jù)點(diǎn)(n=9)
1. 計(jì)算Q1位置:(9 + 1) × 0.25 = 2.5 → 第2.5個(gè)數(shù)據(jù)
- 第2個(gè)數(shù)據(jù)是15,第3個(gè)是18
- Q1 = 15 + (18 - 15) × 0.5 = 16.5
2. 計(jì)算Q3位置:(9 + 1) × 0.75 = 7.5 → 第7.5個(gè)數(shù)據(jù)
- 第7個(gè)數(shù)據(jù)是28,第8個(gè)是30
- Q3 = 28 + (30 - 28) × 0.5 = 29
3. 計(jì)算四分位差:29 - 16.5 = 12.5
四、四分位差的意義
- 衡量數(shù)據(jù)的離散程度:四分位差越小,說明數(shù)據(jù)越集中;越大則數(shù)據(jù)越分散。
- 識(shí)別異常值:在箱線圖中,四分位差用于判斷數(shù)據(jù)是否存在異常值。
- 適用于非對(duì)稱分布:相比于標(biāo)準(zhǔn)差,四分位差對(duì)極端值不敏感,更適合偏態(tài)分布數(shù)據(jù)。
五、四分位差與極差的區(qū)別
| 指標(biāo) | 定義 | 敏感性 | 適用場景 |
| 極差 | 最大值 - 最小值 | 敏感 | 數(shù)據(jù)分布較均勻時(shí) |
| 四分位差 | Q3 - Q1 | 不敏感 | 存在異常值時(shí) |
六、總結(jié)
四分位差是描述數(shù)據(jù)集中趨勢和離散程度的重要工具,尤其在處理存在異常值或非對(duì)稱分布的數(shù)據(jù)時(shí)更具優(yōu)勢。通過計(jì)算Q1和Q3的差值,可以更準(zhǔn)確地了解數(shù)據(jù)中間50%的分布情況,從而為數(shù)據(jù)分析提供有力支持。
表格總結(jié)
| 項(xiàng)目 | 內(nèi)容 |
| 四分位差公式 | IQR = Q3 - Q1 |
| Q1定義 | 數(shù)據(jù)中25%位置的數(shù)值 |
| Q3定義 | 數(shù)據(jù)中75%位置的數(shù)值 |
| 計(jì)算步驟 | 排序 → 確定n → 計(jì)算位置 → 插值 → 相減 |
| 用途 | 衡量數(shù)據(jù)離散程度、識(shí)別異常值 |
| 優(yōu)點(diǎn) | 對(duì)異常值不敏感,適合偏態(tài)分布數(shù)據(jù) |
| 缺點(diǎn) | 僅反映中間50%數(shù)據(jù),無法全面描述整體分布 |


