Mean Median Mode คืออะไร? วิธีคำนวณค่าเฉลี่ย ค่ามัธยฐาน ค่าฐานนิยม และความสัมพันธ์

By Leonard Cucosth
สถิติExcelR Programming

Mean, Median และ Mode เป็นสามหลักการพื้นฐานของ Measures of Central Tendency ในสถิติที่ช่วยให้คุณเข้าใจค่ากลางหรือค่าแทนในชุดข้อมูล ไม่ว่าคุณจะวิเคราะห์คะแนนสอบ ยอดขาย หรือผลการสำรวจ สถิติเหล่านี้ให้มุมมองที่แตกต่างกันเกี่ยวกับสิ่งที่ถือว่า "ปกติ" หรือ "เฉลี่ย" ในข้อมูลของคุณ

ในคู่มือนี้ คุณจะได้เรียนรู้วิธีคำนวณ Mean, Median และ Mode ด้วยตัวเองโดยใช้สูตรง่ายๆ จากนั้นค้นพบวิธีที่เร็วกว่าด้วยฟังก์ชัน Excel และการเขียนโปรแกรม R แต่ละตัววัดมีจุดแข็งที่ไม่เหมือนกัน และเมื่อจบบทเรียนนี้ คุณจะรู้ว่าเมื่อไหร่ควรใช้แต่ละตัววัด

วิธีคำนวณค่าเฉลี่ย (Mean) ในสถิติ

Mean (ค่าเฉลี่ยเลขคณิต) คำนวณได้โดยนำค่าทั้งหมดในชุดข้อมูลมารวมกัน แล้วหารด้วยจำนวนค่าทั้งหมด เป็นตัววัด Measure of Central Tendency ที่ใช้กันมากที่สุด

สูตร:

Mean=xn\Large \text{Mean} = \frac{\sum x}{n}

โดยที่ Σx คือผลรวมของค่าทั้งหมด และ n คือจำนวนค่า

ตัวอย่าง:

สมมติว่าคุณเป็นครูที่กำลังคำนวณคะแนนเฉลี่ยของการสอบในชั้นเรียน คะแนนมีดังนี้:

89,76,95,82,68,91,7889, 76, 95, 82, 68, 91, 78

ขั้นตอนที่ 1: รวมคะแนนทั้งหมดเข้าด้วยกัน:

89+76+95+82+68+91+78=57989 + 76 + 95 + 82 + 68 + 91 + 78 = 579

ขั้นตอนที่ 2: หารด้วยจำนวนคะแนน (7):

579÷7=82.7579 \div 7 = 82.7

ค่าเฉลี่ยคะแนนสอบคือ 82.7 คะแนน

คำนวณค่าเฉลี่ย (Mean) ใน Excel

ฟังก์ชัน AVERAGE ของ Excel ทำให้การคำนวณค่าเฉลี่ยรวดเร็วและง่ายดาย:

  1. คลิกที่เซลล์ว่างที่คุณต้องการให้แสดงผลลัพธ์
  2. พิมพ์ =AVERAGE( ลงในเซลล์
  3. เลือกช่วงของเซลล์ที่มีข้อมูลของคุณ (เช่น A1:A10)
  4. ปิดวงเล็บและกด Enter

ตัวอย่าง:

=AVERAGE(A1:A10)

สำหรับฟังก์ชันสถิติเพิ่มเติมใน Excel ตรวจสอบคู่มือของเราเกี่ยวกับ Descriptive Statistics ใน Excel

คำนวณค่าเฉลี่ย (Mean) ใน R

R มีฟังก์ชัน mean() ในตัวสำหรับการคำนวณอย่างรวดเร็ว:

# สร้าง vector ด้วยข้อมูลตัวอย่าง
data <- c(10, 20, 30, 40, 50)
 
# คำนวณค่าเฉลี่ย
mean_value <- mean(data)
 
# แสดงผลลัพธ์
print(mean_value)
# Output: 30

ค่าเฉลี่ยคือ 30 (ผลรวม 150 หารด้วย 5 ค่า)

วิธีคำนวณค่าฐานนิยม (Mode) ในสถิติ

Mode คือค่าที่ปรากฏบ่อยที่สุดในชุดข้อมูล ไม่เหมือนกับ Mean และ Median ชุดข้อมูลสามารถมี:

  • Mode เดียว (unimodal)
  • หลาย Mode (bimodal หรือ multimodal)
  • ไม่มี Mode (ค่าทั้งหมดปรากฏด้วยความถี่เท่ากัน)

ตัวอย่าง:

สมมติว่าคุณเป็นเจ้าของร้านขายรองเท้าและต้องการหาเบอร์รองเท้าที่พบบ่อยที่สุด ลูกค้า 20 คนล่าสุดของคุณซื้อรองเท้าเบอร์เหล่านี้:

7,8,9,7,10,9,8,7,11,10,9,7,9,8,8,10,7,9,8,107, 8, 9, 7, 10, 9, 8, 7, 11, 10, 9, 7, 9, 8, 8, 10, 7, 9, 8, 10

นับความถี่:

เบอร์รองเท้าความถี่
75 ครั้ง
85 ครั้ง
96 ครั้ง
104 ครั้ง
111 ครั้ง

Mode คือ เบอร์ 9 (ปรากฏ 6 ครั้ง มากกว่าเบอร์อื่นๆ)

คำนวณค่าฐานนิยม (Mode) ใน Excel

Excel มีฟังก์ชัน Mode สองแบบ:

Mode เดียว (Unimodal Data)

ใช้ MODE.SNGL สำหรับชุดข้อมูลที่มีค่าที่พบบ่อยที่สุดค่าเดียว:

=MODE.SNGL(A1:A10)

หลาย Mode (Multimodal Data)

ใช้ MODE.MULT สำหรับชุดข้อมูลที่มีค่าที่พบบ่อยที่สุดหลายค่า:

=MODE.MULT(A1:A10)

เพื่อแสดง Mode ทั้งหมด ให้ใส่สูตรและกด Ctrl+Shift+Enter (array formula) จากนั้นคัดลอกไปยังเซลล์ที่อยู่ติดกัน

คำนวณค่าฐานนิยม (Mode) ใน R

R ไม่มีฟังก์ชัน Mode ในตัว แต่คุณสามารถคำนวณได้ง่ายๆ:

# สร้าง vector
shoe_sizes <- c(7, 8, 9, 7, 10, 9, 8, 7, 11, 10, 9, 7, 9, 8, 8, 10, 7, 9, 8, 10)
 
# คำนวณ mode
mode_value <- as.numeric(names(which.max(table(shoe_sizes))))
 
# แสดงผลลัพธ์
print(mode_value)
# Output: 9

วิธีคำนวณค่ามัธยฐาน (Median) ในสถิติ

Median คือค่ากลางเมื่อจัดเรียงค่าทั้งหมดจากน้อยไปมากหรือจากมากไปน้อย มันแบ่งชุดข้อมูลออกเป็นสองส่วน โดยมี 50% ของค่าต่ำกว่า Median และ 50% สูงกว่า

Median มีความทนทานต่อค่าผิดปกติ (outliers) มากกว่า Mean ทำให้เป็นประโยชน์สำหรับข้อมูลที่เบ้

สูตร:

  • จำนวนค่าคี่: Median คือค่ากลาง
  • จำนวนค่าคู่: Median คือค่าเฉลี่ยของสองค่ากลาง

ตัวอย่าง:

คุณกำลังวิเคราะห์รายได้ครัวเรือน (หน่วยพันดอลลาร์) ในย่าน:

45,60,70,55,80,90,65,75,5045, 60, 70, 55, 80, 90, 65, 75, 50

ขั้นตอนที่ 1: จัดเรียงจากน้อยไปมาก:

45,50,55,60,65,70,75,80,9045, 50, 55, 60, 65, 70, 75, 80, 90

ขั้นตอนที่ 2: หาค่ากลาง (ตำแหน่งที่ 5 ใน 9 ค่า):

Median คือ 65 (ค่ากลางที่แท้จริงที่มี 4 ค่าด้านล่างและ 4 ค่าด้านบน)

คำนวณค่ามัธยฐาน (Median) ใน Excel

ใช้ฟังก์ชัน MEDIAN ของ Excel:

  1. คลิกเซลล์ว่าง
  2. พิมพ์ =MEDIAN(
  3. เลือกช่วงข้อมูลของคุณ (เช่น A1:A10)
  4. ปิดวงเล็บและกด Enter

ตัวอย่าง:

=MEDIAN(A1:A10)

คำนวณค่ามัธยฐาน (Median) ใน R

ฟังก์ชัน median() ในตัวของ R คำนวณ Median:

# สร้าง vector
data <- c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10)
 
# คำนวณ median
data_median <- median(data)
 
# แสดงผลลัพธ์
print(data_median)
# Output: 5.5

เมื่อมี 10 ค่า (จำนวนคู่) Median คือค่าเฉลี่ยของค่าที่ 5 (5) และที่ 6 (6):

(5+6)/2=5.5(5 + 6) / 2 = 5.5

การแสดงภาพ Mean, Mode และ Median ใน R

นี่คือโค้ด R สำหรับแสดงภาพตัววัดทั้งสามบน Histogram โดยใช้ตัวอย่างเบอร์รองเท้า:

# โหลด library ที่ต้องการ
library(ggplot2)
 
# ชุดข้อมูล
shoe_sizes <- c(7, 8, 9, 7, 10, 9, 8, 7, 11, 10, 9, 7, 9, 8, 8, 10, 7, 9, 8, 10)
 
# คำนวณ mean, mode และ median
mean_size <- mean(shoe_sizes)
mode_size <- as.numeric(names(which.max(table(shoe_sizes))))
median_size <- median(shoe_sizes)
 
# สร้าง histogram พร้อมเส้นแนวตั้ง
hist_plot <- ggplot(data.frame(shoe_sizes), aes(shoe_sizes)) +
  geom_histogram(binwidth = 1, fill = "lightblue", color = "black") +
  geom_vline(aes(xintercept = mean_size), color = "blue",
             linetype = "dashed", size = 1.5) +
  geom_vline(aes(xintercept = mode_size), color = "red",
             linetype = "dashed", size = 1.5) +
  geom_vline(aes(xintercept = median_size), color = "green",
             linetype = "dashed", size = 1.5) +
  labs(title = "Shoe Size Distribution",
       subtitle = "Mean (blue), Mode (red), Median (green)",
       x = "Shoe Size",
       y = "Frequency") +
  theme_minimal()
 
# แสดง plot
print(hist_plot)

กราฟ Histogram แสดงการกระจายของเบอร์รองเท้าพร้อมเส้นแนวตั้งแสดง Mean สีน้ำเงิน, Mode สีแดง และ Median สีเขียว การแสดงภาพ Mean, Mode และ Median บน Histogram

การแสดงภาพนี้ช่วยให้คุณเห็นว่าตัววัดทั้งสามนี้เกี่ยวข้องกับการกระจายข้อมูลของคุณอย่างไร Mode ปรากฏที่จุดสูงสุด (ค่าที่พบบ่อยที่สุด) ในขณะที่ Mean และ Median แสดงแง่มุมที่แตกต่างของศูนย์กลางข้อมูล

ความสัมพันธ์ระหว่าง Mean, Median และ Mode

ความสัมพันธ์ระหว่าง Mean, Median และ Mode เปิดเผยข้อมูลสำคัญเกี่ยวกับการกระจายและความเบ้ของข้อมูลของคุณ

ใน Symmetric Distribution (การกระจายแบบสมมาตร)

เมื่อข้อมูลสมมาตรอย่างสมบูรณ์และมีการกระจายแบบปกติ (โค้งรูประฆัง):

Mean=Median=Mode\Large \text{Mean} = \text{Median} = \text{Mode}

ตัววัดทั้งสามมาบรรจบกันที่ศูนย์กลางของการกระจาย นี่เป็นสถานการณ์ที่เหมาะสมที่สุดสำหรับการวิเคราะห์ทางสถิติส่วนใหญ่

ตัวอย่าง: ความสูงของผู้ชายผู้ใหญ่มักจะมีการกระจายแบบปกติที่ความสูงเฉลี่ย (Mean) ความสูงกลาง (Median) และความสูงที่พบบ่อยที่สุด (Mode) ล้วนใกล้เคียงกันทั้งหมด

ใน Right-Skewed Distribution (การกระจายเบ้ขวา - Positively Skewed)

เมื่อข้อมูลมีหางยาวไปทางขวา (พบบ่อยในรายได้ ราคาบ้าน):

Mode<Median<Mean\Large \text{Mode} < \text{Median} < \text{Mean}

Mean ถูกดึงไปทางหางโดยค่าสูงมากๆ ในขณะที่ Median อยู่ตรงกลาง และ Mode อยู่ที่จุดสูงสุด

ตัวอย่าง: การกระจายรายได้ครัวเรือน

  • Mode: $45,000 (รายได้ที่พบบ่อยที่สุด)
  • Median: $65,000 (ค่ากลาง)
  • Mean: $85,000 (ถูกดึงขึ้นโดยผู้มีรายได้สูง)

ใน Left-Skewed Distribution (การกระจายเบ้ซ้าย - Negatively Skewed)

เมื่อข้อมูลมีหางยาวไปทางซ้าย:

Mean<Median<Mode\Large \text{Mean} < \text{Median} < \text{Mode}

Mean ถูกดึงไปทางหางโดยค่าต่ำมากๆ

ตัวอย่าง: คะแนนสอบที่นักเรียนส่วนใหญ่ได้คะแนนสูง (90) แต่มีบางคนได้คะแนนต่ำมาก

สูตรความสัมพันธ์เชิงประจักษ์ (Empirical Relationship)

สำหรับการกระจายที่เบ้ปานกลาง มีความสัมพันธ์โดยประมาณ:

MeanMode3(MeanMedian)\Large \text{Mean} - \text{Mode} \approx 3(\text{Mean} - \text{Median})

ความสัมพันธ์เชิงประจักษ์นี้สามารถช่วยคุณประมาณตัววัดหนึ่งเมื่อคุณรู้อีกสองตัว แม้ว่าจะแม่นยำที่สุดสำหรับการกระจายแบบ Unimodal ที่เบ้ปานกลาง

เมื่อไหร่ควรใช้ Mean, Mode หรือ Median

แต่ละตัววัด Measure of Central Tendency มีกรณีใช้งานเฉพาะ:

ใช้ Mean เมื่อ:

  • ข้อมูลมีการกระจายแบบปกติ (สมมาตร รูประฆัง)
  • คุณต้องการพิจารณาค่าทั้งหมดในชุดข้อมูล
  • ทำการคำนวณทางสถิติเพิ่มเติม (Standard Deviation, Variance)

ใช้ Median เมื่อ:

  • ข้อมูลมีค่าผิดปกติหรือค่าสุดโต่ง
  • ข้อมูลเบ้ (ไม่มีการกระจายแบบปกติ)
  • วิเคราะห์รายได้ ราคาบ้าน หรือข้อมูลที่เบ้ขวาอื่นๆ
  • คุณต้องการตัววัดที่ทนต่อค่าสุดโต่ง

ใช้ Mode เมื่อ:

  • วิเคราะห์ข้อมูลเชิงหมวดหมู่ (สี ขนาด หมวดหมู่)
  • หาค่าที่พบบ่อยที่สุดหรือนิยมที่สุด
  • ข้อมูลมีหลายยอด (Bimodal หรือ Multimodal Distribution)
  • ทำงานกับข้อมูลแบบไม่ต่อเนื่อง (เบอร์รองเท้า จำนวนลูก)

สำหรับความเข้าใจที่ลึกซึ้งยิ่งขึ้นเกี่ยวกับแนวคิดเหล่านี้ อ่านบทความของเราเกี่ยวกับ Measure of Central Tendency คืออะไร

คำถามที่พบบ่อย

Mean คือค่าเฉลี่ยเลขคณิต (ผลรวมของค่าทั้งหมดหารด้วยจำนวนค่า) Median คือค่ากลางเมื่อเรียงข้อมูล Mode คือค่าที่พบบ่อยที่สุด Mean ใช้จุดข้อมูลทั้งหมดแต่ไวต่อค่าผิดปกติ Median ทนทานต่อค่าผิดปกติมากกว่า Mode เหมาะที่สุดสำหรับการหาค่าที่พบบ่อยที่สุดในข้อมูลเชิงหมวดหมู่หรือไม่ต่อเนื่อง
ได้ ชุดข้อมูลที่มีสอง Mode เรียกว่า Bimodal และที่มีมากกว่าสอง Mode เรียกว่า Multimodal ตัวอย่างเช่น ถ้าทั้งเบอร์ 7 และเบอร์ 9 ปรากฏ 6 ครั้งในข้อมูลเบอร์รองเท้า (ทั้งสองเป็นค่าที่พบบ่อยที่สุด) ชุดข้อมูลจะเป็น Bimodal ที่มี Mode เป็น 7 และ 9 บางชุดข้อมูลไม่มี Mode ถ้าค่าทั้งหมดปรากฏด้วยความถี่เท่ากัน
ใช้ Median แทน Mean เมื่อ: (1) ข้อมูลของคุณมีค่าผิดปกติหรือค่าสุดโต่ง (เช่น รายได้สูงมากๆ หนึ่งค่าทำให้ค่าเฉลี่ยเบ้) (2) ข้อมูลของคุณเบ้มากกว่าการกระจายแบบปกติ (3) คุณกำลังวิเคราะห์ราคาบ้าน เงินเดือน หรือข้อมูลที่เบ้ขวาอื่นๆ Median ให้การแทนค่า 'ทั่วไป' ได้ดีกว่าในสถานการณ์เหล่านี้เพราะไม่ได้รับผลกระทบจากค่าสุดโต่ง
สำหรับข้อมูลแบบจัดกลุ่ม (ข้อมูลในตารางความถี่) ให้คูณแต่ละค่าด้วยความถี่ของมัน รวมผลคูณทั้งหมด จากนั้นหารด้วยความถี่รวม: Mean = Σ(x × f) / Σf โดยที่ x คือแต่ละค่า และ f คือความถี่ของมัน ตัวอย่างเช่น ถ้าคะแนน 85 ปรากฏ 3 ครั้งและคะแนน 90 ปรากฏ 5 ครั้ง: (85×3 + 90×5) / (3+5) = (255+450)/8 = 88.125
เมื่อ Mean, Median และ Mode เท่ากัน (หรือใกล้เคียงมาก) ข้อมูลของคุณมีแนวโน้มที่จะมีการกระจายแบบปกติและสมมาตร นี่บ่งชี้ถึงการกระจายที่สมดุลโดยไม่มีความเบ้ ในการกระจายแบบปกติที่สมบูรณ์แบบ (โค้งรูประฆัง) ตัววัดทั้งสามมาบรรจบกันที่ยอดกลาง นี่เป็นสิ่งที่เหมาะสมสำหรับการวิเคราะห์ทางสถิติหลายอย่าง
ได้ เมื่อ Mean มากกว่า Median ข้อมูลเบ้ขวา (Positively Skewed) หมายความว่ามีค่าสูงผิดปกติบางค่าที่ดึง Mean ขึ้น ตัวอย่างเช่น ในข้อมูลรายได้ ผู้มีรายได้สูงมากๆ ไม่กี่คนเพิ่ม Mean ขึ้นในขณะที่ Median ยังคงใกล้เคียงกับรายได้ทั่วไป เมื่อ Median มากกว่า Mean ข้อมูลเบ้ซ้าย (Negatively Skewed)
เมื่อมีจำนวนค่าเป็นเลขคู่ ให้หาค่าเฉลี่ยของสองค่ากลาง ตัวอย่างเช่น ด้วยข้อมูล [2, 4, 6, 8]: (1) จัดเรียงตามลำดับ (เรียงแล้ว) (2) หาสองค่ากลาง (4 และ 6) (3) คำนวณค่าเฉลี่ยของพวกมัน: (4+6)/2 = 5 Median คือ 5 แม้ว่าค่านี้จะไม่ปรากฏในชุดข้อมูล

สรุป

การคำนวณ Mean, Mode และ Median เป็นพื้นฐานสำหรับการทำความเข้าใจข้อมูลของคุณ แต่ละตัววัดให้ข้อมูลเชิงลึกที่ไม่เหมือนกันเกี่ยวกับ Central Tendency และการรู้ว่าเมื่อไหร่ควรใช้แต่ละตัวเป็นสิ่งสำคัญสำหรับการวิเคราะห์ข้อมูลที่แม่นยำ

ไม่ว่าคุณจะคำนวณตัววัดเหล่านี้ด้วยตัวเองสำหรับชุดข้อมูลขนาดเล็ก ใช้ฟังก์ชัน Excel สำหรับการวิเคราะห์อย่างรวดเร็ว หรือใช้ประโยชน์จาก R สำหรับงานทางสถิติที่ซับซ้อน เครื่องมือเหล่านี้เป็นรากฐานของ Descriptive Statistics การทำความเข้าใจ Standard Deviation และ Variance จะช่วยเพิ่มพูนทักษะการวิเคราะห์ทางสถิติของคุณต่อไป

ฝึกฝนกับชุดข้อมูลที่แตกต่างกันเพื่อพัฒนาสัญชาตญาณเกี่ยวกับว่าตัววัดใดแทน Central Tendency ของข้อมูลของคุณได้ดีที่สุด