Khoảng Biến Thiên và Khoảng Tứ Phân Vị của Mẫu Số Liệu Ghép Nhóm
Khoảng biến thiên
-
Khoảng biến thiên (ký hiệu là R) của mẫu số liệu ghép nhóm là hiệu số giữa đầu mút phải của nhóm cuối cùng và đầu mút trái của nhóm đầu tiên chứa dữ liệu.
-
Ví dụ:
Nhóm | [u1; u2) | [u2; u3) | … | [uk; uk+1) |
---|---|---|---|---|
Tần số | n1 | n2 | … | nk |
Nếu n1 và nk đều khác 0 thì R = uk+1 – u1.
-
Khoảng biến thiên của mẫu số liệu ghép nhóm luôn lớn hơn hoặc bằng khoảng biến thiên của mẫu số liệu gốc.
-
Ý nghĩa:
- Khoảng biến thiên của mẫu số liệu ghép nhóm xấp xỉ khoảng biến thiên của mẫu số liệu gốc, giúp đo mức độ phân tán của mẫu số liệu.
- Tuy nhiên, R = uk+1 – u1 chưa phản ánh đầy đủ mức độ phân tán của đa số số liệu. Giá trị R có thể tăng mạnh khi xuất hiện giá trị ngoại lệ. Vì vậy, cần sử dụng thêm các số đặc trưng khác để đánh giá mức độ phân tán.
Khoảng tứ phân vị
-
Khoảng tứ phân vị (ký hiệu ΔQ) của mẫu số liệu ghép nhóm là hiệu giữa tứ phân vị thứ ba (Q3) và tứ phân vị thứ nhất (Q1): ΔQ = Q3 – Q1.
-
Cách xác định tứ phân vị thứ i (Qi, với i = 1, 2, 3):
Qi = um + [(in/4 - C) / nm] * (um+1 - um)
Trong đó:
- n = n1 + n2 + … + nk là cỡ mẫu.
- [um; um+1) là nhóm chứa tứ phân vị thứ i.
- nm là tần số của nhóm chứa tứ phân vị thứ i.
- C = n1 + n2 + … + nm-1.
- Ý nghĩa:
- Khoảng tứ phân vị của mẫu số liệu ghép nhóm xấp xỉ khoảng tứ phân vị của mẫu số liệu gốc, đo mức độ phân tán của 50% số liệu nằm giữa mẫu số liệu.
- ΔQ càng nhỏ, dữ liệu càng tập trung quanh trung vị.
- Xác định giá trị ngoại lệ: x là giá trị ngoại lệ nếu x > Q3 + 1.5ΔQ hoặc x < Q1 – 1.5ΔQ. (Đây là định nghĩa giá trị ngoại lệ trong mẫu số liệu ghép nhóm)
- Khoảng tứ phân vị ít bị ảnh hưởng bởi giá trị ngoại lệ.
Bài Tập Về Khoảng Biến Thiên và Khoảng Tứ Phân Vị
Bài tập 1
alt
Một bảng số liệu về số thẻ vàng của các câu lạc bộ bóng đá. Yêu cầu tính khoảng biến thiên và khoảng tứ phân vị cho cả mẫu số liệu gốc và mẫu số liệu ghép nhóm.
Bài tập 2
Một bảng số liệu về thu nhập của công nhân tại hai nhà máy A và B. Yêu cầu tính mức thu nhập trung bình và khoảng tứ phân vị cho mỗi nhà máy, sau đó so sánh mức độ biến động thu nhập giữa hai nhà máy.
Bài tập 3
Một bảng số liệu về chiều cao của học sinh lớp 12A và 12B. Yêu cầu tính khoảng biến thiên và khoảng tứ phân vị cho mỗi lớp, sau đó so sánh độ phân tán về chiều cao giữa hai lớp.
Bài tập 4
alt
Một bảng số liệu về lượng mưa tháng 7 tại Cà Mau từ năm 2002 đến 2021. Yêu cầu tính khoảng biến thiên và khoảng tứ phân vị cho mẫu số liệu gốc và mẫu số liệu ghép nhóm.
Bài tập 5
Một biểu đồ về số lượt đặt bàn trực tuyến của một nhà hàng trong quý III năm 2022. Yêu cầu tính khoảng tứ phân vị cho mẫu số liệu ghép nhóm.
Bài tập 6
Một bảng số liệu về chiều cao của 100 cây keo. Yêu cầu tính khoảng biến thiên, khoảng tứ phân vị và xác định giá trị ngoại lệ (nếu có).
Bài tập 7
alt
Một bảng số liệu về độ tuổi của các thành viên nam và nữ trong một câu lạc bộ dưỡng sinh. Yêu cầu tính khoảng tứ phân vị cho cả nam và nữ, sau đó so sánh độ đồng đều về tuổi giữa hai nhóm.
Ý kiến bạn đọc (0)