Thư viện tri thức trực tuyến
Kho tài liệu với 50,000+ tài liệu học thuật
© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Nhập môn Lý thuyết xác xuất thống kê - Phần II
Nội dung xem thử
Mô tả chi tiết
NHẬP MÔN LÍ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN
88
TIỂU CHỦ ĐỀ 3.8.
KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
I. THÔNG TIN CƠ BẢN
Giả sử biến ngẫu nhiên X có hàm phân phối F(x, θ), trong đó θ là tham số.
Những giả thiết đặt ra đối với tham số θ của F(x, θ) ta gọi là giả thiết thống kê, thường kí
hiệu là H.
Những giả thiết đặt ra đối với tham số θ của F(x, θ) nhưng khác với H ta gọi là đối thiết,
thường kí hiệu là K.
Tham số θ ở đây có thể là giá trị trung bình, phương sai của biến ngẫu nhiên hoặc xác suất p
của biến cố A trong quan sát,...
Trong phần này ta giải quyết các bài toán:
– So sánh số trung bình của mẫu quan sát với số trung bình theo lí thuyết: độ sai lệch là đáng
kể hay không?
– So sánh tần suất của biến cố A trong mẫu quan sát với xác suất của biến cố A theo lí thuyết:
độ sai lệch là đáng kể hay không?
– So sánh hai số trung bình trên hai mẫu quan sát để rút ra hai số trung bình theo lí thuyết sai
lệch là đáng kể hay không?
– So sánh hai tần suất của biến cố A trong hai mẫu quan sát để rút ra hai xác suất của biến cố
A theo lí thuyết sai lệch có đáng kể hay không?
Để giải quyết các bài toán nêu trên, thông tin duy nhất ta có là các số liệu quan sát trên tập mẫu.
Vận dụng công cụ của lí thuyết xác suất ta sẽ tìm được miền T sao cho nếu mẫu (X1, ... Xn) ∈ T
thì ta bác bỏ giả thiết H, ngược lại, ta chấp nhận H cho đến khi có thông tin mới.
Miền T nói trên ta gọi là miền tiêu chuẩn.
Khi bác bỏ hay chấp nhận giải thiết H ta có thể mắc phải hai loại sai lầm dưới đây
- Sai lầm loại I: Ta bác bỏ giả thiết H trong khi H đúng;
- Sai lầm loại II: Ta chấp nhận giả thiết H trong khi H sai.
Ta cố gắng hạn chế tới mức tối thiểu cả hai loại sai lầm này. Nhưng khi kích thước mẫu cố
định thì điều này khó khả thi. Do vậy người ta thường cho phép được mắc sai lầm loại I với
xác suất α (thường gọi là mức ý nghĩa α hay độ tin cậy 1 – α). Sau đó hạn chế đến mức tối
thiểu việc mắc sai lầm loại II.
NHẬP MÔN LÍ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN
89
8.1. Kiểm định giá trị trung bình a của tổng thể có phương sai σ2 đã biết
Giả sử kết quả quan sát trên tập mẫu có kích thước n đại lượng X có phân phối chuẩn N(a, s2
),
với phương sai đã biết σ
2
ta nhận được dãy số liệu (X1, X2, ......Xn).
Ta kiểm định giả thiết H: a = a0 với đối thiết K: a ≠ a0 và mức ý nghĩa α (hay độ tin cậy 1 -
α).
Trước hết ta tính
0 |X a | n u ; − = σ
trong đó X là trung bình mẫu.
- Nếu u <
2
zα ; thì sự khác nhau là không có ý nghĩa hay ta chấp nhận giả thiết H: a = a0 với
mức ý nghĩa α (độ tin cậy 1 – α).
- Nếu u ≥
2
zα thì sự khác nhau có ý nghĩa hay ta chấp nhận đối thiết K: a ≠ a0 với mức ý
nghĩa α (độ tin cậy 1 – α).
Ở đây
2
Zα tra trong bảng 1 sao cho Φ(
2
zα ) = 1 – 2
α .
Chú ý:
Khi cỡ mẫu khỏ lớn, giả thiết về phõn phối chuẩn của X khụng cần ðặt ra.
Ví dụ 8.1
Nuôi 80 con lợn theo chế độ ăn riêng, sau hai tháng mức tăng trọng trung bình là 30kg. Hãy
kiểm định giả thiết H: a = 32 đối thiết a ≠ 32, với mức ý nghĩa α = 5%, σ
2
= 25.
Giải:
Ở đây ta có n = 80, X80 = 30, σ
2
= 25, α = 0,05.
Tra bảng ta được z0,025 = 1,96.
Ta có
0,05
| 30 32 | 80 u 3,58 5
− = = .
Vì 3,58 > 1,96 nên ta bác bỏ giả thiết H (chấp nhận đối thiết K).
Chú ý:
Ý nghĩa thực tiễn của số liệu trên đây là: Nếu mức tăng trọng trung bình của lợn khi ăn theo
chế độ bình thường là 32kg thì khi cho ăn theo chế độ đặc biệt mức tăng trọng trung bình sẽ
khác 32kg.
NHẬP MÔN LÍ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN
90
Ví dụ 8.2
Các cây giống trong một vườn ươm có chiều cao trung bình chưa xác định. Để xác định chiều
cao trung bình của các cây giống trong vườn ươm, người ta chọn ngẫu nhiên 35 cây trong
vườn, đo chiều cao của 35 cây đó và tính được chiều cao trung bình X = 1,1m.
Theo quy định của bộ phận kĩ thuật thì khi nào cây giống cao trên 1m mới đem trồng để đảm
bảo tỉ lệ sống cao. Hỏi các cây giống đã đạt tiêu chuẩn chưa? Biết rằng phương sai trong quan
sát này σ
2
= 0,01, với mức ý nghĩa α = 0,1
Giải:
Ở đây ta có n = 35, X = 1,1, σ = 0,01 = 0,1 và α = 0,1, tra bảng ta được Z0,05 = 1,65.
Giả thiết H: a = 1,0; đơn thiết K: a > 1,0.
Ta có
|1,1 1| 35 U 5,92 0,1
− = = .
Vì 5,92 > 1,65 nên ta bác bỏ giả thiết H (chấp nhận đối thiết K). Vậy cây trong vườn đã đem
trồng được rồi.
8.2. Kiểm định giá trị trung bình của tổng thể khi phương sai chưa biết
Giả sử kết quả quan sát về X với phân phối chuẩn N(a, σ
2
), trên tập mẫu có kích thước n (với
phương sai chưa biết) ta nhận được dãy số liệu (X1, X2,..., Xn).
Ta kiểm định giả thiết H: a = a0 với đối thiết a ≠ a0 và mức ý nghĩa α (hay độ tin cậy 1– α).
Trước hết ta tính:
n 0 |X a | n 1 M , S
− − = trong đó Xn là trung bình mẫu, S là độ lệch chuẩn của mẫu, xác
định bởi công thức:
n 2 n k
k 1
1 S (X X ) n 1 =
= − − ∑
- Nếu M <
2
t (n 1) α − thì ta chấp nhận giả thiết H: a = a0 với mức ý nghĩa α (độ tin cậy 1 – α).
- Nếu M ≥
2
t (n 1) α − thì ta bác bỏ giả thiết H hay chấp nhận đối thiết K: a ≠ a0 .
Ở đây
2
t (n 1) α − tra trong bảng phân phối Student với n – 1 bậc tự do.
Chú ý: Khi n khá lớn thì không đòi hỏi X có phân phối chuẩn, còn
2
t (n 1) α − được thay bởi
2
zα
NHẬP MÔN LÍ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN
91
Ví dụ 8.3
Trọng lượng tiêu chuẩn của một gói kẹo xuất xưởng là 300g. Người ta chọn ngẫu nhiên 60 gói
kẹo trong lô hàng xuất xưởng đem cân và nhận được trọng lượng trung bình của 60 gói đó là
299,3g và độ lệch chuẩn S = 7,2. Hỏi với mức ý nghĩa α = 0,05 trọng lượng của các gói kẹo
xuất xưởng có đạt tiêu chuẩn không?
Giải:
Tra bảng ta được z0,025 = 1,96.
Ta có:
299,3 300 60
M 0,75. 7,2
− = ≈
Vì 0,75 < 1,96 nên ta chấp nhận giả thiết H tức là trọng lượng trung bình của các gói kẹo xuất
xưởng bằng 300g với độ tin cậy 95%.
8.3. Kiểm định giả thiết về tỉ lệ hay xác suất p
Giả sử kết quả quan sát trên tập mẫu có kích thước n ≥ 30 ta thấy có k lần xuất hiện biến cố A.
Ta kiểm định tỉ lệ hay xác suất p của biến cố A với giả thiết H: p = p0 với đối thiết K: p ≠ p0
và mức ý nghĩa α (hay độ tin cậy 1 - α)
Trước hết ta tính:
0
0 0
pp n
V
p (1 p )
−
= − , trong đó k
p
n = là tần suất của biến cố A trong n quan sát.
- Nếu V <
2
zα thì ta chấp nhận giả thiết H với mức ý nghĩa α.
- Nếu V ≥
2
zα thì ta bác bỏ giả thiết H hay chấp nhận đối thiết K.
Ở đây
2
zα tra trong bảng phân phối chuẩn sao cho Φ (
2
zα ) = 1 – 2
α .
Ví dụ 8.4
Ở một địa phương tỉ lệ mắc bệnh A đã được xác định nhiều lần là 34%. Sau một đợt điều trị
bằng một loại thuốc, người ta kiểm tra lại 120 người thấy 24 còn người mắc bệnh A.
Hỏi với độ tin cậy 95%, tỉ lệ người mắc bệnh A ở địa phương đó có thay đổi không?
Giải:
Ở đây ta có n = 120; 24
p 120
= = 0,2; α = 0,05.