Siêu thị PDFTải ngay đi em, trời tối mất

Thư viện tri thức trực tuyến

Kho tài liệu với 50,000+ tài liệu học thuật

© 2023 Siêu thị PDF - Kho tài liệu học thuật hàng đầu Việt Nam

Nhap_Mon_Ly_Thuyet_Xac_Suat_P2.pdf
MIỄN PHÍ
Số trang
41
Kích thước
580.3 KB
Định dạng
PDF
Lượt xem
1560

Nhap_Mon_Ly_Thuyet_Xac_Suat_P2.pdf

Nội dung xem thử

Mô tả chi tiết

NHẬP MÔN LÍ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN

88

TIỂU CHỦ ĐỀ 3.8.

KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ

I. THÔNG TIN CƠ BẢN

Giả sử biến ngẫu nhiên X có hàm phân phối F(x, θ), trong đó θ là tham số.

Những giả thiết đặt ra đối với tham số θ của F(x, θ) ta gọi là giả thiết thống kê, thường kí

hiệu là H.

Những giả thiết đặt ra đối với tham số θ của F(x, θ) nhưng khác với H ta gọi là đối thiết,

thường kí hiệu là K.

Tham số θ ở đây có thể là giá trị trung bình, phương sai của biến ngẫu nhiên hoặc xác suất p

của biến cố A trong quan sát,...

Trong phần này ta giải quyết các bài toán:

– So sánh số trung bình của mẫu quan sát với số trung bình theo lí thuyết: độ sai lệch là đáng

kể hay không?

– So sánh tần suất của biến cố A trong mẫu quan sát với xác suất của biến cố A theo lí thuyết:

độ sai lệch là đáng kể hay không?

– So sánh hai số trung bình trên hai mẫu quan sát để rút ra hai số trung bình theo lí thuyết sai

lệch là đáng kể hay không?

– So sánh hai tần suất của biến cố A trong hai mẫu quan sát để rút ra hai xác suất của biến cố

A theo lí thuyết sai lệch có đáng kể hay không?

Để giải quyết các bài toán nêu trên, thông tin duy nhất ta có là các số liệu quan sát trên tập mẫu.

Vận dụng công cụ của lí thuyết xác suất ta sẽ tìm được miền T sao cho nếu mẫu (X1, ... Xn) ∈ T

thì ta bác bỏ giả thiết H, ngược lại, ta chấp nhận H cho đến khi có thông tin mới.

Miền T nói trên ta gọi là miền tiêu chuẩn.

Khi bác bỏ hay chấp nhận giải thiết H ta có thể mắc phải hai loại sai lầm dưới đây

- Sai lầm loại I: Ta bác bỏ giả thiết H trong khi H đúng;

- Sai lầm loại II: Ta chấp nhận giả thiết H trong khi H sai.

Ta cố gắng hạn chế tới mức tối thiểu cả hai loại sai lầm này. Nhưng khi kích thước mẫu cố

định thì điều này khó khả thi. Do vậy người ta thường cho phép được mắc sai lầm loại I với

xác suất α (thường gọi là mức ý nghĩa α hay độ tin cậy 1 – α). Sau đó hạn chế đến mức tối

thiểu việc mắc sai lầm loại II.

NHẬP MÔN LÍ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN

89

8.1. Kiểm định giá trị trung bình a của tổng thể có phương sai σ2 đã biết

Giả sử kết quả quan sát trên tập mẫu có kích thước n đại lượng X có phân phối chuẩn N(a, s2

),

với phương sai đã biết σ

2

ta nhận được dãy số liệu (X1, X2, ......Xn).

Ta kiểm định giả thiết H: a = a0 với đối thiết K: a ≠ a0 và mức ý nghĩa α (hay độ tin cậy 1 -

α).

Trước hết ta tính

0 |X a | n u ; − = σ

trong đó X là trung bình mẫu.

- Nếu u <

2

zα ; thì sự khác nhau là không có ý nghĩa hay ta chấp nhận giả thiết H: a = a0 với

mức ý nghĩa α (độ tin cậy 1 – α).

- Nếu u ≥

2

zα thì sự khác nhau có ý nghĩa hay ta chấp nhận đối thiết K: a ≠ a0 với mức ý

nghĩa α (độ tin cậy 1 – α).

Ở đây

2

Zα tra trong bảng 1 sao cho Φ(

2

zα ) = 1 – 2

α .

Chú ý:

Khi cỡ mẫu khỏ lớn, giả thiết về phõn phối chuẩn của X khụng cần ðặt ra.

Ví dụ 8.1

Nuôi 80 con lợn theo chế độ ăn riêng, sau hai tháng mức tăng trọng trung bình là 30kg. Hãy

kiểm định giả thiết H: a = 32 đối thiết a ≠ 32, với mức ý nghĩa α = 5%, σ

2

= 25.

Giải:

Ở đây ta có n = 80, X80 = 30, σ

2

= 25, α = 0,05.

Tra bảng ta được z0,025 = 1,96.

Ta có

0,05

| 30 32 | 80 u 3,58 5

− = = .

Vì 3,58 > 1,96 nên ta bác bỏ giả thiết H (chấp nhận đối thiết K).

Chú ý:

Ý nghĩa thực tiễn của số liệu trên đây là: Nếu mức tăng trọng trung bình của lợn khi ăn theo

chế độ bình thường là 32kg thì khi cho ăn theo chế độ đặc biệt mức tăng trọng trung bình sẽ

khác 32kg.

NHẬP MÔN LÍ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN

90

Ví dụ 8.2

Các cây giống trong một vườn ươm có chiều cao trung bình chưa xác định. Để xác định chiều

cao trung bình của các cây giống trong vườn ươm, người ta chọn ngẫu nhiên 35 cây trong

vườn, đo chiều cao của 35 cây đó và tính được chiều cao trung bình X = 1,1m.

Theo quy định của bộ phận kĩ thuật thì khi nào cây giống cao trên 1m mới đem trồng để đảm

bảo tỉ lệ sống cao. Hỏi các cây giống đã đạt tiêu chuẩn chưa? Biết rằng phương sai trong quan

sát này σ

2

= 0,01, với mức ý nghĩa α = 0,1

Giải:

Ở đây ta có n = 35, X = 1,1, σ = 0,01 = 0,1 và α = 0,1, tra bảng ta được Z0,05 = 1,65.

Giả thiết H: a = 1,0; đơn thiết K: a > 1,0.

Ta có

|1,1 1| 35 U 5,92 0,1

− = = .

Vì 5,92 > 1,65 nên ta bác bỏ giả thiết H (chấp nhận đối thiết K). Vậy cây trong vườn đã đem

trồng được rồi.

8.2. Kiểm định giá trị trung bình của tổng thể khi phương sai chưa biết

Giả sử kết quả quan sát về X với phân phối chuẩn N(a, σ

2

), trên tập mẫu có kích thước n (với

phương sai chưa biết) ta nhận được dãy số liệu (X1, X2,..., Xn).

Ta kiểm định giả thiết H: a = a0 với đối thiết a ≠ a0 và mức ý nghĩa α (hay độ tin cậy 1– α).

Trước hết ta tính:

n 0 |X a | n 1 M , S

− − = trong đó Xn là trung bình mẫu, S là độ lệch chuẩn của mẫu, xác

định bởi công thức:

n 2 n k

k 1

1 S (X X ) n 1 =

= − − ∑

- Nếu M <

2

t (n 1) α − thì ta chấp nhận giả thiết H: a = a0 với mức ý nghĩa α (độ tin cậy 1 – α).

- Nếu M ≥

2

t (n 1) α − thì ta bác bỏ giả thiết H hay chấp nhận đối thiết K: a ≠ a0 .

Ở đây

2

t (n 1) α − tra trong bảng phân phối Student với n – 1 bậc tự do.

Chú ý: Khi n khá lớn thì không đòi hỏi X có phân phối chuẩn, còn

2

t (n 1) α − được thay bởi

2

NHẬP MÔN LÍ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN

91

Ví dụ 8.3

Trọng lượng tiêu chuẩn của một gói kẹo xuất xưởng là 300g. Người ta chọn ngẫu nhiên 60 gói

kẹo trong lô hàng xuất xưởng đem cân và nhận được trọng lượng trung bình của 60 gói đó là

299,3g và độ lệch chuẩn S = 7,2. Hỏi với mức ý nghĩa α = 0,05 trọng lượng của các gói kẹo

xuất xưởng có đạt tiêu chuẩn không?

Giải:

Tra bảng ta được z0,025 = 1,96.

Ta có:

299,3 300 60

M 0,75. 7,2

− = ≈

Vì 0,75 < 1,96 nên ta chấp nhận giả thiết H tức là trọng lượng trung bình của các gói kẹo xuất

xưởng bằng 300g với độ tin cậy 95%.

8.3. Kiểm định giả thiết về tỉ lệ hay xác suất p

Giả sử kết quả quan sát trên tập mẫu có kích thước n ≥ 30 ta thấy có k lần xuất hiện biến cố A.

Ta kiểm định tỉ lệ hay xác suất p của biến cố A với giả thiết H: p = p0 với đối thiết K: p ≠ p0

và mức ý nghĩa α (hay độ tin cậy 1 - α)

Trước hết ta tính:

0

0 0

pp n

V

p (1 p )

= − , trong đó k

p

n = là tần suất của biến cố A trong n quan sát.

- Nếu V <

2

zα thì ta chấp nhận giả thiết H với mức ý nghĩa α.

- Nếu V ≥

2

zα thì ta bác bỏ giả thiết H hay chấp nhận đối thiết K.

Ở đây

2

zα tra trong bảng phân phối chuẩn sao cho Φ (

2

zα ) = 1 – 2

α .

Ví dụ 8.4

Ở một địa phương tỉ lệ mắc bệnh A đã được xác định nhiều lần là 34%. Sau một đợt điều trị

bằng một loại thuốc, người ta kiểm tra lại 120 người thấy 24 còn người mắc bệnh A.

Hỏi với độ tin cậy 95%, tỉ lệ người mắc bệnh A ở địa phương đó có thay đổi không?

Giải:

Ở đây ta có n = 120; 24

p 120

= = 0,2; α = 0,05.

Tải ngay đi em, còn do dự, trời tối mất!