Hypothesis testing là gì

  -  

Các vấn đề cơ bản cần chú ý khi học Reading 11 trong chương trình CFA level 1

1. Một số khái niệm cơ bản

1.1. Giả thuyết và các bước kiểm định giả thuyết

Giả thuyết (hypothesis) là một mệnh đề về một hoặc nhiều tổng thể.

Bạn đang xem: Hypothesis testing là gì

Các bước kiểm định giả thuyết bao gồm:

1.2. Giả thuyết không và giả thuyết đối

Giả thuyết không (null hypothesis) – ký hiệu H0, là giả thuyết được kiểm định. Giả thuyết không là một mệnh đề được cho là đúng, trừ khi mẫu dùng trong kiểm định đưa ra bằng chứng thuyết phục là mệnh đề này sai.

Giả thuyết đối/giả thuyết nghịch/đối thuyết (alternative hypothesis) – ký hiệu Ha, là giả thuyết được chấp nhận nếu giả thuyết không bị bác bỏ.

Lưu ý:

Kiểm định giả thuyết thống kê không thể chứng minh một cách tuyệt đối giả thuyết nào đúng, giả thuyết nào sai mà chỉ có thể kết luận chấp nhận/bác bỏ một giả thuyết với một xác suất sai lầm nhất định. Giả thuyết không là giả thuyết được kỳ vọng bị bác bỏ để chấp nhận giả thuyết đối.Giả thuyết không luôn bao gồm điều kiện “=”. Ví dụ:1.3. Kiểm định một bên và kiểm định hai bên

Kiểm định một phía

(one-sided/one-tailed hypothesis test)

Kiểm định hai phía

(two-sided/two-tailed hypothesis test)

Bác bỏ Ho nếu giá trị thống kê kiểm định lớn hơn giá trị tới hạn.

Bác bỏ nếu giá trị thống kê kiểm định (test statistic) > giá trị tới hạn trên hoặc giá trị thống kê kiểm định (test statistic)

1.4. Giá trị thống kê và giá trị tới hạn

Kiểm định giả thuyết thống kê liên quan tới việc so sánh hai giá trị: giá trị thống kê kiểm định (test statistic) và giá trị tới hạn của thống kê kiểm định (critical value).

Giá trị thống kê kiểm định (test statistic) là một đại lượng thường được tính bởi công thức và giá trị của đại lượng này là cơ sở để kết luận có bác bỏ giả thuyết H0 hay không.Giá trị tới hạn (critical value/rejection point) là giá trị để so sánh với giá trị thống kê kiểm định và đưa ra kết luận có bác bỏ giả thuyết H0 hay không.1.5. Mức ý nghĩa và lực kiểm định

Kết luận từ kiểm định giả thuyết thống kê luôn tồn tại sai lầm với một xác suất nhất định, chia làm hai loại: sai lầm loại I (type I error) và sai lầm loại II (type II error).

Mức ý nghĩa (level of significance) của kiểm định là xác suất xảy ra sai lầm loại I – bác bỏ khi đúng, ký hiệu α.

Xác suất xảy ra sai lầm loại II – không bác bỏ khi sai, ký hiệu β.

Xác suất xảy ra sai lầm loại I và xác suất xảy ra sai lầm loại II mang tính đánh đổi. Các yếu tố khác không thay đổi, nếu α giảm thì β tăng và ngược lại. Cách duy nhất để giảm đồng thời cả và là tăng kích thước mẫu.

Lực kiểm định (power of a test) là xác xuất bác bỏ khi sai (kết luận đúng). Các yếu tố khác không thay đổi, nếu nhiều thống kê kiểm định có thể sử dụng cho một giả thuyết thì ta nên chọn thống kê kiểm định có lực kiểm định lớn nhất.

1.6. Mối quan hệ giữa khoảng tin cậy và kiểm định giả thuyết

Khoảng tin cậy (confidence interval) là một khoảng giá trị xung quanh giá trị kỳ vọng, mà ta kỳ vọng xác suất nó bao hàm giá trị thực là 100(1 – α) %, với α là mức ý nghĩa.

Khoảng tin cậy được xác định bởi công thức:

(Tham số mẫu – Giá trị tới hạn x Sai số chuẩn) ≤ Tham số tổng thể

≤ (Tham số mẫu + Giá trị tới hạn x Sai số chuẩn)

Ví dụ, với mức ý nghĩa 5%, mức tin cậy 95%, nghĩa là xác suất để tham số tổng thể thuộc khoảng tin cậy bằng 95%.

Khoảng tin cậy và kiểm định giả thuyết liên quan đến nhau thông qua giá trị tới hạn. Khoảng giá trị mà tại đó ta không thể bác bỏ giả thuyết Ho (trong trường hợp kiểm định hai phía) có thể được viết lại như sau:

- Giá trị tới hạn ≤ Thống kê kiểm định ≤ + Giá trị tới hạn

1.7. Trị số p

Trị số p (p-value) là mức ý nghĩa thấp nhất mà giả thuyết không (Ho) có thể bị bác bỏ.

Kiểm định một phía:

Kiểm định bên trái: p-value là xác suất nằm phía dưới giá trị thống kê kiểm định tính đượcKiểm định bên phải: p-value là xác suất nằm phía trên giá trị thống kê kiểm định tính được

Kiểm định hai phía: p- value là tổng của xác suất nằm phía dưới giá trị thống kê kiểm định âm tính được cộng với xác suất nằm phía trên giá trị thống kê kiểm định dương tính được.

Xem thêm: Các Loại Mác Thép Cb400-V Là Gì ? Giá Bao Nhiêu Tiền? Các Loại Mác Thép Xây Dựng Thường Dùng

Ví dụ: Xét một phép kiểm định hai phía với giả thuyết về giá trị trung bình của tổng thể, với mức tin cậy 95%. Giá trị kiểm định thông kê tính được là 2.3, cao hơn giá trị tới hạn = 1.96. Khi tra bảng phân phối z, ta có xác suất để nhận giá trị lớn hơn 2.3 là 1.07%. Vì đây là kiểm định hai phía, nên ta sẽ phải nhân đôi con số này lên (như hình) để tính ra p-value.

Vậy p-value = 2 x 1.07 = 2.14%

Kiểm định hai bên với trị số p là 2.14%.

2. Kiếm định giả thuyết liên quan đến giá trị trung bình

2.1. Kiểm định giả thuyết về trung bình của một tổng thể

Kiểm định t

Kiểm định z

Điều kiện áp dụng

(1) Không biết phương sai tổng thể, và tổng thể phân phối (xấp xỉ) chuẩn, hoặc

(2) Không biết phương sai tổng thể, tổng thể không phân phối chuẩn và kích thước mẫu n ≥ 30

(1) Biết phương sai tổng thể và tổng thể phân phối chuẩn, hoặc

(2) Biết phương sai tổng thể, tổng thể không phân phối chuẩn và kích thước mẫu n ≥ 30

Giả thuyết

Thống kê kiểm định

Giá trị thống kê kiểm định t với df = n – 1 được tính như sau:

(1), (2)

Giá trị thống kê kiểm định z được tính như sau:

(1)

(2)

Trong đó

= trung bình của mẫu

= trung bình giả thuyết của tổng thể

n = kích thước mẫu

(1), (2) s = độ lệch chuẩn của mẫu

(1) σ = độ lệch chuẩn của tổng thể

(2) s = độ lệch chuẩn của mẫu

Quy tắc ra quyết định

Bác bỏ H0 nếu:

(a) (b) (c) tương ứng với các cặp giả thuyết nêu trên

Bác bỏ H0 nếu:

(a) (b) (c) tương ứng với các cặp giả thuyết nêu trên

2.2. Kiểm định giả thuyết giá trị trung bình của hai tổng thể

Giả định phương sai hai tổng thể bằng nhau

Giả định phương sai hai tổng thể không bằng nhau

Điều kiện áp dụng

Hai tổng thể độc lập với nhau.

Hai tổng thể tuân theo phân phối chuẩn.

Giả thuyết

Thống kê kiểm định

Thống kê t

với phương sai tổng hợp (pooled variance)

Thống kê t

Trong đó

= phương sai của mẫu thứ nhất

= phương sai của mẫu thứ hai

= số quan sát ở mẫu thứ nhất

= số quan sát ở mẫu thứ hai

Quy tắc ra quyết định

Bác bỏ nếu:

(a) (b) (c) tương ứng với các cặp giả thuyết nêu trên

2.3. Kiểm định giả thuyết về trung bình của độ chênh lệch của hai tổng thể

Điều kiện áp dụng:

Hai tổng thể cùng phụ thuộc vào yếu tổ thứ ba nào đó. Khi đó, ta có thể thực hiện kiểm định so sánh theo cặp (paired comparisons) để kết luận liệu trung bình của độ chênh lệch giữa các quan sát của hai mẫu có khác nhau không.Hai tổng thể tuân theo phân phối chuẩn

Giả thuyết:

Trong đó:

*

Thống kê kiểm định: Thống kê t với df = n – 1 được tính như sau:

Trong đó:

Quy tắc ra quyết định: Bác bỏ Honếu:

(a) (b) (c) tương ứng với các cặp giả thuyết nêu trên.

3. Kiểm định giả thuyết liên quan đến phương sai và hệ số tương quan

3.1. Kiểm định giả thuyết về phương sai của một tổng thể

Điều kiện áp dụng: Tổng thể tuân theo phân phối chuẩn.

Giả thuyết:

Thống kê kiểm định: Thống kê chi bình phương (chi-square), ký hiệu với df = n – 1 được tính như sau:

với

Trong đó:

Phân phối chi bình phương là một họ phân phối thay đổi khi số bậc tự do thay đổi. Phân phối chi bình phương bất đối xứng và không bao giờ mang giá trị âm (giới hạn dưới bởi điểm 0).

Quy tắc ra quyết định: Bác bỏ nếu

(a) (b) (c) tương ứng với các cặp giả thuyết nêu trên

3.2. Kiểm định giả thuyết về phương sai của hai tổng thể

Điều kiện áp dụng: Hai tổng thể tuân theo phân phối chuẩn và độc lập với nhau.

Giả thuyết:

Trong đó:

Lưu ý: Để thuận tiện, luôn chọn mẫu thứ nhất là mẫu có phương sai lớn hơn.

Quy tắc ra quyết định: Bác bỏ nếu:

(a) (b) (c) tương ứng với các cặp giả thuyết nêu trên.

3.3. Kiểm định giả thuyết về hệ số tương quan giữa hai biến ngẫu nhiên

Điều kiện áp dụng: Hai biến ngẫu nhiên tuân theo phân phối chuẩn.

Giả thuyết:

Thống kê kiểm định: Thống kê t với df = n – 2 được tính như sau:

Trong đó: r là hệ số tương quan của mẫu

n là kích thước của mẫu

4. Kiểm định phi tham số

Kiểm định tham số (parametric tests) được thực hiện dựa trên giả định (assumptions) về phân phối của tổng thể và đưa ra giả thuyết cụ thể về tham số tổng thể.

Kiểm định phi tham số (nonparametric tests) không quan tâm đến tham số tổng thể cụ thể nào hoặc có rất ít giả định về tổng thể. Kiểm định phi tham số áp dụng khi số lượng là yếu tố được quan tâm hơn so với tham số của phân phối hoặc khi dữ liệu hoặc phân phối không thỏa mãn giả thuyết của kiểm định tham số.

Xem thêm: Quyền Trẻ Em Là Gì ❣️Tại Sao Cần Phải Tôn Trọng Quyền Trẻ Em

Kiểm định tương quan hạng Spearman (the Spearman rank correlation test) có thể sử dụng khi dữ liệu không tuân theo phân phối chuẩn.