Kiểm tra T là một cách để quyết định xem có sự khác biệt có ý nghĩa thống kê giữa các tập dữ liệu hay không bằng cách sử dụng phân phối t của Sinh viên. Bài kiểm tra T trong Excel là bài kiểm tra T gồm hai mẫu so sánh giá trị trung bình của hai mẫu. Bài viết này giải thích ý nghĩa thống kê và chỉ ra cách thực hiện Kiểm tra T trong Excel.
Hướng dẫn trong bài viết này áp dụng cho Excel 2019, 2016, 2013, 2010, 2007; Excel cho Microsoft 365 và Excel Online.
Ý nghĩa Thống kê là gì?
Hãy tưởng tượng bạn muốn biết viên nào trong hai viên xúc xắc sẽ cho điểm cao hơn. Bạn tung con xúc xắc đầu tiên và nhận được số 2; bạn tung con xúc xắc thứ hai và nhận được con số 6. Điều này có cho bạn biết rằng lần chết thứ hai thường cho điểm cao hơn không? Nếu bạn trả lời, "Tất nhiên là không", thì bạn đã có một số hiểu biết về ý nghĩa thống kê. Bạn hiểu sự khác biệt là do sự thay đổi ngẫu nhiên trong điểm số, mỗi lần lăn một con súc sắc. Vì mẫu rất nhỏ (chỉ một cuộn) nên không hiển thị bất kỳ điều gì đáng kể.
Bây giờ hãy tưởng tượng bạn lăn từng con xúc xắc 6 lần:
- Con súc sắc đầu tiên cuộn 3, 6, 6, 4, 3, 3; Trung bình=4,17
- Con súc sắc thứ hai cuộn 5, 6, 2, 5, 2, 4; Trung bình=4,00
Điều này có chứng minh được con xúc sắc đầu tiên cho điểm cao hơn con thứ hai không? Chắc là không. Một mẫu nhỏ với sự khác biệt tương đối nhỏ giữa các giá trị có thể làm cho sự khác biệt vẫn là do các biến thể ngẫu nhiên. Khi chúng ta tăng số lần tung xúc xắc, rất khó để đưa ra câu trả lời thông thường cho câu hỏi - sự khác biệt giữa các điểm số là kết quả của sự biến đổi ngẫu nhiên hay một cái thực sự có nhiều khả năng cho điểm cao hơn cái kia?
Ý nghĩa là xác suất mà sự khác biệt quan sát được giữa các mẫu là do các biến thể ngẫu nhiên. Mức ý nghĩa thường được gọi là mức alpha hoặc đơn giản là 'α.' Mức độ tin cậy, hay đơn giản là 'c,' là xác suất mà sự khác biệt giữa các mẫu không phải là do biến thể ngẫu nhiên; nói cách khác, có sự khác biệt giữa các quần thể cơ bản. Do đó: c=1 - α
Chúng tôi có thể đặt 'α' ở bất kỳ mức nào chúng tôi muốn, để cảm thấy tự tin rằng chúng tôi đã chứng minh được tầm quan trọng. Rất thường xuyên sử dụng α=5% (độ tin cậy 95%), nhưng nếu chúng ta muốn thực sự chắc chắn rằng bất kỳ sự khác biệt nào không phải do biến thể ngẫu nhiên gây ra, chúng ta có thể áp dụng mức độ tin cậy cao hơn, sử dụng α=1% hoặc thậm chí α=0,1 %.
Các thử nghiệm thống kê khác nhau được sử dụng để tính toán mức độ quan trọng trong các tình huống khác nhau. Kiểm tra T được sử dụng để xác định xem phương tiện của hai quần thể có khác nhau hay không và kiểm định F được sử dụng để xác định xem các phương sai có khác nhau hay không.
Tại sao phải Kiểm tra Ý nghĩa Thống kê?
Khi so sánh những thứ khác nhau, chúng ta cần sử dụng thử nghiệm ý nghĩa để xác định xem cái nào tốt hơn cái kia. Điều này áp dụng cho nhiều trường, ví dụ:
- Trong kinh doanh, mọi người cần so sánh các sản phẩm và phương pháp tiếp thị khác nhau.
- Trong thể thao, mọi người cần so sánh các thiết bị, kỹ thuật và đối thủ khác nhau.
- Trong kỹ thuật, mọi người cần so sánh các thiết kế và cài đặt thông số khác nhau.
Nếu bạn muốn kiểm tra xem thứ nào đó hoạt động tốt hơn thứ khác, trong bất kỳ lĩnh vực nào, bạn cần phải kiểm tra ý nghĩa thống kê.
Phân phối T của Sinh viên là gì?
A Phân phối t của Student tương tự như phân phối chuẩn (hoặc Gaussian). Đây đều là các phân phối hình chuông với hầu hết các kết quả gần với giá trị trung bình, nhưng một số sự kiện hiếm hoi nằm khá xa giá trị trung bình theo cả hai hướng, được gọi là các phần đuôi của phân phối.
Hình dạng chính xác của phân phối t của Sinh viên phụ thuộc vào kích thước mẫu. Đối với các mẫu hơn 30, nó rất giống với phân phối chuẩn. Khi kích thước mẫu được giảm xuống, các phần đuôi sẽ lớn hơn, thể hiện độ không chắc chắn tăng lên do suy luận dựa trên một mẫu nhỏ.
Cách Làm Bài kiểm tra T trong Excel
Trước khi bạn có thể áp dụng T-Test để xác định liệu có sự khác biệt có ý nghĩa thống kê giữa giá trị trung bình của hai mẫu hay không, trước tiên bạn phải thực hiện F-Test. Điều này là do các phép tính khác nhau được thực hiện cho T-Test tùy thuộc vào việc có sự khác biệt đáng kể giữa các phương sai hay không.
Bạn sẽ cần bật bổ trợ Analysis Toolpakđể thực hiện phân tích này.
Kiểm tra và Tải Công cụ Phân tích Bổ trợ
Để kiểm tra và kích hoạt Phân tích Toolpak, hãy làm theo các bước sau:
- Chọn tab FILE> chọn Options.
- Trong hộp thoại Tùy chọn, chọn Bổ trợtừ các tab ở phía bên trái.
-
Ở cuối cửa sổ, chọn menu thả xuống Quản lý, sau đó chọn Excel Add-in. Chọn Đi.
- Đảm bảo chọn hộp kiểm bên cạnh Analysis Toolpak, sau đó chọn OK.
- Phân tích Toolpak hiện đang hoạt động và bạn đã sẵn sàng áp dụng F-Test và T-Test.
Thực hiện Kiểm tra F và Kiểm tra T trong Excel
-
Nhập hai tập dữ liệu vào một bảng tính. Trong trường hợp này, chúng tôi đang xem xét doanh số của hai sản phẩm trong một tuần. Giá trị bán hàng trung bình hàng ngày cho mỗi sản phẩm cũng được tính toán, cùng với độ lệch chuẩn của nó.
-
Chọn tab Dữ liệu> Phân tích Dữ liệu
-
Chọn F-Kiểm tra hai mẫu cho các phương saitừ danh sách, sau đó chọn OK.
F-Test rất nhạy cảm với tính không chuẩn. Do đó, có thể an toàn hơn khi sử dụng kiểm tra Welch, nhưng điều này khó hơn trong Excel.
-
Chọn Phạm vi biến 1 và Phạm vi biến 2; đặt Alpha (0,05 cho độ tin cậy 95%); chọn một ô cho góc trên cùng bên trái của đầu ra, coi rằng ô này sẽ lấp đầy 3 cột và 10 hàng. Chọn OK.
Đối với Phạm vi cho Biến 1, phải chọn mẫu có độ lệch chuẩn (hoặc phương sai) lớn nhất.
-
Xem kết quả F-Test để xác định liệu có sự khác biệt đáng kể giữa các phương sai hay không. Kết quả cho ba giá trị quan trọng:
- F: Tỷ lệ giữa các phương sai.
- P (F<=f) một đuôi: Xác suất để biến 1 không thực sự có phương sai lớn hơn biến 2. Nếu biến này lớn hơn alpha, thì nói chung là 0,05, sau đó không có sự khác biệt đáng kể giữa các phương sai.
- F Một đuôi quan trọng: Giá trị của F cần cung cấp cho P (F<=f)=α. Nếu giá trị này lớn hơn F, điều này cũng cho thấy không có sự khác biệt đáng kể giữa các phương sai.
P (F<=f) cũng có thể được tính bằng cách sử dụng hàm FDIST với F và bậc tự do cho mỗi mẫu làm đầu vào của nó. Bậc tự do chỉ đơn giản là số lần quan sát trong một mẫu trừ đi một.
-
Bây giờ bạn đã biết liệu có sự khác biệt giữa các phương sai hay không, bạn có thể chọn T-Test thích hợp. Chọn tab Data> Data Analysis, sau đó chọn t-Test: Two-Sample Assuming Equal Variancehoặc t-Kiểm định: Giả sử hai mẫu có các phương sai không bằng nhau
-
Bất kể bạn đã chọn tùy chọn nào trong bước trước, bạn sẽ được hiển thị cùng một hộp thoại để nhập chi tiết phân tích. Để bắt đầu, hãy chọn các phạm vi chứa các mẫu cho Biến 1 Phạm vivà Biến 2 Phạm vi.
- Giả sử bạn muốn kiểm tra không có sự khác biệt giữa các phương tiện, hãy đặt Sự khác biệt trung bình theo giả thuyếtthành 0.
- Đặt mức ý nghĩa Alpha (0,05 cho độ tin cậy 95%) và chọn một ô ở góc trên cùng bên trái của kết quả, coi như ô này sẽ lấp đầy 3 cột và 14 hàng. Chọn OK.
-
Xem lại kết quả để quyết định xem có sự khác biệt đáng kể giữa các phương tiện hay không.
Cũng như với F-Test, nếu giá trị p, trong trường hợp này là P (T<=t), lớn hơn alpha, thì không có sự khác biệt đáng kể. Tuy nhiên, trong trường hợp này có hai giá trị p được đưa ra, một giá trị cho phép thử một đuôi và giá trị kia cho phép thử hai đuôi. Trong trường hợp này, hãy sử dụng giá trị hai đuôi vì một trong hai biến có giá trị trung bình lớn hơn sẽ là một sự khác biệt đáng kể.