Hồi quy trong Excel là một cách để tự động hóa quá trình thống kê so sánh một số tập hợp thông tin để xem những thay đổi trong các biến độc lập ảnh hưởng như thế nào đến những thay đổi trong các biến phụ thuộc. Nếu bạn đã từng muốn tìm mối tương quan giữa hai điều, thì sử dụng phân tích hồi quy trong Excel là một trong những cách tốt nhất để làm điều đó.
Hướng dẫn trong bài viết này áp dụng cho Excel 2019, Excel 2016, Excel 2013, Excel 2010.
Ý nghĩa của hồi quy là gì?
Hồi quy là một cách tiếp cận mô hình thống kê mà các nhà phân tích sử dụng để xác định mối quan hệ giữa nhiều biến.
Phân tích hồi quy bắt đầu với một biến duy nhất mà bạn đang cố gắng phân tích và các biến độc lập mà bạn đang thử nghiệm để xem liệu chúng có ảnh hưởng đến biến duy nhất đó hay không. Phân tích xem xét những thay đổi trong các biến độc lập và cố gắng tương quan những thay đổi đó với những thay đổi kết quả trong biến đơn (phụ thuộc).
Điều này nghe có vẻ giống như thống kê nâng cao, nhưng Excel cung cấp phân tích phức tạp này cho bất kỳ ai.
Thực hiện hồi quy tuyến tính trong Excel
Hình thức phân tích hồi quy đơn giản nhất là hồi quy tuyến tính. Hồi quy tuyến tính đơn giản chỉ xem xét mối quan hệ giữa hai biến.
Ví dụ: bảng tính sau đây hiển thị dữ liệu chứa số calo một người ăn mỗi ngày và cân nặng của họ vào ngày đó.
Vì bảng tính này chứa hai cột dữ liệu và một biến có thể ảnh hưởng đến biến khác, bạn có thể chạy phân tích hồi quy trên dữ liệu này bằng Excel.
Bật Tiện ích Phân tích Công cụPak
Trước khi có thể sử dụng tính năng phân tích hồi quy của Excel, bạn cần bật tiện ích bổ trợ Analysis ToolPak trong màn hình Tùy chọn Excel.
-
Trong Excel, chọn menu Filevà chọn Options.
-
Chọn Bổ trợtrong menu điều hướng bên trái. Sau đó, đảm bảo rằng Phần bổ trợ Excel được chọn trong trường Quản lý.
-
Cuối cùng, chọn nút Go.
-
Trong cửa sổ bật lên Bổ trợ. Bật Analysis ToolPackbằng cách nhấp vào hộp phía trước nó để thêm dấu kiểm và chọn OK.
Giờ đây, Analysis ToolPak đã được bật, bạn đã sẵn sàng để bắt đầu thực hiện phân tích hồi quy trong Excel.
Cách thực hiện hồi quy tuyến tính đơn giản trong Excel
Sử dụng bảng tính cân nặng và calo làm ví dụ, bạn có thể thực hiện phân tích hồi quy tuyến tính trong Excel như sau.
-
Chọn menu Dữ liệu. Sau đó, trong nhóm Phân tích, chọn Phân tích Dữ liệu.
-
Trong cửa sổ Data Analysis, chọn Regressiontừ danh sách và nhấp vào OK.
-
Phạm vi đầu vào Y là phạm vi ô chứa biến phụ thuộc. Trong ví dụ này, đó là trọng lượng. Phạm vi Đầu vào Xlà phạm vi ô chứa biến độc lập. Trong ví dụ này, đó là cột calo.
-
Chọn Nhãncho các ô tiêu đề, sau đó chọn New Worksheet để gửi kết quả đến một trang tính mới. Chọn OKđể Excel chạy phân tích và gửi kết quả sang một trang tính mới.
-
Kiểm tra trang tính mới. Kết quả phân tích có một số giá trị mà bạn cần hiểu để diễn giải kết quả.
Mỗi con số này có ý nghĩa sau:
- Nhiều R: Hệ số Tương quan. 1 cho thấy mối tương quan chặt chẽ giữa hai biến, trong khi -1 có nghĩa là có một mối quan hệ tiêu cực mạnh mẽ. 0 nghĩa là không có tương quan.
- R Square: Hệ số xác định, cho biết có bao nhiêu điểm giữa hai biến số nằm trên đường hồi quy. Về mặt thống kê, đây là tổng của các độ lệch bình phương so với giá trị trung bình.
- Hình vuông R được Điều chỉnh: Giá trị thống kê được gọi là Hình vuông R được điều chỉnh cho số lượng biến độc lập bạn đã chọn.
- Lỗi Chuẩn: Kết quả phân tích hồi quy chính xác đến mức nào. Nếu lỗi này nhỏ thì kết quả hồi quy của bạn chính xác hơn.
- Quan sát: Số lượng quan sát trong mô hình hồi quy của bạn.
Các giá trị còn lại trong đầu ra hồi quy cung cấp cho bạn thông tin chi tiết về các thành phần nhỏ hơn trong phân tích hồi quy.
- df: Giá trị thống kê được gọi là bậc tự do liên quan đến các nguồn phương sai.
- SS: Tổng các ô vuông. Tỷ lệ giữa tổng bình phương còn lại so với tổng SS phải nhỏ hơn nếu hầu hết dữ liệu của bạn phù hợp với đường hồi quy.
- MS: Bình phương trung bình của dữ liệu hồi quy.
- F: Thống kê F (F-test) cho giả thuyết rỗng. Điều này cung cấp tầm quan trọng của mô hình hồi quy.
- Ý nghĩa F: Giá trị thống kê được gọi là giá trị P của F.
Trừ khi bạn hiểu thống kê và tính toán các mô hình hồi quy, các giá trị ở cuối bản tóm tắt sẽ không có nhiều ý nghĩa. Tuy nhiên, Multiple R và R Square là hai cái quan trọng nhất.
Như bạn có thể thấy, trong ví dụ này, lượng calo có mối tương quan chặt chẽ với tổng trọng lượng.
Phân tích hồi quy nhiều tuyến tính trong Excel
Để thực hiện cùng một hồi quy tuyến tính nhưng với nhiều biến độc lập, hãy chọn toàn bộ phạm vi (nhiều cột và hàng) cho Đầu vào X Phạm vi.
Khi chọn nhiều biến độc lập, ít có khả năng bạn sẽ tìm thấy mối tương quan chặt chẽ vì có rất nhiều biến.
Tuy nhiên, phân tích hồi quy trong Excel có thể giúp bạn tìm thấy mối tương quan với một hoặc nhiều biến mà bạn có thể không nhận ra là có tồn tại chỉ bằng cách xem xét dữ liệu theo cách thủ công.