logo

R square là? Cách tính và ứng dụng của R Square?


1. R Square là gì?

R square hay còn được biết tới với cách viết r squared và r bình phương. Vậy r square là gì? Hay nói cách khác, r bình phương là gì? Đây là một thước đo được sử dụng trong thống kê và nó cho chúng ta biết mức độ phù hợp của mô hình nghiên cứu với ý nghĩa là các nhân tố (hay còn gọi là các biến). Đồng thời, hệ số này giải thích nhân tố phụ thuộc đó đạt bao nhiêu phần trăm trong quá trình nghiên cứu.


2. Cách tính và ứng dụng của R Square?

a. Cách tính

Hiện nay, công thức tính hệ số tương quan R2 đang được sử dụng như sau:

[CHUẨN NHẤT] R square là? Cách tính và ứng dụng của R Square?

Trong đó:

- ESS là viết tắt của Residual Sum of Squares, tức là tổng các độ lệch bình phương của phần dư.

- TSS là viết tắt của Total Sum of Squares, tức là tổng độ lệch bình phương của toàn bộ các nhân tố nghiên cứu.

Từ công thức này, có thể thấy R sẽ trong khoảng từ 0 đến 1. Trong khi tính ESS ta cũng cần lưu ý multiple r. Vậy multiple r là gì? Multiple r là viết tắt của multiple regression. Đây là hệ số tương quan hồi quy nhiều lần gắn liền mật thiết với r square.

Chỉ số này cho phép bạn kiểm tra xem việc đưa thêm một biến vào mô hình có còn được hay không; đồng thời nó còn có khả năng loại trừ ảnh hưởng của một số biến.  Khi chạy SPSS – một phần mềm thống kê phổ biến hiện nay, bạn cần hết sức lưu ý chỉ số này.

Hệ số r bình phương hiệu chỉnh

Bên cạnh r bình phương, r bình phương hiệu chỉnh cũng là một khái niệm không thể bỏ qua. Đây là một hệ số được sử dụng để hạn chế những nhược điểm của r bình phương.

Công thức tính r bình phương hiệu chỉnh

[CHUẨN NHẤT] R square là? Cách tính và ứng dụng của R Square? (ảnh 2)

Trong đó:

  • n là số lượng mẫu quan sát.
  • k tham số của mô hình (bằng lượng biến độc lập cộng thêm 1)

b. Ứng dụng

R square hay r bình phương được sử dụng nhiều trong kinh tế lượng. Vậy ý nghĩa của r bình phương trong kinh tế lượng là gì? R bình phương được sử dụng trong thống kê và được thực hiện bởi phương pháp gọi là hồi quy tuyến tính.

R bình phương cho biết mô hình đó hợp với dữ liệu ở mức bao nhiêu %.

Ví dụ: R bình phương = 0,65. Vậy mô hình hồi quy tuyến tính đang được thống kê sẽ phù hợp với dữ liệu (hoặc biến) ở mức 65%.

R bình phương cũng cho biết độ phù hợp của mô hình, người ta nghiên cứu được rằng, với r bình phương > 50% thì một mô hình được đánh giá là phù hợp.

Tất nhiên, không phải tất cả các mô hình đều phải có r bình phương > 50%, ta có thể loại trừ một số mô hình có sự biến động lớn như giá vàng hay giá cổ phiếu…

Đặc biệt, giá trị R2 càng cao thì mối quan hệ giữa nhân tố độc lập (biến độc lập) và nhân tố phụ thuộc càng chặt chẽ. Vì thế mà r bình phương còn được biết tới với cái tên hệ số tương quan r bình phương.

Qua đó có thể thấy ý nghĩa hệ số xác định R2  là vô cùng quan trọng trong thống kê và nghiên cứu, đặc biệt là trong phương pháp hồi quy tuyến tính.

[CHUẨN NHẤT] R square là? Cách tính và ứng dụng của R Square? (ảnh 3)

Ngoài các kiến thức nêu ở trên, chúng ta hãy cùng tìm hiểu về hạn chế và ví dụ về cách tính R Square.

Hạn chế của hệ số R bình phương

Càng đưa thêm nhiều biến vào mô hình, mặc dù chưa xác định biến đưa vào có ý nghĩa hay không thì giá trị R2 sẽ tăng. Lý do là khi càng đưa thêm biến giải thích vào mô hình thì sẽ càng khiến phần dư giảm xuống (vì bản chất những gì không giải thích được đều nằm ở phần dư), do vậy tăng thêm biến sẽ khiến tổng bình phương phần dư(Residual Sum of Squares) giảm, trong khi Total Sum of Squares không đổi, dẫn tới R2 luôn luôn tăng.
Giá trị R2 tăng khả năng giải thích của mô hình, nhưng bản chất thì lại không làm rõ được tầm quan trọng của biến đưa vào, do đó nếu dựa vào giá trị R2 để đánh giá tính hiệu quả của mô hình sẽ dẫn đến tình huống không chính xác vì sẽ đưa quá nhiều biến không cần thiết, làm phức tạp mô hình.

Để ngăn chặn tình trạng như đã nêu trên, một phép đo khác về mức độ thích hợp được sử dụng thường xuyên hơn. Phép đo này gọi là R2 hiệu chỉnh hoặc R2 hiệu chỉnh theo bậc tự do.

Ví dụ tính R2 và R2 hiệu chỉnh bằng tay theo công thức dựa trên kết quả phân tích hồi quy đa biến

Sau khi thực hiện phân tích hồi quy đa biến, sẽ ra được bảng kết quả sau:

[CHUẨN NHẤT] R square là? Cách tính và ứng dụng của R Square? (ảnh 4)

Trong bảng Model Summary đã có sẵn R2 và R2 hiệu chỉnh. Tuy nhiên ta sẽ thực hiện tính toán giá trị này dựa vào bảng ANOVA bên dưới để hiểu rõ vấn đề.

Nhắc lại công thức tính R bình phương:

[CHUẨN NHẤT] R square là? Cách tính và ứng dụng của R Square? (ảnh 5)

Trong bài này:

ESS = Residual Sum of Squares = 30.036

TSS = Total Sum of Squares = 86.721

do đó: R2=1-(ESS/TSS) =1-(30.036/86.721)= 0.654

Như vậy ta đã tính được bằng công thức giá trị R square=0.654. Bây giờ ta tính tiếp giá trị adjusted R square nhé

R2_hiệuchỉnh = 1-(n-1)*(1-R2)/(n-k)

n= số lượng mẫu quan sát=160

k= số tham số của mô hình, bằng số lượng biến độc lập cộng 1= 6+1=7

vậy R2_hiệuchỉnh = 1-(n-1)*(1-R2)/(n-k)=1-(160-1)*(1-0.654)/(160-7)= 0.640

Như vậy R_bìnhphương_hiệuchỉnh=0.640 bé hơn R_bìnhphương=0.654

Khi các bạn làm bài dạng như: các yếu tố ảnh hưởng đến quyết định, ý định, sự hài lòng… nói chung là các bài dạng khảo sát thị trường , nếu gặp trường hợp R bình phương thấp hơn 0.5, hãy gởi mô hình nghiên cứu, bảng câu hỏi, thông tin liên quan… để nhóm tư vấn cách xử lý triệt để nhé. Nhóm sẽ có cách tư vấn xử lý để hệ số R bình phương lớn hơn 50%.

icon-date
Xuất bản : 28/09/2021 - Cập nhật : 28/09/2021