Ý NGHĨA CÁC HỆ SỐ R², f², Q², q² TRONG MÔ HÌNH PLS SEM

1. Hệ số xác định R² hay R²hiệu chỉnh

hay hiệu chỉnh là các hệ số xác định mức độ giải thích của biến nội sinh trong mô hình SEM bởi các biến ngoại sinh liên quan đến nó. Ví dụ:


R² trong mô hình trên là 71.4%, điều này nghĩa là 71.4% sự biến thiên của biến RI được điều chỉnh bởi 4 biến độc lập trong mô hình (QP, AW, AS, LY). Phần trăm sự thay đổi của biến RI được điều chỉnh bởi các yếu tố khác không có trong mô hình nghiên cứu. Một mô hình nghiên cứu được xem là đạt yêu cầu khi có R² lớn (đối với mô hình hồi qui bội thì R² lấy chuẩn là ≥ 50%).

Và để xem xét đánh giá mức độ giải thích của các biến ngoại sinh tới biến nội sinh trong mô hình thì người ta sử dụng hệ số f².

2. Hệ số đánh giá mức độ giải thích của biến ngoại sinh tới biến nội sinh f²

Hệ số f² thường được xem xét cùng với hệ số xác định R² hiệu chỉnh để đánh giá mức độ giải thích của các biến ngoại sinh tới biến nội sinh trong mô hình. Việc đánh giá này nhằm xem xét vai trò giải thích của biến ngoại sinh lên biến nội sinh là có hay không? Và nếu có thì mức độ là thấp hay cao? Thông thường, người ta hay sử dụng chỉ số f² để xem xét lựa chọn các biến có mức độ giải thích cao để tập trung nguồn lực cải thiện các yếu tố này trong mô hình nghiên cứu.

Đánh giá mức độ giải thích của biến ngoại sinh lên biến nội sinh bằng hệ số f²

f² < 0.02

Không đóng vai trò giải thích

0.02 ≤ f2 < 0.15

Có mức giải thích thấp

0.15 ≤ f2 < 0.35

Có mức giải thích trung bình

f2 ≥ 0.35

Có mức giải thích cao

(Nguồn: Hair và cộng sự, 2022)

Trong các mô hình hồi qui bội thông thường, chúng ta sử dụng SPSS để phân tích và ít có người nào đề cập tới hệ số f², mà chỉ tập trung vào hệ số hồi qui trong mô hình. Người ta hay dựa vào hệ số hồi qui (beta) để đánh giá mức độ ảnh hưởng của các biến độc lập lên biến phụ thuộc. Và từ đó làm cơ sở để lựa chọn các yếu tố cần tập trung nguồn lực để cải thiện trong mô hình nghiên cứu. Tuy nhiên việc này cần được xem xét thật kỹ, bởi lẽ với một mối quan hệ nhân quả trong mô hình có hệ số hồi qui cao thì chưa hẳn hệ số f² cao. Chúng ta hãy cùng so sánh kết quả phân tích được từ mô hình thực tế trong bảng dưới đây.

 

Hệ số hồi qui (beta)

Hệ số f²

AS → RI

0.222

0.110

AW → RI

0.334

0.273

LY → RI

0.344

0.264

QP → RI

0.191

0.088

Để dễ hình dung, chúng ta hãy trực quan hóa bằng đồ thị như sau:


Chúng ta có thể thấy rằng, thứ tự từ lớn tới bé của các biến độc lập trong mô hình theo hệ số hồi qui beta là LY, AW, AS, QP. Tuy nhiên thứ tự từ lớn tới bé theo hệ số f² sẽ là AW, LY, AS, QP. Nên nếu nguồn lực của một doanh nghiệp có hạn, và bắt buộc chỉ chọn một yếu tố tốt nhất để cải thiện thì lúc đó chúng ta nên cân nhắc thật kỹ.

3. Hệ số đánh giá mức độ chính xác về dự báo Q2

Q2 là một chỉ số của năng lực dự báo ngoài mẫu (out-of sample predictive power) trong mô hình. Để tính toán hệ số Q2 này, trong phần mềm SmartPLS 4 các bạn chọn Calculate, nhấn chọn Blindfolding, tất cả cứ để mặc định và nhấn Start calculation.


Đọc kết quả, chúng ta click chuột vào mục Construct cross-validated redundancy. Lưu ý rằng, hệ số Q2 được SmartPLS tính toán bằng 2 phương pháp khác nhau. Một là phương pháp tiếp cận phần dư hệ số chéo (cross-validated redundancy), và hai là phương pháp tiếp cận phần chung hệ số chéo (cross-validated communality). Cho nên, màn hình báo cáo kết quả sẽ xuất hiện tới 2 kết quả tương ứng với 2 phương pháp tiếp cận ở trên. Chúng ta sử dụng kết quả nào cũng ok. Tuy nhiên, theo nhiều tài liệu khuyên rằng, phương pháp tiếp cận phần dư hệ số chéo (cross-validated redundancy) cho kết quả tốt hơn. Vì vậy, chúng tôi cũng khuyên các bạn sử dụng kết quả từ phương pháp tiếp cận này.


Ở khung bên phải màn hình, chúng ta thấy mô hình có các hệ số Q2 nằm bên trong các vòng tròn (các biến construct) tương ứng với phương pháp tiếp cận, chúng ta có thể chọn phương pháp tiếp cận để mô hình thể hiện hệ số Q2 tương ứng. Một điều lưu ý nữa rằng, hệ số Q2 chỉ xuất hiện với các biến nội sinh, với các biến thuần ngoại sinh sẽ không xuất hiện hệ số Q2.

Kết quả ở ví dụ phân tích trong hình: yếu tố RI có Q2 = 0.172, nghĩa là mức độ chính xác về dự báo của cấu trúc RI (năng lực dự báo ngoài mẫu) là 17.2% ≤ 25%, nên theo Vũ Hữu Thành và Nguyễn Minh Hà (2023) , mô hình đo lường biến RI có mức độ chính xác về dự báo là thấp. Dưới đây là các khung tiêu chuẩn đánh giá Q2 được trích dẫn từ Vũ Hữu Thành và Nguyễn Minh Hà (2023).

Đánh giá mức độ chính xác về dự báo

0 < Q2 ≤ 0.25

Thấp

0.25 < Q2 ≤ 0.5

Trung bình

Q2 > 0.5

Cao

Trên đây là cách đánh giá mức độ về dự báo theo hệ số Q2 trước giờ các nghiên cứu hay dùng. Tuy nhiên, theo Hair và cộng sự (2022) cho rằng, hệ số Q2 không thực sự đánh giá khả năng dự đoán của mô hình (Exhibit 6.6). Do vậy, Hair và cộng sự (2022) đã trình bày một thủ tục dự đoán PLS (PLSpredict). Thủ tục này so sánh kết quả của giá trị RMSE (the root mean square error - đo lường sai số trung bình của mô hình so với dữ liệu thực tế) hoặc giá trị MAE (mean absolute error - MAE cũng đo lường sai số trung bình của mô hình so với dữ liệu thực tế, tuy nhiên MAE tính toán trung bình giá trị tuyệt đối của sai số) giữa mô hình PLS và mô hình LM (mô hình hồi qui tuyến tính benchmark – linear regression model benchmark). Qui trình đánh giá năng lực dự báo của mô hình được Hair và cộng sự (2022) đưa ra như hình sau (chúng tôi xin được trích nguyên văn từ tác giả):


Tiếp theo, chúng tôi sẽ hướng dẫn các bạn cách thức đánh giá mức độ dự báo của mô hình bằng thủ tục PLSpredict trong SmartPLS 4.

Bước 1: Chọn thủ tục PLSpredict. Để mặc định và chạy phân tích.


Bước 2: Đọc kết quả. Bạn chọn mục MV prediction summary. Bạn có thể sử dụng cột số 1 (RMSE) hoặc cột số 2 (MAE) đều được. Kết hợp với Bảng Exhibit 6.9 của Hair và cộng sự (2022) để kết luận về năng lực dự báo của mô hình. Kết quả ví dụ cho thấy, năng lực dự báo của mô hình RI cao, các mô hình còn lại không có năng lực dự báo.


4. Hệ số đánh giá hiệu quả dự báo của một biến giải thích q2

Hệ số này được sử dụng khi các bạn đánh giá năng lực dự báo của mô hình bằng hệ số Q². Trong trường hợp các bạn đánh giá năng lực dự báo của mô hình bằng thủ tục PLSpredict thì không cần đánh giá hệ số q2, chúng ta chỉ cần đánh giá R2f2 là được (tham khảo Hair và cộng sự, 2022).

Hệ số đánh giá hiệu quả dự báo của một biến giải thích q2 hay còn gọi là hệ số tác động q2. Q2 của biến RI là 0.172 ≤ 0.25 → mức độ chính xác về dự báo là thấp. Chúng ta cần xem xét RI được giải thích bởi 2 biến là Alpha và LY, vậy trong 2 biến này biến nào có hiệu quả dự báo cho RI cao hơn? Và cụ thể là mức độ dự báo được đánh giá như thế nào? Chúng ta cần xem xét hệ số q2, được tính bằng công thức sau:


Trong đó:

Q2included là hệ số Q2 của mô hình gốc

Q2excluded là hệ số Q2 của mô hình đã loại biến tiềm ẩn đang cần đánh giá q2

 

RI

Alpha

q2 = ?

LY

q2 = ?

 

Mô hình loại biến Alpha:


Mô hình loại biến LY:




 

RI

Alpha

0.093 → hiệu quả dự báo ở mức thấp

LY

0.028 → hiệu quả dự báo ở mức thấp

Dưới đây là các khung tiêu chuẩn đánh giá q2 được trích dẫn từ Vũ Hữu Thành và Nguyễn Minh Hà (2023).

Đánh giá hiệu quả dự báo của một biến giải thích

q2 < 0.02

Không có hiệu quả dự báo

0.02 ≤ q2 < 0.15

Hiệu quả dự báo thấp

0.15 q2 < 0.35

Hiệu quả dự báo trung bình

q2 ≥ 0.35

Hiệu quả dự báo cao

 

Tài liệu tham khảo

Hair, J., & Alamer, A. (2022). Partial Least Squares Structural Equation Modeling (PLS-SEM) in second language and education research: Guidelines using an applied example. Research Methods in Applied Linguistics, 1(3), 100027.

Vũ Hữu Thành, & Nguyễn Minh Hà. (2023). Giáo trình phân tích dữ liệu áp dụng mô hình PLS - SEM (1st ed.). NXB ĐH Quốc Gia Tp HCM.


0971202308