KIỂM ĐỊNH ƯỚC LƯỢNG HỒI QUI

BIẾN TRUNG GIAN TRONG MÔ HÌNH CB SEM (PHẦN 1)


Kết thúc bước phân tích mô hình SEM, về cơ bản chúng ta đã hoàn thành, tuy nhiên để biết được các ước lượng (trọng số hồi qui) được trích xuất từ bước phân tích mô hình SEM trên có độ tin cậy tốt hay không thì bạn cần phải thực hiện thêm bước kiểm định Bootstrap này. Có thể nói đây là bước đánh giá độ tin cậy của các ước lượng từ mô hình SEM.

Bước đầu tiên, trong màn hình SEM, bạn vào View/Analysis Properties/Bootstrap. Tích vào ô Perform bootstrap và điền số mẫu bootstrap. Thông thường lựa chọn số lượng mẫu bootstrap là khoảng 1000 nhé (theo Preacher, K. J., và Hayes, A. F., 2008), hơn nữa cũng OK, nhưng máy chạy hơi nặng, 1000 là đủ để phép thử hội tụ, lớn hơn cũng được nhưng không cần thiết lắm. Giờ chương trình sẽ tạo ra 1000 mẫu thử, sau đó phân tích SEM cho 1000 mẫu này, và trả về giá trị trung bình của các ước lượng trong mỗi mô hình bootstrap. 


Chọn Viewtext để xuất hiện hộp thoại Amos Output. Nhấn chọn Standardized Regression Weights (1) và chọn tiếp Bootstrap standard errors (2). Click chuột phải chọn copy để dán vào excel (3).


Chúng ta tính chỉ số CR theo công thức được thể hiện trong hình bên dưới. CR < 1.96 thì có thể kết luận kiểm định bootstrap đạt yêu cầu.


Các giá trị |CR|  < 1.96 nên kết luận độ chệch giữa 2 mẫu (n - mẫu thu thập) và mẫu (N - mẫu lặp lại theo bootstrap) khác 0 không có ý nghĩa thống kê. Nói cách khác, giữa mẫu (n) và (N) không có sự khác biệt. Do vậy kết luận rằng, mẫu (n) là đáng tin cậy, các ước lượng trong mô hình SEM đáng tin cậy.

Giá trị ABS(CR) < 1.96 theo đề xuất của Gao và cộng sự (2008). Năm 2013, Byrne xuất bản lần thứ 2 cuốn sách Structural equation modeling with AMOS: Basic concepts, applications, and programming, ông đã đề xuất chỉ số ABS(CR) ≤ 2; tuy nhiên trong lần tái bản thứ ba vào năm 2016, Byrne đã hiệu chỉnh lại chỉ số ABS(CB) < 1.96.

Về cơ bản khi kiểm định độ tin cậy của các ước lượng thông qua chỉ số tới hạn CR của Bias trong nhiều trường hợp rất khó đạt bởi nhiều nguyên nhân khác nhau. Nên thông thường, mình thường kết luận thông qua tiêu chí độ chệch (bias) nhỏ (≤ 5‰). Và mình cũng rất ít thấy bài báo quốc tế nào đề cập tới chỉ số CR của Bias. Tuy nhiên, họ đề cập tới Bootstrap bias-corrected confidence intervals ở mức ý nghĩa 10% (hay 5%) để đánh giá các mối quan hệ trung gian mediation trong SEM (tức là kiểm tra xem một biến trung gian trong mô hình nghiên cứu có phải thực sự đóng vai trò là biến trung gian hay không, điều này có ý nghĩa quan trọng trong vấn đề tìm hiểu và đưa ra hướng giải quyết cho từng vấn đề cụ thể).

Tiếp theo, chúng ta sẽ tìm hiểu cách đánh giá biến trung gian trong SEM nhé.

Đầu tiên, chúng ta khai báo ở phần bootstrap như sau:


Sau đó, chúng ta cần định nghĩa các biến giá trị tổng ảnh hưởng gián tiếp trong mô hình. Bước thứ nhất là chúng ta gán nhãn cho trọng số hồi qui của từng mối quan hệ cần xem xét như hình.


Bước hai, click chuột trái vào dòng chữ Not estimating any user-defined estimand và nhấn chọn Define new estimands. Và viết code tương tự như hình dưới. Việc xác định công thức tính giá trị ảnh hưởng gián tiếp trong mô hình, chúng ta nghiên cứu thêm Kline (2016).



Sau khi viết xong, chúng ta lưu với tên bất kỳ và đóng lại. Trường hợp cấu trúc code bị lỗi, chương trình sẽ thông báo lỗi ở phần Syntax errors, và chúng ta sẽ khắc phục theo hướng dẫn của họ nhé. Tiếp theo, chúng ta chạy phân tích, và đọc kết quả ở Output SEM. Có một điều chúng ta cần lưu ý, với file code ước lượng định nghĩa sau mỗi lần chạy phân tích thì AMOS sẽ không tự load, mà trả về dạng default, và do đó người dùng cần load lại ở lần chạy tiếp theo. 

Trường hợp lỗi cấu trúc thì chương trình sẽ hiện thông báo. Lúc này cần click chuột phải vào dòng chữ Not estimating any user-defined estimand và nhấn chọn Edit mediation để chỉnh sửa.


Cú pháp của chúng ta thì bình thường rồi, có điều tên biến AS trong SEM không được chấp nhận, nên chúng ta cần chuyển lại tên A_S. Đọc kết quả.


Các ước lượng mediation được định nghĩa bởi người dùng sẽ xuất hiện khi chúng ta chọn User-defined estimands.

Dạng bảng kết quả thường mình trình bày như sau, mọi người thường hay hỏi nên sẵn tiện viết ra đây luôn. Lưu ý trong các nghiên cứu xuất bản ở Việt Nam, chúng ta nên Việt hóa từ ngữ ra nhé.


Giá trị p bootstrap ≤ 5% có nghĩa là tổng các tác động gián tiếp có khác 0 đáng kể ở bất kỳ mức ý nghĩa nào. Nói cách khác, tồn tại quan hệ trung gian của biến LY trong mô hình nghiên cứu.

Có một điều lưu ý là các giá trị ước lượng thu được từ việc code là giá trị chưa chuẩn hóa, nhưng điều này không quá quan trọng bởi lẽ chúng ta chỉ cần kết luận có hay không tồn tại quan hệ trung gian trong mô hình nghiên cứu. Để đánh giá mức độ ảnh hưởng của các biến độc lập, bao gồm ảnh hưởng trực tiếp và gián tiếp, chúng ta cần xem xét mục Matrices (để xuất hiện mục này, trong phần khai báo kết quả Output SEM trước khi chạy chúng ta nhớ chọn .



Chúng ta cần lưu ý, các giá trị trong bảng Total Effects được chương trình mặc định là chưa chuẩn hóa. Để tính tổng các ước lượng chuẩn hóa mình cần thực hiện tính toán thủ công theo công thức của Kline (2016). Cụ thể trong bài này chúng ta tính được như sau.


Chỉ số T-statistics

Tiếp theo sau đây chúng ta sẽ tính toán chỉ số thống kê t-statistics. Để tính toán được t-statistics chúng ta cần hệ số beta và sai số chuẩn. Để lấy hệ số beta chúng ta vào Estimates -> User-defined estimands và từ Estimates/Bootstrap chúng ta chọn Bias-corrected percentile method. Để lấy sai số chuẩn (SE) chúng ta vào Estimates -> User-defined estimands và từ Estimates/Bootstrap chúng ta chọn Bootstrap standard errors. Chia hệ số beta cho sai số chuẩn ta sẽ được giá trị t-statistics (Collier, J. E., 2020).


Với AS-LY-RI: t-statistics là 0.042/0.028 = 1.500; AW-LY-RI: t-statistics là 0.035/0.023 = 1.522; QP-LY-RI: t-statistics là 0.044/0.026 = 1.692.

Kết quả phân tích mediation sẽ được trình bày lại theo bảng sau.


Cần nói thêm một tí ở phần kết luận, khi ảnh hưởng trực tiếp có hay không có ý nghĩa thống kê (không quan tâm) và ảnh hưởng gián tiếp không có ý nghĩa thống kê thì chúng ta kết luận là No mediation. Khi ảnh hưởng trực tiếp có ý nghĩa thống kê và ảnh hưởng gián tiếp có ý nghĩa thống kê thì chúng ta kết luận là Partial mediation. Và khi ảnh hưởng trực tiếp không có ý nghĩa thống kê và ảnh hưởng gián tiếp có ý nghĩa thống kê thì chúng ta kết luận là Full mediation.


Mối quan hệ gián tiếp

Mối quan hệ trực tiếp

Kết luận

a*b có ý nghĩa thống kê (tức là cả hai a và b đều có ý nghĩa thống kê)

c’ có ý nghĩa thống kê

Partial mediation

a*b có ý nghĩa thống kê (tức là cả hai a và b đều có ý nghĩa thống kê)

c’ không có ý nghĩa thống kê

Full mediation

a*b không có ý nghĩa thống kê (tức là hoặc a hoặc b không có ý nghĩa thống kê)

Không quan tâm đến c’

No mediation


Để đánh giá về mức độ ảnh hưởng mạnh/trung bình/yếu (mediating effect sizes) chúng ta tham khảo tài liệu của Cohen (1988; 2013): beta từ ±0.1 đến ±0.3 là nhỏ; beta từ ±0.3 đến ±0.5 là trung bình; và beta từ ±0.5 trở lên là mạnh. Giá trị beta (estimate) nằm trong khoảng ±1.

Đến đây là chúng ta đã hoàn thành phần phân tích mediation cho mô hình SEM. Một vấn đề gốp ý nhỏ là chúng ta cũng không nên quá phức tạp hóa vấn đề trong phân tích mediation, vấn đề nằm ở giải pháp và kết quả đạt được để đáp ứng các yêu cầu cho mục tiêu nghiên cứu.


Tài liệu tham khảo:

Amos Development Corporation, 2010. User-defined estimands. http:// amosdevelopment.com /features/ userdefined/ userdefinedsimple/ Tutorial2/ pdf/ SimpleUserDefined2 .pdf.  (Accessed 10 May 2021).

Byrne, B. M. (2013). Structural equation modeling with AMOS: Basic concepts, applications, and programming. Routledge.

Byrne, B. M. (2016). Structural equation modeling with AMOS: Basic concepts, applications, and programming. Routledge.

Cohen, J. (1988). Statistical power analysis for the behavioral sciences. Academic press.

Cohen, J., Cohen, P., West, S. G., & Aiken, L. S. (2013). Applied multiple regression/correlation analysis for the behavioral sciences. Routledge.

Collier, J. E. (2020). Applied structural equation modeling using AMOS: Basic to advanced techniques. Routledge.

Gao, S., Mokhtarian, P. L., & Johnston, R. A. (2008). Nonnormality of data in structural equation models. Transportation Research Record, 2082(1), 116-124.

Kline, R. B. (2016). Principles and practice of structural equation modeling. Guilford publications.

Preacher, K. J., & Hayes, A. F. (2008). “Assessing mediation in communication research”. London: The Sage sourcebook of advanced data analysis methods for communication research.



0971202308