MÔ HÌNH ĐO LƯỜNG vs MÔ HÌNH CẤU TRÚC
CÁC TIÊU CHÍ ĐÁNH GIÁ
Xin chào các anh chị và các bạn! Cảm phiền mọi người ghi rõ nguồn amosleminh.com khi chia sẻ hay sao chép nội dung từ website của chúng tôi. Trân trọng cảm ơn rất nhiều!
Trong bài viết này, chúng ta sẽ tìm hiểu
về 2 khái niệm hay dùng trong các bài phân tích SEM, đó là mô hình đo lường và
mô hình cấu trúc. Như vậy, thế nào là mô hình đo lường? và thế nào là mô hình cấu
trúc? Sau đây, chúng ta cùng đi tìm hiểu xem 2 loại mô hình này là như thế nào.
Mô hình SEM bao gồm
hai loại mô hình là mô hình cấu trúc và mô hình đo lường. Mỗi loại mô hình được
xây dựng bởi một lý thuyết riêng. Mô hình cấu trúc được xây dựng dựa trên lý
thuyết nền (substantial theory), còn mô hình đo lường được hình thành dựa trên
lý thuyết hỗ trợ (auxiliary theory) (
A. Mô
hình đo lường (measurement
model/outer model) là mô hình thể hiện mối liên hệ giữa khái niệm lý thuyết
(hay biến cấu trúc)1 và các chỉ báo (indicators) hay các biến quan sát
(observed variables). Như vậy trong mô hình SEM sẽ có nhiều mô hình đo lường
cho các khái niệm nghiên cứu khác nhau.
I. Đánh giá mô hình đo lường
Đối với CB SEM sử dụng AMOS, việc đánh giá mô hình đo lường
chính là đánh giá độ tin cậy, tính hội tụ và tính phân biệt của thang đo qua
phương pháp CFA. Các chỉ tiêu đánh giá cụ thể của CFA chúng tôi đã trình bày
nhiều lần ở các chia sẻ khác, trong chủ đề này chúng tôi sẽ không thảo luận lại,
các bạn có thể tham khảo thêm ở các chủ đề cũ hơn.
Còn đối với PLS SEM, việc đánh giá mô hình đo lường được chia ra hai loại: (1) Đánh giá mô hình đo lường phản ánh và (2) Đánh giá mô hình đo lường cấu tạo.
I.1. Đối với mô hình đo lường phản
ánh, chúng ta cần đánh giá 3 vấn đề sau đây:
•
Đánh giá mức độ tin cậy nhất quán nội bộ:
→ Hệ số tải Outer loading ≥ 0.708. Trong một vài trường hợp,
hệ số tải có thể nhỏ hơn 0.708. Trong trường hợp đó, chúng ta sẽ loại bỏ chỉ
báo đó, nhưng cũng có thể xem xét giữ lại (
→ Đánh giá mức độ tin cậy nhất quán nội bộ thông qua hệ số đánh giá mức độ tin cậy tổng hợp CR.
CR > 0.9 |
Một số hoặc tất cả các chỉ báo có thể đang đo lường cùng
một kết quả giống nhau từ biến tiềm ẩn (các chỉ báo rất giống nhau về mặt ý nghĩa). Bạn cần xem lại mức độ chính xác về mặt nội
dung và sau đó loại bỏ chỉ báo và thực hiện lại phân tích. |
0.6 ≤ CR ≤ 0.7 |
Chấp nhận được nếu dùng cho nghiên cứu khám phá. Nếu không cần tìm cách cải thiện CR và phân tích lại mô
hình PLS
SEM. |
CR < 0.6 |
Không chấp nhận được. Cần xem xét việc xây dựng lại mô hình đo lường hoặc thu thập
thêm dữ liệu sau đó phân tích lại mô hình. |
• Đánh giá mức độ chính xác về sự hội tụ:
Đánh giá mức độ tin cậy của từng chỉ báo
l ≥ 0.7 |
Chỉ báo đạt mức độ
tin cậy |
0.4 ≤ l < 0.7 |
Cần xem xét loại bỏ
chỉ báo và thực hiện phân tích lại mô hình SEM |
l < 0.4 |
Loại bỏ chỉ báo và
thực hiện phân tích lại. |
l là hệ số tải outer loading
Đánh giá mức độ chính xác về sự hội tụ
AVE ≥ 0.5 |
Đạt được mức độ
chính xác về sự hội tụ |
AVE < 0.5 |
Không đạt mức độ
chính xác về sự hội tụ. Cần xem xét loại bỏ chỉ báo hoặc xem xét lại việc xây
dựng mô hình đo lường hoặc quá trình thu thập dữ liệu chưa hiệu quả. |
• Đánh giá mức độ chính xác về sự phân biệt:
So sánh hệ số tải
ngoài và hệ số tải chéo (hệ số tải nằm trên đường chéo) |
Chỉ báo đạt điều kiện cần là hệ số tải ngoài lớn
hơn hệ số tải chéo. Trong trường hợp không đạt điều kiện
cần, chúng ta cần xem xét loại bỏ chỉ báo hoặc xây dựng lại mô hình đo lường hoặc xem xét lại hoạt động thu thập dữ liệu. |
HTMTij ≥
0.9 |
Khó đạt được mức độ chính xác về sự phân biệt giữa cặp thang đo i và j. Cần xem xét loại bỏ chỉ báo hoặc xây dựng lại mô hình đo lường
hoặc xem xét lại hoạt động thu thập dữ liệu. |
HTMTij ≤
0.85 |
Thang đo đạt được mức
độ chính xác về sự phân biệt. |
I.2. Đối với mô hình đo lường cấu
tạo, chúng ta cần đánh giá 3 vấn đề sau đây:
Đối với dạng mô hình
đo lường này khá là ít gặp trong các nghiên cứu. Các tiêu chuẩn kiểm định cho
mô hình dạng này cũng phức tạp hơn. Về nguyên tắc thì chúng ta sẽ có 3 tiêu chí cần đánh giá đối với dạng mô hình này. Tuy nhiên, nhiều nghiên cứu khoa học chỉ đề cập tới 2 tiêu chí đánh giá là đánh giá về hệ số VIFs và mức ý nghĩa thống kê của các trọng số ngoài (Outer weights), không cần đánh giá mức độ chính xác về sự hội tụ. Trong chuyên đề này, chúng tôi vẫn đề cập tới tiêu chí đánh giá mức độ chính xác về sự hội tụ để các bạn nắm được kỹ thuật sơ bộ.
• Đánh giá mức độ chính xác về sự hội tụ:
Đối với dạng mô hình đo lường cấu tạo (formative
measurement model) việc đánh giá tính chính xác về sự hội tụ khá phức tạp, bởi
vì theo
Bước đầu tiên, chúng ta cần tạo ra mô hình đơn chỉ báo để đánh giá mô hình đo lường cho YDM.
Kiểm tra giá trị hồi qui của đường dẫn lớn hơn hoặc bằng 0.7 (và P value có ý nghĩa thống kê) hay R² ≥ 0.5 thì kết luận mô hình đo lường cấu tạo đảm bảo độ chính xác về tính hội tụ. Kết quả phân tích tình huống thực tế cho thấy, mô hình đo lường YDM đảm bảo độ chính xác về sự hội tụ.
Vấn đề phức tạp và khó khăn nhất của chúng ta ở tiêu chí đánh giá này là kỹ thuật tạo ra biến Single-item construct như chúng ta thấy ở trên. Mặc dù Hair và cộng sự (2021) có đề cập tới, nhưng cũng chỉ dừng lại ở mức giới thiệu phương pháp. Thay vào đó, tác giả giới thiệu phương pháp 3 bước của Cheah và cộng sự (2018), chi tiết như sau (chúng tôi xin phép được trình bày văn bản gốc trích tại EXHIBIT 5.3 trang 144 của cuốn A primer on partial least squares structural equation modeling (PLS-SEM)):
Cheah et al. (2018) have proposed the following three-step
procedure for generating and validating global single items to be used as
criterion variables in a redundancy analysis. Their procedure requires
empirical data to be collected as part of a pilot study to validate the single
item.
Step 1: Item generation
To generate a suitable single item, researchers need to carefully
choose a theoretical definition of the concept of interest and identify popular
measurement scales that build on this definition. Taking the scale items as
input, researchers then need to create a measure that taps the most relevant
aspect of the concept and the scale items. The resulting item should be checked
for face validity by a panel of experts and members representing the target
population.
Step 2: Reliability assessment
To assess the single item’s reliability, researchers can draw on
the following formula:
where rxx is the reliability estimate of the single-item
measure x, ryy is the reliability of the reflective multi-item
measure of the same concept (e.g., as depicted by ρA; Chapter 4),
and rxy is the correlation between the single-item and multi-item measure
of the same concept. Hence, reliability assessment by means of this formula
requires the simultaneous administration of a single-item and a multi-item measure
of the same concept, for example, as part of a pilot study. The internal consistency
reliability should be 0.7 or higher.
Step 3: Convergent and criterion validity assessment
Biến Single-item được tạo ra theo cách xây dựng một thang đo tổng quát bằng một câu hỏi duy nhất (item), ví dụ Ý định mua được xây dựng bằng một câu hỏi như: Nhìn chung, tôi muốn mua sản phẩm/dịch vụ này? Lưu ý rằng, thang đo của biến Single-item và thang đo của YDM phải có cùng dạng và tương đồng về kích thước (chẳng hạn như bạn sử dụng likert 5 điểm để đo lường YDM thì Single-item cũng phải dùng likert 5 điểm).
Nhìn chung, việc tạo ra một biến Single-item trong trường hợp này là không phải đơn giản, bởi lẽ câu hỏi chung nếu không được nghiên cứu kỹ sẽ tạo ra kết quả sai lệch, từ đó làm ảnh hưởng đến vấn đề kiểm định thang đo. Chính vì sự khó khăn, phức tạp và tốn kém chi phí trong vấn đề tạo ra biến Single-item mà hiện nay, các nghiên cứu khoa học thường bỏ qua tiêu chí đánh giá này đối với mô hình formative. Đây là các video hướng dẫn của các chuyên gia số liệu trên thế giới, các bạn có thể tham khảo thêm tại đây: video 1; video 2; v.v.
♥ Lưu ý rằng, khi đến với Dịch vụ số liệu Lê Minh, khi các anh chị có nhu cầu đánh giá tiêu chí này, chúng tôi sẵn sàng hỗ trợ và hướng dẫn các anh chị chi tiết cách thức tạo ra single item để đảm bảo tiêu chí đánh giá mức độ chính xác về sự hội tụ đạt yêu cầu.
Việc đánh giá mức độ đa cộng tuyến của mô hình đo lường cấu tạo cần được xem xét trên mô hình đơn chỉ báo đã được tạo lập. Theo Hair và cộng sự (2021), nếu VIF < 5 thì kết luận các chỉ báo không gặp hiện tượng đa cộng tuyến. Trong một vài trường hợp VIF ≥ 5, chúng ta cần xem xét loại bỏ các chỉ báo có VIF ≥ 5. Lưu ý rằng, do đặc thù lý thuyết của mô hình formative, nên việc loại bỏ chỉ báo là không nên vì như thế sẽ ảnh hưởng đến chất lượng construct. Bạn nên xem xét lại toàn bộ quá trình xây dựng mô hình và quá trình thực hiện khảo sát đảm bảo tính chuẩn của dữ liệu đầu vào.
Kết quả phân tích mô hình thực hành cho thấy, các chỉ báo đảm bảo tính đa cộng tuyến.
Sơ đồ biểu diễn quá trình kiểm tra VIF cho mô hình formative (nguồn Hair và cộng sự (2021)):
• Đánh giá mức ý nghĩa thống kê của giá
trị trọng số ngoài (sử dụng phương pháp bootstrap):
Lưu ý, bước đánh giá này chúng ta sẽ thực hiện trên mô hình chính. Chạy bootstrap (với N đề nghị là 5000). Chúng ta đánh giá Pvalue của các trọng số ngoài. Nếu P value nhỏ hơn 5%, kết luận trọng số khác giá trị 0 có ý nghĩa thống kê, mô hình đo lường cấu tạo đạt yêu cầu.
Trong nhiều trường hợp nếu P value của trọng số ngoài (outer weights) không đạt mức ý nghĩa thống kê (>5%) thì khoan vội loại biến, chúng ta cần tiếp tục đánh giá mức ý nghĩa thống kê của hệ số outer loading của các chỉ báo ở mô hình formative. Nếu hệ số tải trọng ngoài của các chỉ báo của mô hình formative ≥ 5 thì các chỉ báo vẫn được giữ lại trong mô hình mặc dù nó không có ý nghĩa. Trong trường hợp hệ số tải trọng ngoài < 5 thì cần đánh giá thêm mức ý nghĩa thống kê của nó. Nếu mức ý nghĩa thống kê đạt yêu cầu thì xem xét có nên loại chỉ báo đó ra khỏi mô hình formative hay không (lưu ý rằng, việc loại này cần cân nhắc thật kỹ lường vì bản chất của loại mô hình formative), nếu mức ý nghĩa thống kê không đạt yêu cầu thì loại biến đó ra khỏi mô hình formative. Sau đây là lưu đồ kiểm tra hệ số outer weights được trích dẫn từ Hair và cộng sự (2021).
Như vậy, tới đây chúng ta đã kết thúc được việc đánh giá mô
hình đo lường. Tiếp theo, chúng ta sẽ xem xét đánh giá mô hình cấu trúc.
B. Mô
hình cấu trúc (structural model/ inner model) là mô hình thể hiện các mối liên hệ
giữa các khái niệm nghiên cứu trong mô hình SEM. Như vậy, một mô hình SEM chỉ
có một mô hình cấu trúc. Việc đánh giá mô hình cấu trúc SEM, ở đây, chúng tôi
chia ra làm hai loại: một là mô hình CB SEM, hai là mô hình PLS SEM.
I.1. Đối với mô hình CB SEM, việc chạy mô hình bằng AMOS rất
quen thuộc với chúng ta. Đánh giá mô hình cấu trúc CB SEM các bạn thực hiện thủ
tục đánh giá mô hình SEM chạy AMOS như chúng tôi đã trình bày ở trong các chuyên
đề cũ hơn.
I.2. Đối với mô hình PLS SEM, việc đánh giá mô hình cấu trúc được
thực hiện như sau:
• Đánh giá mức độ đa cộng tuyến
giữa các biến giải thích trong một mô hình SEM. Lưu ý, chúng ta xem xét VIF ở mục Inner model
trong thuật toán chạy PLS SEM từ SmartPLS. Nếu VIF ≤ 5 thì kết luận, không xuất
hiện hiện tượng đa cộng tuyến. Nếu tới đây, VIF > 5 thì chỉ còn con đường
duy nhất là bạn phải xem xét lại toàn bộ lý thuyết đầu vào và khảo sát lại số
liệu.
• Đánh giá mức ý nghĩa thống kê và kết luận các giả
thuyết nghiên cứu.
• Đánh giá vai trò giải thích của biến đầu tới biến phụ thuộc thông qua hệ số R², R² hiệu chỉnh, và chỉ số f². Chi tiết đánh giá bạn có thể tham khảo ở các chuyên đề cũ hơn của chúng tôi.
• Đánh giá mức độ chính xác về dự báo thông qua các hệ số Q² và đánh giá hiệu quả dự báo của một biến giải thích thông qua biểu đồ phân tích IP, sử dụng phương pháp IPMA (chúng tôi đã trình bày chi tiết ở trong một chuyên đề cũ hơn).
Tới đây, chúng ta đã kết thúc xong phần đánh giá mô
hình cấu trúc. Như vậy, khi kiểm tra mô hình PLS SEM, chúng ta sẽ đánh giá ở cả
hai mô hình là mô hình đo lường và mô hình cấu tạo.
1. Bạn đọc cần phân biệt
giữa khái niệm lý thuyết và biến cấu trúc. Khái niệm lý thuyết được đo lường bởi
một trong ba loại biến cấu trúc. Theo
Tài liệu tham khảo
Hair Jr, J. F., Hult,
G. T. M., Ringle, C. M., & Sarstedt, M. (2021). A primer on partial
least squares structural equation modeling (PLS-SEM). Sage publications.
Henseler, J., &
Schuberth, F. (2020). Using confirmatory composite analysis to assess emergent
variables in business research. Journal of Business Research, 120,
147–156.
Hulland, J. (1999).
Use of partial least squares (PLS) in strategic management research: A review
of four recent studies. Strategic Management Journal, 20(2), 195–204.
Vũ Hữu Thành, & Nguyễn Minh Hà. (2023). Giáo trình phân tích dữ liệu áp dụng mô hình PLS - SEM (1st ed.). NXB ĐH Quốc Gia Tp HCM.
Sarstedt, M., Hair Jr,
J. F., Cheah, J. H., Becker, J. M., & Ringle, C. M. (2019). How to specify,
estimate, and validate higher-order constructs in PLS-SEM. Australasian marketing journal, 27(3), 197-211.