CB-SEM vs PLS-SEM vs
Consistent PLS-SEM: Hướng dẫn chọn phương pháp phân tích phù hợp cho nghiên cứu
Trong nghiên cứu khoa học xã hội và
kinh doanh, CB-SEM và PLS-SEM đã trở thành hai phương pháp phân tích quen thuộc
với hầu hết các nhà nghiên cứu. CB-SEM được biết đến như “tiêu chuẩn vàng” cho
theory testing, trong khi PLS-SEM nổi tiếng với khả năng dự đoán và tính linh
hoạt. Tuy nhiên, một “người chơi” mới đang âm thầm thu hút sự chú ý -
Consistent PLS-SEM (PLSc).
PLSc được phát triển như một giải pháp “best
of both worlds”, hứa hẹn mang lại độ chính xác của CB-SEM nhưng vẫn giữ được
tính linh hoạt của PLS-SEM. Vậy PLSc thực sự là gì? Khi nào nên sử dụng? Và liệu
nó có thể thay thế hai “ông lớn” truyền thống? Bài viết này sẽ tập trung giải
đáp những thắc mắc về PLSc và so sánh với các phương pháp hiện có.
A. Tổng quan về Structural Equation
Modeling (SEM)
SEM là một kỹ thuật thống kê đa biến thế
hệ thứ hai (so với thế hệ thứ nhất như regression, ANOVA, EFA, v.v), cho phép
kiểm định đồng thời nhiều mối quan hệ phụ thuộc giữa các biến được đo lường và
các construct tiềm ẩn (Hair et al., 2019). Điểm mạnh của SEM nằm ở khả năng
tích hợp các biến tiềm ẩn vào mô hình - những biến không thể đo lường trực tiếp
nhưng có thể được đo lường gián tiếp thông qua một tập hợp các chỉ báo (biến biểu
thị).
Hiện tại, có hai phương pháp chính
(CB-SEM, PLS-SEM) và một phương pháp mới nổi (PLSc):
• Covariance-Based SEM (CB-SEM). Được sử dụng rộng rãi từ những năm
1970s.
• Partial Least Squares SEM (PLS-SEM). Phổ biến từ những năm 2000s.
• Consistent PLS-SEM (PLSc). Vẫn trong giai đoạn early adoption. Ở một
số khu vực/lĩnh vực, PLSc vẫn rất ít được biết đến. Các journal top-tier mới bắt
đầu chấp nhận PLSc trong vài năm gần đây.
Ngoài ra, còn có các phương pháp ngách
(niche) vẫn có ít nghiên cứu ứng dụng, đó là các phương pháp GSCA, LISREL
variants, v.v.
Nội dung bài viết này sẽ nhắc lại các ưu
và nhược điểm của hai phương pháp truyền thống, và so sánh với PLSc để các bạn
có cái nhìn tổng quan hơn.
1. Covariance-Based SEM (CB-SEM):
Phương pháp truyền thống
Đặc điểm cốt lõi
CB-SEM là phương pháp SEM “cổ điển”, hoạt
động dựa trên việc so sánh sự khác biệt giữa ma trận hiệp phương sai quan sát
và ma trận hiệp phương sai ước tính (Hair và cộng sự, 2019). Đây là một phương
pháp confirmatory (xác nhận), yêu cầu nền tảng lý thuyết vững chắc để kiểm định.
Ưu điểm
• Độ chính xác cao: Cung cấp các ước lượng chính xác cho
các mối quan hệ cấu trúc
• Kiểm định model
fit toàn diện: Có nhiều
chỉ số đánh giá độ phù hợp mô hình (χ²,
RMSEA, CFI, GFI, TLI, v.v.)
• Được chấp nhận rộng
rãi: Phương pháp truyền thống được các tạp
chí khoa học ưa chuộng
• Lý thuyết vững chắc: Có nền tảng toán học và thống kê mạnh
mẽ
Nhược điểm
• Yêu cầu nghiêm ngặt: Cần dữ liệu phân phối chuẩn đa biến
• Cỡ mẫu lớn: Thường yêu cầu ít nhất 200-400 quan
sát
• Khó xử lý mô hình
phức tạp: Gặp khó khăn với
mô hình có nhiều construct hoặc chỉ báo
• Không phù hợp với
dữ liệu formative: Chủ yếu
thiết kế cho measurement model reflective
Khi nào nên sử dụng CB-SEM?
• Mục tiêu nghiên cứu là theory
testing (kiểm định lý thuyết)
• Có nền tảng lý thuyết vững chắc và muốn
xác nhận
• Cỡ mẫu đủ lớn (>200) và dữ liệu phân
phối chuẩn
• Các construct đều là reflective
• Quan tâm đến model fit và độ chính xác
của ước lượng
2. Partial Least
Squares SEM (PLS-SEM): Phương pháp dự đoán
Đặc điểm cốt lõi
PLS-SEM là phương pháp
causal-predictive, tập trung vào việc tối đa hóa phương sai được giải thích
trong các construct phụ thuộc (Hair et al., 2017). Đây là phương pháp
variance-based, không yêu cầu giả định phân phối chuẩn.
Ưu điểm
• Linh hoạt về dữ liệu: Không yêu cầu phân phối chuẩn, xử lý
được dữ liệu non-normal
• Cỡ mẫu nhỏ: Có thể hoạt động hiệu quả với cỡ mẫu
nhỏ (theo “10 times rule”)
• Xử lý mô hình phức
tạp: Thích hợp với mô hình có nhiều
construct và chỉ báo
• Hỗ trợ formative
measurement: Có thể
xử lý cả reflective và formative constructs
• Khả năng dự đoán
cao: Tối ưu hóa R² và có công cụ
PLSpredict
Nhược điểm
• Ước lượng không nhất
quán: Có xu hướng underestimate các path
coefficients
• Model fit hạn chế: Ít chỉ số đánh giá model fit
• Bias trong ước lượng: Chịu ảnh hưởng của measurement error
• Không phù hợp cho
theory testing: Chủ yếu
dành cho exploratory research
Khi nào nên sử dụng PLS-SEM?
• Mục tiêu nghiên cứu là prediction
(dự đoán) hoặc theory development
• Cỡ mẫu nhỏ hoặc dữ liệu không phân phối
chuẩn
• Mô hình phức tạp với nhiều construct
• Có formative constructs
• Nghiên cứu exploratory hoặc ứng dụng thực tế
3. Consistent PLS-SEM (PLSc): Giải pháp
cầu nối
Đặc điểm cốt lõi
PLSc là phiên bản cải tiến của PLS-SEM,
được Dijkstra và Henseler (2015) phát triển để khắc phục vấn đề attenuation
bias trong PLS-SEM truyền thống. PLSc sử dụng correction factor để tạo ra các ước
lượng consistent và gần với CB-SEM hơn.
Cách thức hoạt động
PLSc thực hiện hai bước chính:
Bước
1: Chạy PLS-SEM thông thường để có ước
lượng ban đầu
Bước
2: Áp dụng correction factor dựa trên
composite reliability để điều chỉnh path coefficients
Ưu điểm
• Ước lượng nhất
quán: Cung cấp consistent estimates như
CB-SEM
• Giữ được ưu điểm
PLS: Vẫn linh hoạt về sample size và data
distribution
• Kết quả gần CB-SEM: Path coefficients và effect sizes
tương tự CB-SEM
• Model fit tốt hơn
PLS: Các chỉ số fit tốt hơn PLS-SEM truyền
thống
Nhược điểm
• Điều kiện áp dụng: Chỉ hiệu quả khi construct
reliability cao (>0.7)
• Statistical power
thấp: Thấp hơn so với PLS-SEM truyền thống
• Chưa được chấp nhận
rộng rãi: Vẫn đang trong quá
trình được cộng đồng nghiên cứu chấp nhận
• Không phù hợp mọi
trường hợp: Khi reliability thấp,
PLSc không mang lại lợi ích
Khi nào nên sử dụng PLSc?
• Mục tiêu là confirmatory nhưng
không đáp ứng được yêu cầu CB-SEM
• Construct reliability cao (Composite
Reliability > 0.7)
• Muốn có ước lượng chính xác hơn PLS-SEM
nhưng giữ được tính linh hoạt
• So sánh với kết quả CB-SEM
B. So sánh thực nghiệm: Bằng chứng từ
nghiên cứu
Nghiên cứu của Vuković (2024) đã so
sánh cả ba phương pháp trên cùng một mô hình Theory of Planned Behavior với 200
quan sát. Kết quả cho thấy:
Measurement Model
• PLS-SEM: Có factor loadings cao nhất và các chỉ
số validity/reliability tốt nhất
• CB-SEM và PLSc: Kết quả tương tự nhau, loadings thấp
hơn PLS-SEM một chút
Structural Model
• CB-SEM: Path coefficients mạnh, model fit tốt
(CFI=0.946, RMSEA=0.092)
• PLSc: Path coefficients gần giống CB-SEM,
model fit tương đương
• PLS-SEM: Path coefficients yếu hơn, nhưng
predictive power cao (R²=0.661)
Kết luận nghiên cứu
Tác giả kết luận rằng không có phương
pháp nào “tốt nhất”, mà cần chọn phương pháp phù hợp với mục tiêu nghiên cứu cụ
thể.
C. Hướng dẫn lựa chọn phương pháp
Decision Tree cho việc lựa chọn
D. Tiêu chí cụ thể
Tiêu
chí |
CB-SEM |
PLS-SEM |
PLSc |
Mục
tiêu chính |
Theory
confirmation |
Prediction/Exploration |
Theory
confirmation (flexible) |
Sample
size |
>200 |
≥30
(10x rule) |
≥50 |
Data
distribution |
Multivariate
normal |
Không
yêu cầu |
Không
yêu cầu |
Model
complexity |
Đơn
giản-Trung bình |
Cao |
Trung
bình |
Formative
constructs |
Khó
xử lý |
Hỗ
trợ tốt |
Hỗ
trợ |
Construct
reliability |
Không
quan trọng |
Không
quan trọng |
>0.7 |
E. Khuyến nghị thực hành
1. Nghiên cứu Confirmatory
• Ưu tiên CB-SEM nếu đáp ứng được các yêu cầu
• Sử dụng PLSc như giải pháp thay thế khi CB-SEM
không khả thi
• Tránh PLS-SEM trừ khi mục tiêu chính là prediction
2. Nghiên cứu Exploratory/Predictive
• Ưu tiên PLS-SEM cho khả năng dự đoán và tính linh hoạt
• Cân nhắc PLSc nếu muốn kết quả stable hơn
• Sử dụng CB-SEM để validate findings trong giai đoạn
sau
3. Phương pháp kết hợp (Complementary
Approach)
Nhiều nghiên cứu hiện
tại áp dụng cả hai hoặc cả ba phương pháp để:
• Kiểm tra tính robust của kết quả
• So sánh predictive power vs. model fit
• Tăng cường độ tin cậy của findings
4. Báo cáo kết quả
• Luôn giải thích lý
do lựa chọn phương
pháp cụ thể
• Thảo luận về
limitations của
phương pháp đã chọn
• So sánh kết quả nếu sử dụng nhiều phương pháp
F. Xu hướng tương lai
1. Sự phát triển của
PLSc
PLSc đang dần được
chấp nhận rộng rãi hơn, đặc biệt trong:
• Nghiên cứu có yêu cầu confirmatory
nhưng dữ liệu không hoàn hảo
• Các tạp chí bắt đầu chấp nhận PLSc như
alternative cho CB-SEM
2. Công cụ phân tích mới
• CVPAT (Cross-Validated Predictive Ability
Test) cho PLS-SEM
• Model fit measures được phát triển thêm cho PLS-SEM
• Hybrid approaches kết hợp ưu điểm của các phương pháp
3. Standardization
Cộng đồng nghiên cứu
đang hướng tới việc chuẩn hóa:
• Guidelines cho việc lựa chọn phương
pháp
• Reporting standards cho từng phương
pháp
• Best practices trong multi-method
analysis
G. Kết luận
Việc lựa chọn giữa CB-SEM, PLS-SEM, và
PLSc không có câu trả lời đúng sai tuyệt đối. Quyết định cuối cùng phải dựa
trên:
1.
Mục
tiêu nghiên cứu
(confirmatory vs. predictive)
2.
Đặc
điểm dữ liệu (sample
size, distribution, complexity)
3.
Bản
chất của model
(reflective vs. formative, số lượng constructs)
4.
Yêu
cầu của tạp chí hoặc cơ
quan đánh giá
Quan trọng nhất, các
phương pháp này nên được xem là bổ sung cho nhau chứ không phải cạnh
tranh với nhau. Một nghiên cứu hoàn chỉnh có thể hưởng lợi từ việc sử
dụng nhiều phương pháp để có cái nhìn toàn diện về mối quan hệ giữa các biến.
Điều cuối cùng cần nhớ là bất kể phương
pháp nào được chọn, chất lượng của nghiên cứu vẫn phụ thuộc vào lý thuyết vững
chắc, thiết kế nghiên cứu hợp lý, và thực hiện cẩn thận các
bước phân tích.
H. Tài liệu tham khảo
Dijkstra, T. K., & Henseler, J. (2015).
Consistent and asymptotically normal PLS estimators for linear structural
equations. Computational Statistics & Data Analysis, 81,
10–23. https://doi.org/https://doi.org/10.1016/j.csda.2014.07.008
Hair, J. F., Black, W. C., Babin, B. J., &
Anderson, R. E. (2019). Multivariate Data Analysis. In Cengage Learning
(8th ed.). Cengage Learning.
Hair, J. F., Hult, G. T. M., Ringle, C. M.,
& Sarstedt, M. (2021). A primer on partial least squares structural
equation modeling (PLS-SEM) (2nd ed.). Sage publications.
Hair Jr, J. F., Matthews, L. M., Matthews, R.
L., & Sarstedt, M. (2017). PLS-SEM or CB-SEM: updated guidelines on which
method to use. International Journal of Multivariate Data Analysis, 1(2),
107–123.
Vukovi´c, M. (2024). CB-SEM vs PLS-SEM comparison in estimating the predictors of investment intention. Croatian Operational Research Review, 15(2), 131–144. https://doi.org/10.17535/crorr.2024.0011