TẦM QUAN TRỌNG CỦA CỠ MẪU TRONG PLS-SEM VÀ CB-SEM: SỰ KHÁC BIỆT VÀ ỨNG DỤNG THỰC TẾ
Khi chúng ta bước
vào lĩnh vực nghiên cứu và phân tích dữ liệu, một trong những thách thức quan
trọng là quyết định về cỡ mẫu. Cỡ mẫu tối thiểu đảm bảo rằng kết quả của phân
tích có thể đáng tin cậy và khả quan. Trong phạm vi tản mạn này, chúng ta
sẽ khám phá việc xác định cỡ mẫu tối thiểu trong hai phương pháp phân tích SEM
phổ biến: CB-SEM và PLS-SEM.
Cỡ mẫu là một khái niệm quan trọng trong thống kê và nghiên cứu khoa học, nó đã trải qua quá trình phát triển dưới sự ảnh hưởng của nhiều nhà khoa học và nghiên cứu gia. Trong thế kỷ 19, thống kê và nghiên cứu khoa học bắt đầu trở nên phổ biến hơn, nhưng ý thức về tầm quan trọng của cỡ mẫu vẫn chưa được phát triển rõ ràng. Người ta thường tiến hành các thử nghiệm và khảo sát với số lượng mẫu nhỏ, và việc xác định cỡ mẫu thường dựa vào sự tiện lợi và khả năng tiếp cận. Trong những năm 1920 và 1930, các nhà thống kê như Ronald Fisher và Jerzy Neyman đã bắt đầu phát triển các phương pháp thống kê hiện đại và nhấn mạnh tầm quan trọng của việc chọn cỡ mẫu một cách hợp lý. Cụ thể, Fisher đã đề xuất các khái niệm như “lỗi loại I” và “lỗi loại II” (Type I error và Type II error) để mô tả các sai sót trong quá trình kiểm định giả thuyết. Trong thập kỷ 1960 và 1970, ý thức về cỡ mẫu tiếp tục gia tăng, đặc biệt là trong lĩnh vực thử nghiệm lâm sàng và y học. Các phương pháp tính toán cỡ mẫu dựa trên việc kiểm soát lỗi loại I và loại II đã được phát triển và sử dụng rộng rãi. Những năm gần đây, với sự phát triển của máy tính và công nghệ thông tin, việc tính toán cỡ mẫu và các phương pháp thống kê đã trở nên dễ dàng hơn và hiệu quả hơn. Nhiều phần mềm thống kê đã ra đời để hỗ trợ việc tính toán và ước tính cỡ mẫu dựa trên các yếu tố như mức độ biến thiên, độ chính xác mong muốn và độ tin cậy.
Có thể nói rằng, đặt
nền móng cho các nghiên cứu hiện đại về cỡ mẫu tối thiểu là nhà khoa học Jacob
Cohen. Jacob Cohen (1923–1998) là một nhà thống kê và nhà nghiên cứu tâm lý học
nổi tiếng, ông đã có một vai trò quan trọng trong việc phát triển và thúc đẩy ý
thức về tầm quan trọng của cỡ mẫu và kết quả thống kê trong nghiên cứu. Cohen
được biết đến nhiều nhất với việc định nghĩa khái niệm “kích thước hiệu ứng” (effect
size) và phương pháp tính toán cỡ mẫu trong việc thử nghiệm giả thuyết. Ông đã
đề xuất một số tiêu chuẩn để đo kích thước hiệu ứng trong các thử nghiệm thống
kê, và ông cũng đã nêu lên ý thức về việc cần có cỡ mẫu đủ lớn để có thể phát
hiện hiệu ứng thực sự, nếu có. Một trong những đóng góp quan trọng nhất của
Cohen là ý tưởng về “kích thước hiệu ứng chuẩn” (standardized effect size) để đo lường tầm
quan trọng của một hiệu ứng thống kê dựa trên độ lệch chuẩn. Ông đã đề xuất sử
dụng các chỉ số như f (dạng chuẩn của sự khác biệt giữa hai trung bình),
r (hệ số tương quan), và phi (cho dữ liệu hai nhóm nhị phân) để đo kích thước
hiệu ứng. Cohen cũng là người đã phát triển các ngưỡng cho kích thước hiệu ứng,
giúp các nhà nghiên cứu xác định liệu hiệu ứng đó có được coi là quan trọng hay
không. Đặc biệt, ông đã đề xuất ngưỡng thường được sử dụng cho f (như
0.2 nhỏ, 0.5 trung bình và 0.8 lớn) như một hướng dẫn chung cho việc đánh giá tầm
quan trọng của kết quả.
Những thế hệ đi sau
như, Joseph F. Hair Jr. là một nhà nghiên cứu nổi tiếng trong lĩnh vực tiếp thị
và quản trị kinh doanh, đặc biệt là về phân tích dữ liệu và phương pháp nghiên
cứu. Ông đã có nhiều đóng góp quan trọng trong việc phát triển phương pháp
PLS-SEM (Partial Least Squares Structural Equation Modeling), cụ thể là PLS-SEM
phi tham số hóa.
Mãi cho đến những
năm 2000, Hair cùng với các đồng nghiệp đã phát triển phương pháp PLS-SEM phi
tham số hóa, cũng được gọi là PLS-Graph. Phương pháp này là một biến thể của
PLS-SEM truyền thống, nhưng nó tập trung vào việc khảo sát mô hình mà không yêu
cầu ước tính các tham số cụ thể của mô hình.
PLS-SEM phi tham số
hóa đưa ra một cách tiếp cận linh hoạt và ít ràng buộc hơn trong việc phân tích
mô hình cấu trúc. Thay vì tập trung vào việc ước tính tham số của các mối quan
hệ giữa các biến, phương pháp này tập trung vào việc kiểm tra tính khả quan và
khả năng dự đoán của mô hình. Nó cho phép các nhà nghiên cứu thử nghiệm và tinh
chỉnh mô hình một cách dễ dàng hơn, mà không cần phải đảm bảo rằng mô hình phải
tuân theo những giả thuyết cụ thể. Cũng chính vì vậy mà PLS SEM còn được xem như
là một phương pháp dùng để khám phá nghiên cứu.
Với phương pháp này,
Hair và đồng nghiệp đã giúp định hình lại cách mà các nhà nghiên cứu tiếp cận
việc xây dựng và kiểm định mô hình cấu trúc, đặc biệt là trong lĩnh vực tiếp thị
và quản trị. PLS-SEM phi tham số hóa đã mở ra một hướng tiếp cận mới, giúp các
nhà nghiên cứu thực hiện các phân tích mô hình một cách linh hoạt hơn và phù hợp
với nhiều tình huống khác nhau.
Cũng chính vì những điều
trên mà cỡ mẫu tối thiểu cần thiết cho các phân tích PLS SEM về sau này được phần
lớn các nhà nghiên cứu thừa nhận là thấp hơn nhiều so với cỡ mẫu tối thiểu dùng
cho phân tích CB SEM. Xét về mục tiêu và cách tiếp cận của hai phương pháp, CB-SEM tập
trung vào kiểm định các giả thuyết cụ thể và mô hình được thiết kế trước. Vì vậy,
cần có cỡ mẫu đủ lớn để kiểm định chính xác các mối quan hệ giữa các biến và các giả
thuyết. Còn PLS-SEM tập trung vào việc dự đoán và mô hình dự đoán. Việc xây dựng
mô hình và kiểm tra khả năng dự đoán có thể cần ít dữ liệu hơn để đạt được độ
tin cậy mong muốn. Còn xét về tính linh hoạt của hai phương pháp, có thể thấy rằng,
PLS-SEM thường linh hoạt hơn trong việc xây dựng mô hình và không yêu cầu mối
quan hệ cụ thể giữa các biến như trong CB-SEM. Điều này cho phép PLS-SEM hoạt động
tốt với cỡ mẫu nhỏ hơn mà vẫn đảm bảo khả năng dự đoán tốt. Trên thực tế, trong
một số lĩnh vực như tiếp thị, quản trị, các dữ liệu thường không hoàn hảo và phức
tạp, dẫn đến việc khó khăn trong việc xây dựng mô hình CB-SEM với độ tin cậy
cao. Còn PLS-SEM có khả năng làm việc tốt hơn trong các trường hợp này vì nó chủ
yếu tập trung vào dự đoán mô hình thay vì kiểm định giả thuyết cụ thể. Tuy
nhiên, việc quyết định cỡ mẫu tối thiểu vẫn phụ thuộc vào nhiều yếu tố như mức
độ phức tạp của mô hình, mức độ biến thiên trong dữ liệu, mức độ tương quan giữa
các biến, và mức độ tin cậy mong muốn của kết quả. Chắc chắn là một cỡ mẫu đủ lớn
để đảm bảo tính khả quan và đáng tin cậy của kết quả vẫn là mục tiêu quan trọng
khi thực hiện bất kỳ phân tích nghiên cứu nào.
Công thức xác định cỡ
mẫu tối thiểu trong CB-SEM thường liên quan đến nguyên tắc “Rule of Thumb” hoặc
phương pháp mô phỏng Monte Carlo để đảm bảo độ tin cậy của kết quả ước tính. Một
phương pháp phổ biến để xác định cỡ mẫu là công thức “10:1” hoặc “5:1”, nghĩa
là cần có ít nhất 10 hoặc 5 mẫu cho mỗi biến được ước tính. Nhưng phương pháp này
cho đến thời điểm hiện tại được xem là không còn phù hợp nữa. Tuy nhiên, mức độ
phức tạp của mô hình, mức độ biến thiên trong dữ liệu, mức độ tương tác giữa
các biến, và mức độ tin cậy mong muốn của kết quả đều có thể ảnh hưởng đến cỡ mẫu
tối thiểu. Mô phỏng Monte Carlo là một phương pháp tốt để kiểm tra và xác minh
cỡ mẫu tối thiểu cho từng trường hợp cụ thể. Nghe có vẻ hợp lý nhưng để thực hiện
thì rất tốn kém và phức tạp, nên nhiều nhà nghiên cứu đã chủ động đề xuất thêm
các qui tắc xác định cỡ mẫu tối thiểu. Chẳng hạn như
Đối với PLS-SEM,
cung cấp một cách tiếp cận khác để phân tích mô hình cấu trúc. PLS-SEM tập
trung vào việc xây dựng các mô hình dự đoán hơn là thử nghiệm các giả thuyết cụ
thể. Trong PLS-SEM, sự quan tâm chủ yếu là tính linh hoạt và khả năng dự đoán của
mô hình. Do đó, cỡ mẫu tối thiểu trong PLS-SEM thường ít phụ thuộc vào số lượng
tham số ước tính hơn là vào khả năng dự đoán và độ tin cậy của mô hình. Cỡ mẫu
tối thiểu trong PLS-SEM không phụ thuộc mạnh vào số lượng tham số ước tính như
trong CB-SEM. Thay vào đó, nó tập trung vào việc đảm bảo tính linh hoạt và khả
năng dự đoán của mô hình. Công thức xác định cỡ mẫu thường liên quan đến mức độ
biến thiên trong dữ liệu và khả năng dự đoán mong muốn. Trong cuốn sách Multivariate
Data Analysis được Hair và ctg (2019) đề xuất cỡ mẫu tối thiểu cho PLS SEM là
10 lần số mũi tên chỉ vào một biến cấu trúc (construct variable) (trang 770).
Tuy nhiên, Hair và ctg cũng cho rằng, cỡ mẫu tối thiểu nên là 100, và trong nhiều
trường hợp cỡ mẫu ≤100 vẫn được chấp nhận tùy thuộc ngữ cảnh nghiên cứu cụ thể.
Một kết luận theo
kinh nghiệm của
Tóm lại, việc xác định
cỡ mẫu tối thiểu trong cả hai phương pháp đều không phải là một nhiệm vụ đơn giản.
Điều này phụ thuộc vào nhiều yếu tố như mức độ phức tạp của mô hình, mức độ biến
thiên trong dữ liệu, mức độ ảnh hưởng mong đợi giữa các biến, và mức độ tin cậy
mong muốn của kết quả. Việc xác định cỡ mẫu tối thiểu là một phần quan trọng của
quá trình nghiên cứu và phân tích dữ liệu bằng CB-SEM và PLS-SEM. Tuy chúng có
các phương pháp tiếp cận khác nhau, nhưng cả hai đều cần cân nhắc kỹ lưỡng về sự
cân bằng giữa số lượng và chất lượng mẫu để đảm bảo rằng kết quả phân tích là
đáng tin cậy và khả quan.
Tài liệu tham khảo
Cohen, J. (1988). Statistical
power analysis for the behavioral sciences. Academic press.
Cohen, J., Cohen,
P., West, S. G., & Aiken, L. S. (2013). Applied multiple
regression/correlation analysis for the behavioral sciences. Routledge.
Green, S. B. (1991).
How many subjects does it take to do a regression analysis. Multivariate
Behavioral Research, 26(3), 499–510.
Hair, J. F.,
Anderson, R. E., Tatham, R. L., & Black, W. C. (2019). Multivariate Data
Analysis. In Cengage Learning (8th ed.). Cengage Learning.
Hair Jr, J. F.,
Hult, G. T. M., Ringle, C. M., & Sarstedt, M. (2021). A primer on
partial least squares structural equation modeling (PLS-SEM). Sage
publications.
Jacob Cohen. (1992).
Quantitative methods in psychology: A power primer. Psychological Bulletin,
112(1,155-159).