TẦM QUAN TRỌNG CỦA CỠ MẪU TRONG PLS-SEM VÀ CB-SEM: SỰ KHÁC BIỆT VÀ ỨNG DỤNG THỰC TẾ

 

Khi chúng ta bước vào lĩnh vực nghiên cứu và phân tích dữ liệu, một trong những thách thức quan trọng là quyết định về cỡ mẫu. Cỡ mẫu tối thiểu đảm bảo rằng kết quả của phân tích có thể đáng tin cậy và khả quan. Trong phạm vi tản mạn này, chúng ta sẽ khám phá việc xác định cỡ mẫu tối thiểu trong hai phương pháp phân tích SEM phổ biến: CB-SEM và PLS-SEM.

Cỡ mẫu là một khái niệm quan trọng trong thống kê và nghiên cứu khoa học, nó đã trải qua quá trình phát triển dưới sự ảnh hưởng của nhiều nhà khoa học và nghiên cứu gia. Trong thế kỷ 19, thống kê và nghiên cứu khoa học bắt đầu trở nên phổ biến hơn, nhưng ý thức về tầm quan trọng của cỡ mẫu vẫn chưa được phát triển rõ ràng. Người ta thường tiến hành các thử nghiệm và khảo sát với số lượng mẫu nhỏ, và việc xác định cỡ mẫu thường dựa vào sự tiện lợi và khả năng tiếp cận. Trong những năm 1920 và 1930, các nhà thống kê như Ronald Fisher và Jerzy Neyman đã bắt đầu phát triển các phương pháp thống kê hiện đại và nhấn mạnh tầm quan trọng của việc chọn cỡ mẫu một cách hợp lý. Cụ thể, Fisher đã đề xuất các khái niệm như “lỗi loại I” và “lỗi loại II” (Type I error và Type II error) để mô tả các sai sót trong quá trình kiểm định giả thuyết. Trong thập kỷ 1960 và 1970, ý thức về cỡ mẫu tiếp tục gia tăng, đặc biệt là trong lĩnh vực thử nghiệm lâm sàng và y học. Các phương pháp tính toán cỡ mẫu dựa trên việc kiểm soát lỗi loại I và loại II đã được phát triển và sử dụng rộng rãi. Những năm gần đây, với sự phát triển của máy tính và công nghệ thông tin, việc tính toán cỡ mẫu và các phương pháp thống kê đã trở nên dễ dàng hơn và hiệu quả hơn. Nhiều phần mềm thống kê đã ra đời để hỗ trợ việc tính toán và ước tính cỡ mẫu dựa trên các yếu tố như mức độ biến thiên, độ chính xác mong muốn và độ tin cậy.

Có thể nói rằng, đặt nền móng cho các nghiên cứu hiện đại về cỡ mẫu tối thiểu là nhà khoa học Jacob Cohen. Jacob Cohen (1923–1998) là một nhà thống kê và nhà nghiên cứu tâm lý học nổi tiếng, ông đã có một vai trò quan trọng trong việc phát triển và thúc đẩy ý thức về tầm quan trọng của cỡ mẫu và kết quả thống kê trong nghiên cứu. Cohen được biết đến nhiều nhất với việc định nghĩa khái niệm “kích thước hiệu ứng” (effect size) và phương pháp tính toán cỡ mẫu trong việc thử nghiệm giả thuyết. Ông đã đề xuất một số tiêu chuẩn để đo kích thước hiệu ứng trong các thử nghiệm thống kê, và ông cũng đã nêu lên ý thức về việc cần có cỡ mẫu đủ lớn để có thể phát hiện hiệu ứng thực sự, nếu có. Một trong những đóng góp quan trọng nhất của Cohen là ý tưởng về “kích thước hiệu ứng chuẩn”  (standardized effect size) để đo lường tầm quan trọng của một hiệu ứng thống kê dựa trên độ lệch chuẩn. Ông đã đề xuất sử dụng các chỉ số như f (dạng chuẩn của sự khác biệt giữa hai trung bình), r (hệ số tương quan), và phi (cho dữ liệu hai nhóm nhị phân) để đo kích thước hiệu ứng. Cohen cũng là người đã phát triển các ngưỡng cho kích thước hiệu ứng, giúp các nhà nghiên cứu xác định liệu hiệu ứng đó có được coi là quan trọng hay không. Đặc biệt, ông đã đề xuất ngưỡng thường được sử dụng cho f (như 0.2 nhỏ, 0.5 trung bình và 0.8 lớn) như một hướng dẫn chung cho việc đánh giá tầm quan trọng của kết quả.

Những thế hệ đi sau như, Joseph F. Hair Jr. là một nhà nghiên cứu nổi tiếng trong lĩnh vực tiếp thị và quản trị kinh doanh, đặc biệt là về phân tích dữ liệu và phương pháp nghiên cứu. Ông đã có nhiều đóng góp quan trọng trong việc phát triển phương pháp PLS-SEM (Partial Least Squares Structural Equation Modeling), cụ thể là PLS-SEM phi tham số hóa.

Mãi cho đến những năm 2000, Hair cùng với các đồng nghiệp đã phát triển phương pháp PLS-SEM phi tham số hóa, cũng được gọi là PLS-Graph. Phương pháp này là một biến thể của PLS-SEM truyền thống, nhưng nó tập trung vào việc khảo sát mô hình mà không yêu cầu ước tính các tham số cụ thể của mô hình.

PLS-SEM phi tham số hóa đưa ra một cách tiếp cận linh hoạt và ít ràng buộc hơn trong việc phân tích mô hình cấu trúc. Thay vì tập trung vào việc ước tính tham số của các mối quan hệ giữa các biến, phương pháp này tập trung vào việc kiểm tra tính khả quan và khả năng dự đoán của mô hình. Nó cho phép các nhà nghiên cứu thử nghiệm và tinh chỉnh mô hình một cách dễ dàng hơn, mà không cần phải đảm bảo rằng mô hình phải tuân theo những giả thuyết cụ thể. Cũng chính vì vậy mà PLS SEM còn được xem như là một phương pháp dùng để khám phá nghiên cứu.

Với phương pháp này, Hair và đồng nghiệp đã giúp định hình lại cách mà các nhà nghiên cứu tiếp cận việc xây dựng và kiểm định mô hình cấu trúc, đặc biệt là trong lĩnh vực tiếp thị và quản trị. PLS-SEM phi tham số hóa đã mở ra một hướng tiếp cận mới, giúp các nhà nghiên cứu thực hiện các phân tích mô hình một cách linh hoạt hơn và phù hợp với nhiều tình huống khác nhau.

Cũng chính vì những điều trên mà cỡ mẫu tối thiểu cần thiết cho các phân tích PLS SEM về sau này được phần lớn các nhà nghiên cứu thừa nhận là thấp hơn nhiều so với cỡ mẫu tối thiểu dùng cho phân tích CB SEM. Xét về mục tiêu và cách tiếp cận của hai phương pháp, CB-SEM tập trung vào kiểm định các giả thuyết cụ thể và mô hình được thiết kế trước. Vì vậy, cần có cỡ mẫu đủ lớn để kiểm định chính xác các mối quan hệ giữa các biến và các giả thuyết. Còn PLS-SEM tập trung vào việc dự đoán và mô hình dự đoán. Việc xây dựng mô hình và kiểm tra khả năng dự đoán có thể cần ít dữ liệu hơn để đạt được độ tin cậy mong muốn. Còn xét về tính linh hoạt của hai phương pháp, có thể thấy rằng, PLS-SEM thường linh hoạt hơn trong việc xây dựng mô hình và không yêu cầu mối quan hệ cụ thể giữa các biến như trong CB-SEM. Điều này cho phép PLS-SEM hoạt động tốt với cỡ mẫu nhỏ hơn mà vẫn đảm bảo khả năng dự đoán tốt. Trên thực tế, trong một số lĩnh vực như tiếp thị, quản trị, các dữ liệu thường không hoàn hảo và phức tạp, dẫn đến việc khó khăn trong việc xây dựng mô hình CB-SEM với độ tin cậy cao. Còn PLS-SEM có khả năng làm việc tốt hơn trong các trường hợp này vì nó chủ yếu tập trung vào dự đoán mô hình thay vì kiểm định giả thuyết cụ thể. Tuy nhiên, việc quyết định cỡ mẫu tối thiểu vẫn phụ thuộc vào nhiều yếu tố như mức độ phức tạp của mô hình, mức độ biến thiên trong dữ liệu, mức độ tương quan giữa các biến, và mức độ tin cậy mong muốn của kết quả. Chắc chắn là một cỡ mẫu đủ lớn để đảm bảo tính khả quan và đáng tin cậy của kết quả vẫn là mục tiêu quan trọng khi thực hiện bất kỳ phân tích nghiên cứu nào.

Công thức xác định cỡ mẫu tối thiểu trong CB-SEM thường liên quan đến nguyên tắc “Rule of Thumb” hoặc phương pháp mô phỏng Monte Carlo để đảm bảo độ tin cậy của kết quả ước tính. Một phương pháp phổ biến để xác định cỡ mẫu là công thức “10:1” hoặc “5:1”, nghĩa là cần có ít nhất 10 hoặc 5 mẫu cho mỗi biến được ước tính. Nhưng phương pháp này cho đến thời điểm hiện tại được xem là không còn phù hợp nữa. Tuy nhiên, mức độ phức tạp của mô hình, mức độ biến thiên trong dữ liệu, mức độ tương tác giữa các biến, và mức độ tin cậy mong muốn của kết quả đều có thể ảnh hưởng đến cỡ mẫu tối thiểu. Mô phỏng Monte Carlo là một phương pháp tốt để kiểm tra và xác minh cỡ mẫu tối thiểu cho từng trường hợp cụ thể. Nghe có vẻ hợp lý nhưng để thực hiện thì rất tốn kém và phức tạp, nên nhiều nhà nghiên cứu đã chủ động đề xuất thêm các qui tắc xác định cỡ mẫu tối thiểu. Chẳng hạn như Hair và ctg, (2019) (trang 132) đưa ra cỡ mẫu tối thiểu cho phân tích CB SEM được xác định bằng công thức n = max(50,5X), với X là số biến được đo lường trong mô hình nghiên cứu, tốt nhất là max(50, 10X). Còn theo Green (1991), cỡ mẫu tối thiếu được xác định n = 50 + 8m, với m là số biến dự báo (biến độc lập) trong mô hình (predictor variable).

Đối với PLS-SEM, cung cấp một cách tiếp cận khác để phân tích mô hình cấu trúc. PLS-SEM tập trung vào việc xây dựng các mô hình dự đoán hơn là thử nghiệm các giả thuyết cụ thể. Trong PLS-SEM, sự quan tâm chủ yếu là tính linh hoạt và khả năng dự đoán của mô hình. Do đó, cỡ mẫu tối thiểu trong PLS-SEM thường ít phụ thuộc vào số lượng tham số ước tính hơn là vào khả năng dự đoán và độ tin cậy của mô hình. Cỡ mẫu tối thiểu trong PLS-SEM không phụ thuộc mạnh vào số lượng tham số ước tính như trong CB-SEM. Thay vào đó, nó tập trung vào việc đảm bảo tính linh hoạt và khả năng dự đoán của mô hình. Công thức xác định cỡ mẫu thường liên quan đến mức độ biến thiên trong dữ liệu và khả năng dự đoán mong muốn. Trong cuốn sách Multivariate Data Analysis được Hair và ctg (2019) đề xuất cỡ mẫu tối thiểu cho PLS SEM là 10 lần số mũi tên chỉ vào một biến cấu trúc (construct variable) (trang 770). Tuy nhiên, Hair và ctg cũng cho rằng, cỡ mẫu tối thiểu nên là 100, và trong nhiều trường hợp cỡ mẫu ≤100 vẫn được chấp nhận tùy thuộc ngữ cảnh nghiên cứu cụ thể.

Một kết luận theo kinh nghiệm của Hair và ctg (2021), với cỡ mẫu nghiên cứu từ 250 trở lên thì kết quả phân tích PLS SEM và CB SEM sẽ tương đồng nhau (Exhibit 1.8).

Tóm lại, việc xác định cỡ mẫu tối thiểu trong cả hai phương pháp đều không phải là một nhiệm vụ đơn giản. Điều này phụ thuộc vào nhiều yếu tố như mức độ phức tạp của mô hình, mức độ biến thiên trong dữ liệu, mức độ ảnh hưởng mong đợi giữa các biến, và mức độ tin cậy mong muốn của kết quả. Việc xác định cỡ mẫu tối thiểu là một phần quan trọng của quá trình nghiên cứu và phân tích dữ liệu bằng CB-SEM và PLS-SEM. Tuy chúng có các phương pháp tiếp cận khác nhau, nhưng cả hai đều cần cân nhắc kỹ lưỡng về sự cân bằng giữa số lượng và chất lượng mẫu để đảm bảo rằng kết quả phân tích là đáng tin cậy và khả quan.

Tài liệu tham khảo

Cohen, J. (1988). Statistical power analysis for the behavioral sciences. Academic press.

Cohen, J., Cohen, P., West, S. G., & Aiken, L. S. (2013). Applied multiple regression/correlation analysis for the behavioral sciences. Routledge.

Green, S. B. (1991). How many subjects does it take to do a regression analysis. Multivariate Behavioral Research, 26(3), 499–510.

Hair, J. F., Anderson, R. E., Tatham, R. L., & Black, W. C. (2019). Multivariate Data Analysis. In Cengage Learning (8th ed.). Cengage Learning.

Hair Jr, J. F., Hult, G. T. M., Ringle, C. M., & Sarstedt, M. (2021). A primer on partial least squares structural equation modeling (PLS-SEM). Sage publications.

Jacob Cohen. (1992). Quantitative methods in psychology: A power primer. Psychological Bulletin, 112(1,155-159).

 

0971202308