HƯỚNG DẪN PHÂN TÍCH T-TEST VÀ ONE-WAY ANOVA

(PHẦN 1 - CƠ BẢN)

Để có kiến thức tốt và thiết thực nhất về các phương pháp thống kê ở mức cơ bản, cá nhân chúng tôi khuyên các bạn nên đọc qua bộ sách của Hoàng Trọng và Chu Nguyễn Mộng Ngọc được xuất bản năm 2008. Chúng tôi đánh giá rằng, bộ sách này (gồm 2 tập cơ bản và nâng cao) là kiến thức cô đọng và súc tích nhất cho tới nay. Các anh chị hạn chế tham khảo kiến thức trên mạng, mình làm nghiên cứu cái gì cũng cần phải có nguồn dẫn khoa học thì mới thuyết phục.

I. LÝ THUYẾT CƠ BẢN

T-Test và One-Way ANOVA là hai phương pháp thống kê phổ biến được sử dụng để kiểm tra sự khác biệt giữa các nhóm dữ liệu. Dưới đây là phân tích nhanh về cả hai phương pháp này:

1. T-Test (Kiểm định T):

T-Test là một phương pháp thống kê dùng để kiểm tra xem có sự khác biệt có ý nghĩa giữa hai nhóm dữ liệu hay không. T-Test đánh giá sự khác biệt giữa các trung bình của hai nhóm và xác định xem liệu sự khác biệt này có thể được coi là có ý nghĩa thống kê hay không.

Có hai loại chính của T-Test:

• T-Test độc lập (Independent T-Test): Sử dụng khi chúng ta muốn so sánh trung bình của một biến số giữa hai nhóm độc lập (không phụ thuộc lẫn nhau).

• T-Test phụ thuộc (Paired T-Test): Sử dụng khi chúng ta muốn so sánh trung bình của một biến số trong cùng một nhóm trong hai thời điểm khác nhau.

→ Mục đích của T-Test là kiểm tra xem sự khác biệt giữa các trung bình có đủ lớn để coi là có ý nghĩa thống kê hay không.

Khi chạy kiểm định T-test, các bạn đối chiếu với bảng sau đây để kết luận (Hoàng trọng và Châu Nguyễn Mộng Ngọc, 2008):


Lưu ý rằng, T-test chỉ thực hiện so sánh theo cặp. Nên đối với các biến cần kiểm định sự khác biệt mà có nhiều hơn 2 nhóm thì chúng ta phải thực hiện từng cặp một. Việc này sẽ tốn thời gian, và mức độ chính xác của kết quả sẽ không còn đảm bảo độ tin cậy 95%. Do đó, trong trường hợp này, chúng ta sẽ chuyển qua kiểm định One-way ANOVA. Kiểm định này sẽ giúp chúng ta thực hiện so sánh các nhóm cùng một lúc. 

2. One-Way ANOVA (Phân tích phương sai một chiều):

One-Way ANOVA là một phương pháp thống kê được sử dụng để kiểm tra sự khác biệt giữa ba hoặc nhiều hơn các nhóm dữ liệu. Nó đánh giá xem có sự khác biệt ý nghĩa giữa trung bình của các nhóm dữ liệu hay không.

One-Way ANOVA giả định rằng các nhóm dữ liệu được kiểm tra đều có phân phối chuẩn và có phương sai bằng nhau. Nếu kết quả phân tích cho thấy có sự khác biệt ý nghĩa giữa ít nhất hai trong số các nhóm, chúng ta có thể thực hiện các phân tích thêm để xác định nhóm nào chứa sự khác biệt.

→ Mục đích của One-Way ANOVA là kiểm tra sự khác biệt giữa các trung bình của ba hoặc nhiều nhóm để xác định xem liệu có ít nhất một nhóm có sự khác biệt ý nghĩa so với các nhóm khác hay không.

Trong cả T-Test và One-Way ANOVA, mục đích cuối cùng là đánh giá sự khác biệt giữa các nhóm dữ liệu và xác định liệu sự khác biệt này có ý nghĩa thống kê hay không. Lưu ý rằng, trước khi thực hiện bất kỳ phân tích nào, chúng cần kiểm tra các giả định của phân phối dữ liệu và phương sai, để đảm bảo tính hợp lý và đáng tin cậy của kết quả phân tích. Việc đánh giá phân phối chuẩn của dữ liệu anh chị xem thêm tại bài viết cũ hơn của chúng tôi ở đây. Trong nội dung bài viết này, chúng ta mặc định dữ liệu đảm bảo tính phân phối chuẩn.

Khi chạy kiểm định One-Way ANOVA, các bạn cần đối chiếu với bảng sau đây để kết luận (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008; Salcedo & McCormick, 2023):


II. THỰC HÀNH PHÂN TÍCH

Tiếp theo sau đây, chúng ta sẽ tiến hành phân tích mẫu T-test và One-way ANOVA. Biến phụ thuộc của chúng ta là RI (Ý định mua lặp lại sản phẩm), và các biến nhân khẩu học bao gồm: Nhóm mua, Giới tính, Tuổi và Trình độ học vấn. Đặc điểm của các biến Nhân khẩu học như Bảng bên dưới.

Lưu ý rằng, trong phạm vi bài viết này, chúng tôi sẽ không đi sâu vào cách chạy phân tích bằng phần mềm SPSS, anh chị quan tâm có thể tìm đọc tài liệu được Dịch vụ số liệu Lê Minh chia sẻ tại đây.

Tên biến

Mã hóa

Đặc điểm

Nhóm mua

1

Nhóm mua ở chợ truyền thống

2

Nhóm mua ở các của hàng tiện lợi hoặc siêu thị

Giới tính

1

Nam

2

Nữ

Tuổi

1

≤ 22 tuổi

2

23 đến 30 tuổi

3

31 đến 45 tuổi

4

Trên 45 tuổi

Trình độ học vấn

1

≤ THPT

2

Trung cấp/Cao đẳng

3

Đại học

4

Sau đại học

Chúng ta lưu ý rằng, kiểm định T-test chỉ thực hiện đối với các biến có từ 2 nhóm trở xuống, với các biến từ 3 nhóm trở lên thì cần chạy kiểm định One way Anova. Trong trường hợp ví dụ này, chúng ta chạy T-test cho các biến là Nhóm mua và Giới tính, các biến còn lại là Tuổi và Trình độ học vấn sẽ được chạy kiểm định One way Anova. Ở đây, chúng tôi chỉ trình bày mẫu chạy cho các biến là Nhóm mua và Trình độ học vấn.

1. Nhóm mua

Để chạy kiểm định T-test cho Nhóm mua, chúng ta thực hiện các bước như hình bên dưới.


Sau đó đọc kết quả.


Các giá trị Sig. đều đạt mức ý nghĩa thống kê (≤ 5%) nên kết luận rằng, Nhóm mua có sự khác biệt có ý nghĩa thống kê đối với Ý định mua lặp lại của khách hàng. Để đánh giá thêm về ý định mua lặp lại của 2 nhóm mua (nhóm nào có ý định mua lặp lại cao hơn) mà không cần chạy MGA, chúng ta thực hiện như sau. Chúng ta copy bảng Group Statistics vào Excel, sau đó vẽ đồ thị về giá trị MEAN như hình dưới. Tí nữa phía sau mình sẽ trình bày chi tiết cách tính giá trị Mean này là như thế nào. Chúng ta tạm hiểu giá trị mean này là giá trị mean của biến phụ thuộc RI tương ứng với từng nhóm mua.

 

Từ đồ thị có thể thấy được rằng, Nhóm mua ở siêu thị hay cửa hàng tiện lợi có khuynh hướng mua lặp lại sản phẩm cao hơn Nhóm mua ở chợ truyền thống.

2. Trình độ học vấn

Đối với Trình độ học vấn, chúng ta sẽ thực hiện kiểm định One way Anova. Các bước thực hiện được triển khai như hình dưới.


Ở phần option chúng ta lựa chọn như hình, các mục khác cứ để mặc định nhé.


Đọc kết quả

 


Các giá trị Sig. đều đạt mức ý nghĩa thống kê (≤ 5%), nên kết luận được rằng, Trình độ học vấn có sự khác biệt có ý nghĩa thống kê với Ý định mua lặp lại sản phẩm của khách hàng. Cụ thể chúng ta tiến hành thêm phân tích đồ thị về giá trị mean như sau. Anh chị cũng copy bảng thống kê nhóm vào Excel và vẽ đồ thị cho giá trị mean nhé.


Nhìn vào đồ thị chúng ta có thể thấy được rằng, trình độ càng thấp người ta có khuynh hướng mua lặp lại càng nhiều.

Nếu không muốn thể hiện đồ thị bằng Excel cho dễ nhìn thì chúng ta có thể sử dụng công cụ SPSS để vẽ đồ thị giá trị mean cũng được nhé. Để vẽ đồ thị khi lựa chọn phân tích T-test hay Anova, anh chị nhớ click chuột chọn Means plot như hình bên dưới là được.


Kết quả đồ thị được vẽ trực tiếp trong SPSS như sau:

III. Nhận xét chung và cách tính giá trị mean trong bảng Group Statistics

Đối với phân tích T-test và One-way Anova chúng ta cũng chỉ đánh giá được sơ bộ và khuynh hướng của các nhóm biến đối với biến chúng ta so sánh. Còn để phân tích sâu hơn, từng nhóm biến có ảnh hưởng như thế nào trong mô hình nghiên cứu thì chúng ta cần phải tiến hành các phân tích chuyên sâu như MGA.

Giờ chúng ta sẽ tìm hiểu cách chương trình tính giá trị mean trong bảng thống kê là như thế nào.

Giá trị mean trong bảng thống kê nhóm biến là giá trị mean của biến đối tượng so sánh (ở đây là biến RI – Ý định mua lặp lại) theo từng nhóm biến. Ví dụ, mình sẽ tính giá trị mean cho phân tích One way Anova của biến Trình độ học vấn. Trước tiên, chúng ta copy cột biến Trình độ học vấn và biến RI vào file excel.


Công thức mình sử dụng trong excel như sau: Chúng ta chỉ cài công thức như ở ô B4 rồi sau đó kéo thả là xong.


Như vậy tới đây chúng tôi tạm xong phần hướng dẫn các anh chị phân tích các kiểm định T-test và One way Anova. Anh chị nào có nhu cầu về số liệu thì hãy liên hệ với Dịch vụ số liệu Lê Minh nhé. Trân trọng cảm ơn.

Một số giải thích cơ bản cho T-test và Anova One-way chúng tôi xin phép được trích nguyên văn của George, D., & Mallery, P. (2021).



Tài liệu tham khảo

George, D., & Mallery, P. (2022). IBM SPSS statistics 27 step by step: A simple guide and reference. Routledge. https://doi.org/10.4324/9781003205333

Hoàng Trọng và Chu Nguyễn Mộng Ngọc. (2008). Phân tích dữ liệu nghiên cứu với SPSS. NXB Hồng Đức.

Salcedo, J., & McCormick, K. (2023). SPSS statistics for dummies. John Wiley & Sons.

 

0971202308