Kiểm định phân phối chuẩn trong SPSS (Normal Distribution)

Canva

Kiểm định phân phối chuẩn trong SPSS có tên tiếng anh là: Normal Distribution được nêu ra bởi Abraham de Moivre vào năm 1733. Từ normal distribution không thể gọi là phân phối bình thường được, mà chúng ta phải gọi là phân phối chuẩn :D. Có rất nhiều cách để chúng ta nhận biết phân phối chuẩn trong spps, ở bài viết này sẽ giúp bạn giải đáp mọi thứ về nó.

Phân phối chuẩn (Normal Distribution) trong SPSS là gì?

Phân phối chuẩn là hàm mật độ xác suất được xác định bởi công thức sau:

Công thức tính phân phối chuẩn.

Điều này dẫn đến một đường cong đối xứng như ví dụ ở hình bên dưới.

Biểu đồ thể hiện 1 phân phối chuẩn trong spss (Chỉ số IQ của dân số)

Diện tích bề mặt bên dưới đường cong này cho chúng ta thấy rằng: phần trăm – hoặc xác suất – của bất kỳ khoảng giá trị nào. Giả sử rằng những điểm IQ này được phân phối bình thường với trung bình chỉ số IQ của dân số là 100 và độ lệch chuẩn là 15 điểm:

  • 34,1% trên tổng số người khảo sát đạt từ 85 đến 100 điểm;
  • 15,9% trên tổng số người khảo sát đạt từ 115 điểm trở lên;
  • một người ngẫu nhiên có 50% (hoặc 0,50) xác suất đạt được 100 điểm hoặc thấp hơn.

Trong thống kê, phân phối chuẩn đóng 2 vai trò quan trọng:

  • Phân phối tần suất (frequency distribution): ví dụ: điểm IQ được phân phối gần như bình thường trên một nhóm người.
  • Phân phối chọn mẫu (sampling distribution): giá trị tỷ lệ và trung bình của các mẫu được phân phối gần như bình thường. Từ phân phối chuẩn này, chúng ta có thể tra cứu xác suất cho bất kỳ tỷ lệ hoặc trung bình mẫu quan sát nào. * Về cơ bản, thì nó mang ý nghĩa thống kê.
Xem Thêm Bài Viết  Cách nhập (mã hóa) dữ liệu trong SPSS từ Excel

Dữ liệu của Phân phối chuẩn

Ví dụ về Dữ liệu của Phân phối chuẩn trong spss

Như hình ảnh ở trên, đây là một dữ liệu của kiểm định phân phối chuẩn của SPSS được hiển thị ở chế độ xem dữ liệu, đến từ một nghiên cứu giả: xem xét ảnh hưởng của việc chủ sở hữu chó có ảnh hưởng đến khả năng ném đĩa bay của họ không (ví dụ khá funny phải không ạ :D).

Khoảng cách ném đĩa bay tính bằng mét (được đánh dấu) là biến phụ thuộc và chúng ta cần biết liệu nó có được phân phối chuẩn hay không trước khi quyết định sử dụng bài kiểm tra thống kê nào đó để xác định xem việc sở hữu 1 chú chó có liên quan đến khả năng ném đĩa bay hay không.

Các tính phân phối chuẩn trong SPSS

Để bắt đầu, hãy nhấp vào Analyze -> Descriptive Statistics -> Explore… Thao tác này sẽ xuất hiện một cửa sổ như bên dưới.

Analyze -> Descriptive Statistics -> Explore…

Việc thiết lập ở đây là khá dễ dàng.

Đầu tiên, bạn phải chuyển biến Khoảng cách ném đĩa ném đĩa từ hộp bên trái vào hộp Dependent List. Bạn có thể click chuột vàkéo từ hộp bên trái sang bên phải vhoặc sử dụng mũi tên màu xanh lam ở giữa để di chuyển qua.

Hộp Factor List (danh sách yếu tố) cho phép bạn tách biến phụ thuộc của mình trên cơ sở các cấp độ khác nhau của (các) biến độc lập của bạn. Trong ví dụ trên, Chủ sở hữu chó là biến độc lập của chúng tôi, có hai cấp – chủ sở hữu và không phải chủ sở hữu – vì vậy chúng tôi có thể thêm Chủ sở hữu chó vào hộp Factor List và xem xét tách biến. Tuy nhiên, vì chúng tôi hoàn toàn có thể kiểm tra tính phân phối chuẩn mà không cần thêm thao tác này, nên chúng tôi sẽ để trống.

Xem Thêm Bài Viết  Tải Font Bevan Việt Hóa

Khi bạn đã chuyển biến mà bạn muốn kiểm tra tính chuẩn vào hộp Dependent List, bạn nên nhấp vào nút Plots . Hộp thoại Plots sẽ bật lên như hình dưới đây:

Trong hộp thoại này, bạn hãy chắc chắn rằng đã tích chọn Normality plots with tests. Bạn cũng có thể chọn thêm hai tùy chọn khác thống kê mô tả (Stem-and-leafHistogram) như hình.

Bây giờ hãy nhấp vào Continue, thao tác này sẽ đưa bạn trở lại hộp thoại Explore. Bây giờ nó sẽ trông giống như thế này.

Bây giờ, bạn đã có thể kiểm tra xem dữ liệu của mình có phân phối chuẩn hay không.

Ấn nút OK.

Nhận Biết phân phối chuẩn trong SPSS

Dưới đây là những gì bạn cần để đánh giá xem việc phân phối dữ liệu của mình có phải là phân phối chuẩn hay không. Và đây là kết quả:

Kết quả trả về khi thao tác kiểm định phân phối chuẩn trên spss

Chạy Kolmogorov-Smirnov và Shapiro-Wilk.

Nếu giá trị lớn hơn giá trị alpha (chúng tôi sẽ sử dụng 0,05 làm giá trị alpha), thì dữ liệu trên không có quá nhiều sự khác biệt so với phân phối chuẩn. Tức là, các dữ liệu này có tính phân phối chuẩn.

Như bạn có thể thấy ở trên, cả hai thử nghiệm đều cho giá trị ý nghĩa lớn hơn 0,05, do đó, chúng tôi có thể tin tưởng rằng dữ liệu của mình được phân phối chuẩn.

Có thể sẽ xảy ra trường hợp phức tạp hơn khi kết quả của hai bài kiểm tra không thống nhất với nhau. Trong tình huống này, hãy sử dụng kết quả Shapiro-Wilk – trong hầu hết các trường hợp, kết quả này đáng tin cậy hơn.

Xem Thêm Bài Viết  3 Cách tạo tài khoản Canva Pro miễn phí 2021

Sử dụng Biểu đồ Q-Q

Phần mềm SPSS cũng cung cấp một biểu đồ Q-Q cho ta thấy một biểu đồ trực quan về sự phân bố dữ liệu.

Nếu là phân phối chuẩn, thì các dấu chấm sẽ đi theo đường xu hướng. Như bạn có thể thấy ở trên, dữ liệu của chúng tôi tập hợp xung quanh đường xu hướng – điều này cung cấp thêm bằng chứng rằng phân phối của chúng tôi là phân phối chuẩn.

Chúng ta có thể kết hợp kết quả của biểu đồ Q-Q này cùng với kết quả của các bài kiểm tra thống kê ở phía trên và khẳng định một cách an toàn rằng dữ liệu này được phân phối chuẩn. Điều này có nghĩa là ít nhất một trong các tiêu chí để kiểm tra thống kê tham số được thỏa mãn.

*******************

Được rồi, hướng dẫn này nằm trong serie hướng dẫn sử dụng SPSS cơ bản của chúng tôi đã kết thúc. Bây giờ bạn có thể thực hành kiểm định phân phối chuẩn trong SPSS bằng dữ liệu của mình được rồi.

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *