Tôi đang xử lý ngay bây giờ với rất nhiều bản phân phối, ví dụ: , , .t χ 2
Tôi đã tự hỏi tại sao những mức độ tự do này biểu thị cho các phân phối như phân phối ?
Tôi đang xử lý ngay bây giờ với rất nhiều bản phân phối, ví dụ: , , .t χ 2
Tôi đã tự hỏi tại sao những mức độ tự do này biểu thị cho các phân phối như phân phối ?
Câu trả lời:
Đây là một câu trả lời ít kỹ thuật hơn, có lẽ dễ tiếp cận hơn với những người có sự chuẩn bị toán học khiêm tốn.
Thuật ngữ bậc tự do (df) được sử dụng liên quan đến các thống kê kiểm tra khác nhau nhưng ý nghĩa của nó thay đổi từ một kiểm tra thống kê sang kiểm tra tiếp theo. Một số thử nghiệm không có mức độ tự do liên quan đến thống kê thử nghiệm (ví dụ: Thử nghiệm chính xác của Fisher hoặc thử nghiệm z). Khi chúng tôi thực hiện kiểm tra az, giá trị z mà chúng tôi tính toán dựa trên dữ liệu của chúng tôi có thể được diễn giải dựa trên một bảng duy nhất của các giá trị z quan trọng, bất kể mẫu của chúng tôi lớn hay nhỏ. Một cách khác để nói điều này là có một phân phối z. Điều đó không đúng đối với một số thử nghiệm khác (ví dụ: F hoặc t hoặc χ2).
Lý do nhiều số liệu thống kê kiểm tra cần được giải thích theo ánh sáng của df là phân phối (lý thuyết) các giá trị của thống kê kiểm tra, giả sử giả thuyết null là đúng, phụ thuộc vào cỡ mẫu hoặc số nhóm, hoặc cả hai, hoặc một số thực tế khác về dữ liệu thu thập được. Khi thực hiện kiểm tra t, việc phân phối các giá trị t phụ thuộc vào kích thước mẫu, do đó, khi chúng tôi đánh giá giá trị t chúng tôi tính toán từ dữ liệu quan sát, chúng tôi cần so sánh nó với các giá trị t dự kiến dựa trên cùng kích thước mẫu như dữ liệu của chúng tôi. Tương tự, việc phân phối các giá trị của F trong Phân tích phương sai (giả sử giả thuyết null là đúng) phụ thuộc vào cả cỡ mẫu và số lượng nhóm. Vì vậy, để diễn giải giá trị F mà chúng tôi tính toán từ dữ liệu của mình, chúng tôi cần sử dụng các bảng giá trị F dựa trên cùng kích thước mẫu và cùng số lượng nhóm như chúng tôi có trong dữ liệu của mình. Nói cách khác, các bài kiểm tra F (tức là ANOVAs) và bài kiểm tra t và tests2 bài kiểm tra mỗi bài yêu cầu một họ đường cong để giúp chúng tôi giải thích giá trị t hoặc F hoặc we2 mà chúng tôi tính toán dựa trên dữ liệu của chúng tôi. Chúng tôi chọn trong số các họ đường cong dựa trên các giá trị (ví dụ: df's) để xác suất chúng tôi đọc được từ các bảng phù hợp với dữ liệu của chúng tôi. (Tất nhiên, hầu hết các chương trình máy tính làm điều này cho chúng tôi.)
Phân phối F là tỷ lệ của hai phân phối chi-vuông trung tâm. M là bậc tự do liên quan đến biến ngẫu nhiên chi bình phương đại diện cho tử số và n là bậc tự do của bình phương chi cho mẫu số. Để hoàn thành câu trả lời cho câu hỏi của bạn, tôi cần phải giải thích mức độ tự do chi bình phương. Một phân phối chi bình phương với n bậc tự do có thể được biểu diễn dưới dạng tổng bình phương của n biến ngẫu nhiên N (0,1) độc lập. Vì vậy, mức độ tự do có thể được xem là số lượng biến ngẫu nhiên bình thường xuất hiện trong tổng.
Bây giờ điều này sẽ thay đổi nếu các thông số này bao gồm các tham số ước tính. Giả sử ví dụ ta có n biến ngẫu nhiên N (m, 1) độc lập X i = 1,2, ..., n. Sau đó đặt X là giá trị trung bình mẫu = ∑X / n. b tôi
Bây giờ hãy tính S = ∑ (X -X ) . S này sẽ có phân phối chi bình phương nhưng với n-1 độ tự do. Trong trường hợp này, chúng ta vẫn tổng các biến ngẫu nhiên n, bình phương N (0,1). Nhưng sự khác biệt ở đây là chúng không độc lập bởi vì mỗi cái được hình thành bằng cách sử dụng cùng một X . Vì vậy, đối với bình phương chi thường được nói rằng mức độ tự do bằng số lượng các điều khoản trong tổng trừ đi số lượng tham số ước tính.i b 2 2 b
Trong trường hợp phân phối t, chúng ta có N (0, σ ) chia cho V trong đó V là ước lượng mẫu của. V tỷ lệ với một hình vuông chi với n-1 độ tự do trong đó n là cỡ mẫu. Mức độ tự do cho t là mức độ tự do cho biến ngẫu nhiên chi bình phương có liên quan đến tính toán của V.