Tôi đang xem xét một số vấn đề và trong một số vấn đề để kiểm tra các hệ số, đôi khi tôi thấy mọi người sử dụng phân phối của Sinh viên và đôi khi tôi thấy phân phối Bình thường. Quy định là gì?
Tôi đang xem xét một số vấn đề và trong một số vấn đề để kiểm tra các hệ số, đôi khi tôi thấy mọi người sử dụng phân phối của Sinh viên và đôi khi tôi thấy phân phối Bình thường. Quy định là gì?
Câu trả lời:
Phân phối bình thường là phân phối mẫu lớn trong nhiều vấn đề thống kê có ý nghĩa liên quan đến một số phiên bản của Định lý giới hạn trung tâm: bạn có (khoảng) các thông tin độc lập đang được thêm vào để đi đến câu trả lời. Nếu ước tính tham số là bình thường không có triệu chứng, chức năng của chúng cũng sẽ bình thường không có triệu chứng (trong trường hợp thông thường).
Mặt khác, phân phối Student có nguồn gốc trong các điều kiện hạn chế hơn của các lỗi hồi quy thông thường. Nếu bạn có thể mua giả định này, bạn có thể mua phân phối đang được sử dụng để kiểm tra giả thuyết trong hồi quy tuyến tính. Việc sử dụng phân phối này cung cấp khoảng tin cậy rộng hơn so với việc sử dụng phân phối bình thường. Ý nghĩa thực sự của điều đó là trong các mẫu nhỏ, bạn cần ước tính mức độ không chắc chắn của mình, sai số bình phương trung bình hoặc độ lệch chuẩn của phần dư, . (Trong các mẫu lớn, bạn có nhiều thông tin như thể bạn biết, do đó, phân phối suy biến thành phân phối bình thường.)
Có một số trường hợp trong hồi quy tuyến tính, ngay cả với các mẫu hữu hạn, trong đó phân phối Sinh viên không thể được chứng minh. Chúng có liên quan đến vi phạm các điều kiện thứ hai về lỗi hồi quy; cụ thể là chúng là (1) phương sai không đổi và (2) độc lập. Nếu các giả định này bị vi phạm và bạn sửa các lỗi tiêu chuẩn của mình bằng cách sử dụng công cụ ước tính Eicker / White cho phần dư không đồng nhất, nhưng phần dư độc lập; hoặc công cụ ước tính Newey-West cho các lỗi tương quan huyết thanh hoặc lỗi tiêu chuẩn gộpđối với dữ liệu tương quan theo cụm, không có cách nào bạn có thể đưa ra lời biện minh hợp lý cho phân phối Sinh viên. Tuy nhiên, bằng cách sử dụng một phiên bản thích hợp của đối số quy tắc tiệm cận (mảng traing và như vậy), bạn có thể biện minh cho xấp xỉ bình thường (mặc dù bạn nên nhớ rằng khoảng tin cậy của bạn rất có thể sẽ quá hẹp).
Tôi thích sự đại diện của phân phối t sinh viên như là một hỗn hợp của phân phối bình thường và phân phối gamma:
Lưu ý rằng giá trị trung bình của phân phối gamma là và phương sai của phân phối này là . Vì vậy, chúng ta có thể xem phân phối t là khái quát hóa giả định phương sai không đổi với giả định phương sai "tương tự". về cơ bản kiểm soát cách tương tự như chúng ta cho phép các phương sai được. Bạn cũng xem đây là hồi quy "trọng số ngẫu nhiên", vì chúng ta có thể sử dụng tích phân ở trên làm đại diện "biến ẩn" như sau:
Trong đó và tất cả các biến độc lập. Trên thực tế, đây về cơ bản chỉ là định nghĩa của phân phối t, vì
Bạn có thể thấy lý do tại sao kết quả này làm cho phân phối của sinh viên "mạnh" so với bình thường vì một lỗi lớn có thể xảy ra do giá trị lớn của hoặc do giá trị nhỏ của . Bây giờ becuase là phổ biến cho tất cả các quan sát, nhưng là cụ thể cho thứ i, điều "lẽ thường" chung để kết luận là các ngoại lệ đưa ra bằng chứng cho nhỏ . Ngoài ra, nếu bạn thực hiện hồi quy tuyến tính , bạn sẽ thấy rằng là trọng số cho quan sát thứ i, giả sử rằng biết:
Vì vậy, một ngoại lệ cấu thành bằng chứng cho nhỏ , điều đó có nghĩa là quan sát thứ i sẽ giảm cân. Ngoài ra, một "ngoại lệ" nhỏ - một quan sát được dự đoán / trang bị tốt hơn nhiều so với phần còn lại - tạo thành bằng chứng cho lớn . Do đó quan sát này sẽ được cân nhắc nhiều hơn trong hồi quy. Điều này phù hợp với những gì người ta sẽ làm bằng trực giác với một điểm dữ liệu ngoại lệ hoặc tốt.
Lưu ý rằng không có "quy tắc" nào để quyết định những điều này, mặc dù câu trả lời của tôi và những người khác cho câu hỏi này có thể hữu ích cho việc tìm kiếm một số bài kiểm tra bạn có thể thực hiện dọc theo đường sai lệch hữu hạn (t sinh viên là phương sai vô hạn cho mức độ tự do nhỏ hơn hoặc bằng tới hai).