Điểm kiểm tra có thực sự tuân theo một phân phối bình thường?


13

Tôi đã cố gắng tìm hiểu những phân phối nào sẽ được sử dụng trong GLM và tôi hơi bối rối khi sử dụng phân phối bình thường. Trong một phần của sách giáo khoa của tôi, nó nói rằng một bản phân phối bình thường có thể tốt cho việc lập mô hình điểm thi. Trong phần tiếp theo, nó hỏi phân phối nào sẽ phù hợp để mô hình hóa yêu cầu bảo hiểm xe hơi. Lần này, nó nói rằng các bản phân phối phù hợp sẽ là Gamma hoặc Inverse Gaussian vì chúng liên tục chỉ có các giá trị dương. Chà, tôi tin rằng điểm thi cũng sẽ liên tục chỉ với các giá trị dương, vậy tại sao chúng ta sẽ sử dụng phân phối bình thường ở đó? Không phân phối bình thường cho phép các giá trị âm?


1
Nếu bạn lo lắng về giới hạn về điểm số, bạn có thể thử en.wikipedia.org/wiki/Truncated_n normal_distribution
JG

5
Tất nhiên, trong thế giới thực, các bản phân phối điểm thi thường không giống bất kỳ bản phân phối bình thường nào. Lấy ví dụ từ những ngày học toán, tôi nhớ lớp Topology I nổi tiếng với phân phối cấp "đường cong quả tạ" rất lưỡng tính: bạn hiểu các khái niệm chính và đạt điểm gần như hoàn hảo, hoặc bạn không và may mắn nhận được bất kỳ điểm nào cả. Rất ít người cuối cùng ghi được bất cứ nơi nào ở giữa giữa hai thái cực đó.
Ilmari Karonen

2
Không. Câu hỏi tiếp theo.
Carl Witthoft

Câu trả lời:


14

Chiều cao, ví dụ, thường được mô hình hóa là bình thường. Có lẽ chiều cao của đàn ông là khoảng 5 feet 10 với độ lệch chuẩn là 2 inch. Chúng ta biết chiều cao âm là phi vật lý, nhưng theo mô hình này, xác suất quan sát chiều cao âm về cơ bản là bằng không. Chúng tôi sử dụng mô hình nào vì nó là một xấp xỉ đủ tốt.

Tất cả các mô hình đều sai. Câu hỏi đặt ra là "mô hình này có thể vẫn hữu ích không" và trong trường hợp chúng ta đang mô hình hóa những thứ như chiều cao và điểm kiểm tra, mô hình hóa hiện tượng như bình thường là hữu ích mặc dù về mặt kỹ thuật cho phép những thứ phi vật lý.


Trong trường hợp cụ thể này, người ta đặt câu hỏi liệu phân phối bình thường có phải là một xấp xỉ hữu ích hay không . Gần như mọi phân phối cấp độ mà tôi thấy giống như đường cong lưỡng kim mà Ilmari Karonen đã đề cập trong các nhận xét ở một mức độ nào đó. (Mặc dù thường có các chế độ khoảng 0,6 và 0,9, thay vì ở hai đầu cực) Tuy nhiên, sự kết hợp tuyến tính của hai phân phối bình thường với các phương tiện khác nhau sẽ không phải là một xấp xỉ xấu.
Ray

Tôi đã không tranh luận rằng bình thường là xấp xỉ TỐT NHẤT. Toàn bộ ý kiến ​​của tôi thực sự được thực hiện trong đoạn cuối đó. Nhận xét về tính đơn giản của phân phối cấp thực tế, ít nhất là ở mức độ trừu tượng này, thực sự không hữu ích.
Demetri Pananos

Tôi đồng ý với tất cả những gì bạn nói trong câu trả lời của bạn, nhưng một phần của câu hỏi liên quan đến việc phân phối bình thường có được áp dụng cụ thể cho mô hình phân phối cấp hay không. Và câu trả lời cho điều đó thường là "Không". Tất cả các mô hình đều sai và một số mô hình là hữu ích, nhưng một số mô hình sai và ít hữu ích hơn các mô hình khác. Thực tế là phân phối bình thường đặc biệt phù hợp với vấn đề này rất quan trọng và câu trả lời dường như cho thấy rằng bình thường chỉ sai vì đuôi bị âm và vô hạn, khi thực sự có nhiều vấn đề sâu hơn.
Ray

Bạn đang có một chút phạm vi ở đây. Vấn đề của OP là bình thường cho phép điểm âm. Bimodality không phải là vấn đề. Bạn không nhìn thấy rừng cho cây liên quan đến câu hỏi này. Mô hình chi tiết không liên quan ngay bây giờ.
Demetri Pananos

10

Không phân phối bình thường cho phép các giá trị âm?

Chính xác. Nó cũng không có giới hạn trên.

Trong một phần của sách giáo khoa của tôi, nó nói rằng một bản phân phối bình thường có thể tốt cho việc lập mô hình điểm thi.

Mặc dù các tuyên bố trước đây, tuy nhiên đôi khi đây là trường hợp. Nếu bạn có nhiều thành phần để kiểm tra, không liên quan quá nhiều (ví dụ như vậy về cơ bản bạn không phải là một câu hỏi hàng chục lần, cũng không có mỗi phần yêu cầu một câu trả lời đúng cho phần trước), và không dễ hoặc rất khó ( sao cho hầu hết các nhãn hiệu nằm ở đâu đó gần giữa), sau đó các nhãn hiệu thường có thể được xấp xỉ một cách hợp lý bởi một phân phối bình thường; thường đủ tốt để phân tích điển hình nên gây ra ít quan tâm.

Chúng tôi biết chắc chắn rằng chúng không bình thường , nhưng đó không phải là vấn đề tự động - miễn là hành vi của các quy trình chúng tôi sử dụng đủ gần với mục đích của chúng tôi (ví dụ: lỗi tiêu chuẩn, khoảng tin cậy, mức ý nghĩa và sức mạnh - bất cứ điều gì cần thiết - làm gần với những gì chúng ta mong đợi)

Trong phần tiếp theo, nó hỏi phân phối nào sẽ phù hợp để mô hình hóa yêu cầu bảo hiểm xe hơi. Lần này, nó nói rằng các bản phân phối phù hợp sẽ là Gamma hoặc Inverse Gaussian vì chúng liên tục chỉ có các giá trị dương.

Có, nhưng hơn thế - chúng có xu hướng bị lệch rất nhiều và độ biến thiên có xu hướng tăng khi giá trị trung bình lớn hơn.

Dưới đây là ví dụ về phân phối kích thước yêu cầu cho khiếu nại xe:

https://ars.els-cdn.com/content/image/1-s2.0-S0167668715303358-gr5.jpg

(Hình 5 từ Garrido, Genest & Schulz (2016) "Các mô hình tuyến tính tổng quát cho tần suất phụ thuộc và mức độ nghiêm trọng của yêu cầu bảo hiểm", Bảo hiểm: Toán học và Kinh tế, Tập 70, Tháng Chín, p205-215. Https: //www.scTHERirect. com / khoa học / bài báo / pii / S0167668715303358 )

Điều này cho thấy một cái đuôi phải lệch và nặng bên phải điển hình. Tuy nhiên, chúng tôi phải rất cẩn thận vì đây là phân phối biên và chúng tôi đang viết một mô hình cho phân phối có điều kiện , thường sẽ ít bị lệch hơn (phân phối cận biên mà chúng tôi xem xét nếu chúng tôi chỉ thực hiện một biểu đồ kích thước xác nhận là hỗn hợp của các phân phối có điều kiện). Tuy nhiên, thông thường là nếu chúng ta nhìn vào kích thước xác nhận trong các nhóm con của các yếu tố dự đoán (có thể phân loại các biến liên tục) thì phân phối vẫn bị lệch rất mạnh và khá nặng ở bên phải, cho thấy rằng một cái gì đó giống như mô hình gamma * là có khả năng phù hợp hơn nhiều so với mô hình Gaussian.

* có thể có bất kỳ số lượng phân phối nào khác phù hợp hơn Gaussian - Gaussian nghịch đảo là một lựa chọn khác - mặc dù ít phổ biến hơn; Các mô hình lognatural hoặc Weibull, trong khi không phải là GLM khi chúng đứng, cũng có thể khá hữu ích.

[Rất hiếm khi các phân phối này là những mô tả gần như hoàn hảo; chúng gần đúng không chính xác, nhưng trong nhiều trường hợp đủ tốt để phân tích là hữu ích và gần với các thuộc tính mong muốn.]

Chà, tôi tin rằng điểm thi cũng sẽ liên tục chỉ với các giá trị dương, vậy tại sao chúng ta sẽ sử dụng phân phối bình thường ở đó?

Bởi vì (trong các điều kiện tôi đã đề cập trước đây - rất nhiều thành phần, không quá phụ thuộc, không khó hoặc dễ), phân phối có xu hướng khá gần với đối xứng, không đồng đều và không nặng nề.


0

Điểm thi có thể được mô hình hóa tốt hơn bằng phân phối nhị thức. Trong trường hợp rất đơn giản, bạn có thể có 100 câu hỏi đúng / sai, mỗi câu có giá trị 1 điểm, do đó, điểm sẽ là một số nguyên trong khoảng từ 0 đến 100. Nếu bạn cho rằng không có mối tương quan nào giữa tính chính xác của người kiểm tra với vấn đề (mặc dù giả định không rõ ràng ), điểm số là tổng của các biến ngẫu nhiên độc lập và áp dụng Định lý giới hạn trung tâm. Khi số lượng câu hỏi tăng lên, phần nhỏ của các vấn đề chính xác sẽ hội tụ thành một bản phân phối bình thường.

Bạn hỏi một câu hỏi hay về các giá trị nhỏ hơn 0. Bạn cũng có thể hỏi cùng một câu hỏi về các giá trị lớn hơn 100%. Khi số lượng câu hỏi kiểm tra tăng lên, phương sai của tổng giảm, do đó, đỉnh được kéo về phía giá trị trung bình. Tương tự, phân phối chuẩn phù hợp nhất sẽ có phương sai nhỏ hơn và trọng số của pdf nằm ngoài khoảng [0, 1] có xu hướng về 0, mặc dù nó sẽ luôn là khác không. Khoảng cách giữa các giá trị có thể của "phân số chính xác" cũng sẽ giảm (1/100 cho 100 câu hỏi, 1/1000 cho 1000 câu hỏi, v.v.), do đó, một cách không chính thức, pdf bắt đầu hoạt động ngày càng giống như một pdf liên tục.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.