Phân phối phân loại có nghĩa là gì?


11

Đây có phải là loại phân phối riêng biệt (EX: Binomial, bernoulli, Multinomial) hoặc bất kỳ phân phối nào có thể được biểu diễn theo cách này. Ai đó có thể xây dựng với ví dụ đơn giản

Câu trả lời:


11

Phân phối phân loại là tổng quát hóa phân phối Bernoulli cho một số kết quả cố định .2k

Tương tự, đó là trường hợp đặc biệt của phân phối đa cực trong đó số lượng "lựa chọn" được cố định tại một.n

Do đó, nó có pdf:

i=1kpixi(where 0pi and ipi=1)
xi{0,1}
ni=1kxi=1.

Tóm lại, Bernoulli có , nhị thức có , đa thức có và phân loại có .k=2,n=1k=2,n1k2,n1k2,n=1


là cần thiết, xi = 0,1. Không thể nhiều hơn thế.
subha

@subha: Sự hiểu biết của tôi về phân phối phân loại có theo cách đó. Đối với đa thức và nhị thức, tất nhiên nó có thể.
Neil G

5

Các biến phân loại có các tập hữu hạn của các giá trị rời rạc. Các ví dụ bao gồm giới tính (nam / nữ), quốc gia, hành tinh, v.v ... Tương phản điều này với các biến liên tục, có thể lấy vô số giá trị khác nhau. Ví dụ bao gồm trọng lượng, kinh độ, khoảng cách, vv

Lưu ý rằng thông tin tương tự đôi khi có thể được thể hiện theo cách phân loại và liên tục; ví dụ, planet = earthcó thể được thể hiện như distance to sun = 1 astronomical unit ≈ 150 million kilometers. Tuy nhiên, thực sự không có cách nào để thể hiện 200 triệu km từ mặt trời theo các hành tinh, bởi vì không có hành tinh nào ở đó (Sao Hỏa cách mặt trời 228 triệu km). Tương tự cho 201 triệu km, 202, v.v ... Tất cả những gì bạn có thể nói về những khoảng cách này về mặt hành tinh là planet = none; bạn không thể nói planet = 4/3×earthhoặc .88×Mars, bởi vì không có cách nào có ý nghĩa để nhân lên một hành tinh hoặc bất kỳ biến phân loại nào khác. Về mặt các hành tinh, những khoảng cách này sẽ không thể phân biệt được, nhưng tất nhiên chúng có ý nghĩa như khoảng cách khác biệt so với mặt trời khi được biểu thị như vậy - như một biến liên tục.

Người ta cũng có thể biểu thị các biến liên tục với độ chính xác tùy ý (ví dụ: một đơn vị thiên văn là 149,597,871 km, không chính xác là 150 triệu km). Ngược lại, không có cách nào để diễn đạt planet = earthchính xác hơn; Trái đất chính xác là trái đất, không hơn không kém. Hơn nữa, sẽ không có nghĩa gì khi nói bất kỳ hành tinh nào khác là "nhiều hơn" hoặc "ít hơn" so với Trái đất nếu planetlà một biến danh nghĩa. Nó có thể được mã hóa thành một biến số theo thứ tự (thứ tự) - các hành tinh được sắp xếp theo khoảng cách với mặt trời, khối lượng, số lượng mặt trăng, v.v. Những con số này đều liên tục theo thuật ngữ riêng của chúng (hoặc ít nhất là đếm, rời rạc nhưng không phân loại), nhưng không phải về mặt hành tinh. Ví dụ: nếu các hành tinh được sắp xếp theo khoảng cách từ mặt trời hoặc theo số lượng mặt trăng , mars > earth > venus. Nếu các hành tinh được sắp xếp theo khối lượng,earth > venus > mars. Không cần thiết phải đặt hàng các biến phân loại và có thể một số không thể được đặt hàng, nhưng việc thêm thứ tự không làm cho chúng ít phân loại hơn.

Như Wikipedia nói, phân phối phân loại là khái quát của phân phối Bernoulli đến hơn hai giá trị có thể (phân phối Bernoulli hoàn toàn là nhị phân). Phân phối Bernoulli cũng là trường hợp đặc biệt của phân phối nhị thức, nhưng tôi sẽ không gọi phân phối nhị thức là phân loại (nó rời rạc, nhưng là biến đếm, do đó khoảng cách giữa các giá trị được xác định). Phân phối đa cực có thể được kết hợp với phân phối phân loại, nhưng Wikipedia cảnh báo chống lại điều này .

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.