Câu trả lời:
Phân phối phân loại là tổng quát hóa phân phối Bernoulli cho một số kết quả cố định .
Tương tự, đó là trường hợp đặc biệt của phân phối đa cực trong đó số lượng "lựa chọn" được cố định tại một.
Do đó, nó có pdf:
Tóm lại, Bernoulli có , nhị thức có , đa thức có và phân loại có .
Các biến phân loại có các tập hữu hạn của các giá trị rời rạc. Các ví dụ bao gồm giới tính (nam / nữ), quốc gia, hành tinh, v.v ... Tương phản điều này với các biến liên tục, có thể lấy vô số giá trị khác nhau. Ví dụ bao gồm trọng lượng, kinh độ, khoảng cách, vv
Lưu ý rằng thông tin tương tự đôi khi có thể được thể hiện theo cách phân loại và liên tục; ví dụ, planet = earth
có thể được thể hiện như distance to sun = 1 astronomical unit ≈ 150 million kilometers
. Tuy nhiên, thực sự không có cách nào để thể hiện 200 triệu km từ mặt trời theo các hành tinh, bởi vì không có hành tinh nào ở đó (Sao Hỏa cách mặt trời 228 triệu km). Tương tự cho 201 triệu km, 202, v.v ... Tất cả những gì bạn có thể nói về những khoảng cách này về mặt hành tinh là planet = none
; bạn không thể nói planet = 4/3×earth
hoặc .88×Mars
, bởi vì không có cách nào có ý nghĩa để nhân lên một hành tinh hoặc bất kỳ biến phân loại nào khác. Về mặt các hành tinh, những khoảng cách này sẽ không thể phân biệt được, nhưng tất nhiên chúng có ý nghĩa như khoảng cách khác biệt so với mặt trời khi được biểu thị như vậy - như một biến liên tục.
Người ta cũng có thể biểu thị các biến liên tục với độ chính xác tùy ý (ví dụ: một đơn vị thiên văn là 149,597,871 km, không chính xác là 150 triệu km). Ngược lại, không có cách nào để diễn đạt planet = earth
chính xác hơn; Trái đất chính xác là trái đất, không hơn không kém. Hơn nữa, sẽ không có nghĩa gì khi nói bất kỳ hành tinh nào khác là "nhiều hơn" hoặc "ít hơn" so với Trái đất nếu planet
là một biến danh nghĩa. Nó có thể được mã hóa thành một biến số theo thứ tự (thứ tự) - các hành tinh được sắp xếp theo khoảng cách với mặt trời, khối lượng, số lượng mặt trăng, v.v. Những con số này đều liên tục theo thuật ngữ riêng của chúng (hoặc ít nhất là đếm, rời rạc nhưng không phân loại), nhưng không phải về mặt hành tinh. Ví dụ: nếu các hành tinh được sắp xếp theo khoảng cách từ mặt trời hoặc theo số lượng mặt trăng , mars > earth > venus
. Nếu các hành tinh được sắp xếp theo khối lượng,earth > venus > mars
. Không cần thiết phải đặt hàng các biến phân loại và có thể một số không thể được đặt hàng, nhưng việc thêm thứ tự không làm cho chúng ít phân loại hơn.
Như Wikipedia nói, phân phối phân loại là khái quát của phân phối Bernoulli đến hơn hai giá trị có thể (phân phối Bernoulli hoàn toàn là nhị phân). Phân phối Bernoulli cũng là trường hợp đặc biệt của phân phối nhị thức, nhưng tôi sẽ không gọi phân phối nhị thức là phân loại (nó rời rạc, nhưng là biến đếm, do đó khoảng cách giữa các giá trị được xác định). Phân phối đa cực có thể được kết hợp với phân phối phân loại, nhưng Wikipedia cảnh báo chống lại điều này .