Tôi sẽ thiết kế ngược lại từ kinh nghiệm với các trường hợp phân biệt đối xử. Tôi chắc chắn có thể thiết lập nơi các giá trị của "một trong 741" , v.v. , xuất phát từ đó. Tuy nhiên, rất nhiều thông tin đã bị mất trong bản dịch mà phần còn lại của quá trình tái thiết của tôi phụ thuộc vào việc xem mọi người làm thế nào để thống kê trong các thiết lập phòng xử án. Tôi chỉ có thể đoán ở một số chi tiết.
Kể từ khi luật chống phân biệt đối xử được thông qua vào những năm 1960 (Tiêu đề VI), các tòa án ở Hoa Kỳ đã học cách xem xét các giá trị p và so sánh chúng với các ngưỡng và 0,01 . Họ cũng đã học cách xem xét các hiệu ứng được tiêu chuẩn hóa, thường được gọi là "độ lệch chuẩn" và so sánh chúng với ngưỡng "hai đến ba độ lệch chuẩn". Để thiết lập một vụ kiện prima facie cho một vụ kiện phân biệt đối xử, các nguyên đơn thường cố gắng tính toán thống kê cho thấy "tác động khác biệt" vượt quá các ngưỡng này. Nếu tính toán như vậy không thể được hỗ trợ, trường hợp thường không thể tiến.0.050.01
Các chuyên gia thống kê cho các nguyên đơn thường cố gắng diễn đạt kết quả của họ theo các thuật ngữ quen thuộc này. Một số chuyên gia tiến hành kiểm tra thống kê trong đó giả thuyết null thể hiện "không có tác động bất lợi", cho rằng các quyết định tuyển dụng hoàn toàn ngẫu nhiên và không được kiểm soát bởi bất kỳ đặc điểm nào khác của nhân viên. (Cho dù đó là một thay thế một đầu hay hai đuôi có thể phụ thuộc vào chuyên gia và hoàn cảnh.) Sau đó, họ chuyển đổi giá trị p của thử nghiệm này thành một số "độ lệch chuẩn" bằng cách chuyển nó sang phân phối chuẩn thông thường- - ngay cả khi Tiêu chuẩn bình thường không liên quan đến thử nghiệm ban đầu. Theo cách vòng này, họ hy vọng sẽ truyền đạt kết luận rõ ràng cho thẩm phán.
Thử nghiệm ưa thích cho dữ liệu có thể được tóm tắt trong các bảng dự phòng là Thử nghiệm chính xác của Fisher. Sự xuất hiện của "Chính xác" trong tên của nó đặc biệt làm hài lòng các nguyên đơn, bởi vì nó bao hàm một quyết định thống kê đã được thực hiện mà không có lỗi (bất cứ điều gì có thể!).
Ở đây, sau đó, là (tái cấu trúc đầu cơ) của tôi về tính toán của Bộ Lao động.
Họ chạy thử nghiệm chính xác Fisher, hoặc một cái gì đó giống như nó (chẳng hạn như một thử nghiệm với một giá trị p xác định thông qua ngẫu nhiên). Thử nghiệm này giả định phân phối siêu bội như được mô tả trong câu trả lời của Matthew Gunn. (Đối với số lượng nhỏ những người liên quan đến khiếu nại này, phân phối siêu bội không được xấp xỉ bằng phân phối chuẩn.)χ2
Họ đã chuyển đổi giá trị p của nó thành điểm Z bình thường ("số độ lệch chuẩn").
Họ làm tròn điểm Z thành số nguyên gần nhất: "vượt quá ba độ lệch chuẩn", "vượt quá năm độ lệch chuẩn" và "vượt quá sáu độ lệch chuẩn". (Bởi vì một số trong những Z-score làm tròn các lên đến độ lệch chuẩn hơn, tôi không thể biện minh cho việc "vượt quá"; tất cả tôi có thể làm là trích dẫn nó.)
Trong đơn khiếu nại, các điểm Z tích hợp này đã được chuyển đổi thành giá trị p! Một lần nữa, phân phối chuẩn đã được sử dụng.
Các giá trị p này được mô tả (được cho là theo cách hiểu sai) là "khả năng kết quả này xảy ra theo cơ hội."
Để hỗ trợ suy đoán này, lưu ý rằng p-giá trị cho chính xác Kiểm tra Fisher trong ba trường hợp là khoảng , 1 / 565.000 và 1 / 58.000.000 . Chúng dựa trên các nhóm giả định lần lượt là 730 , 1160 và 130 tương ứng với "nhiều hơn" 730 , 1160 và 130 . Những con số này có điểm Z bình thường là - 3,16 , - 4,64 và - 5,521/12801/5650001/5800000073011601307301160130−3.16−4.64−5.52, tương ứng, khi được làm tròn là ba, năm và sáu độ lệch chuẩn, chính xác là các số xuất hiện trong đơn khiếu nại. Chúng tương ứng với (one-đuôi) bình thường p-giá trị của , 1 / 3500000 , và 1 / 1000000000 : chính xác các giá trị trích dẫn trong đơn khiếu nại.1/7411/35000001/1000000000
Dưới đây là một số R
mã được sử dụng để thực hiện các tính toán này.
f <- function(total, percent.asian, hired.asian, hired.non.asian) {
asian <- round(percent.asian/100 * total)
non.asian <- total-asian
x <- matrix(c(asian-hired.asian, non.asian-hired.non.asian, hired.asian, hired.non.asian),
nrow = 2,
dimnames=list(Race=c("Asian", "non-Asian"),
Status=c("Not hired", "Hired")))
s <- fisher.test(x)
s$p.value
}
1/pnorm(round(qnorm(f(730, 77, 1, 6))))
1/pnorm(round(qnorm(f(1160, 85, 11, 14))))
1/pnorm(round(qnorm(f(130, 73, 4, 17))))