Nếu tôi đã tính toán chính xác, hồi quy logistic không có triệu chứng có sức mạnh tương đương với kiểm tra t. Để thấy điều này, hãy viết ra khả năng đăng nhập của nó và tính toán kỳ vọng của Hessian ở mức tối đa toàn cầu (ước tính tiêu cực của nó là ma trận hiệp phương sai của giải pháp ML). Đừng bận tâm với tham số hóa logistic thông thường: đơn giản hơn là tham số hóa nó với hai xác suất được đề cập. Các chi tiết sẽ phụ thuộc vào chính xác cách bạn kiểm tra tầm quan trọng của hệ số hồi quy logistic (có một số phương pháp).
Các thử nghiệm này có sức mạnh tương tự nên không quá ngạc nhiên, vì lý thuyết chi bình phương cho ước tính ML dựa trên xấp xỉ bình thường với khả năng ghi nhật ký và thử nghiệm t dựa trên xấp xỉ bình thường với phân phối tỷ lệ. Mấu chốt của vấn đề là cả hai phương pháp đều đưa ra các ước tính giống nhau về hai tỷ lệ và cả hai ước tính đều có cùng một lỗi tiêu chuẩn.
Một phân tích thực tế có thể thuyết phục hơn. Chúng ta hãy áp dụng một số thuật ngữ chung cho các giá trị trong một nhóm nhất định (A hoặc B):
- là xác suất của 1.p
- là kích thước của mỗi bộ bốc thăm.n
- là số bộ rút thăm.m
- là lượng dữ liệu.N=mn
- (bằng 0 hoặc 1 ) là giá trị củakết quả thứ j trongtập rút thăm thứ i .kij01jthith
- là tổng số người trong tập rút thăm thứ i .kiith
- là tổng số người.k
Hồi quy logistic thực chất là công cụ ước tính ML của . Logarit của nó được đưa ra bởip
log(L)=klog(p)+(N−k)log(1−p).
Các dẫn xuất của nó đối với tham số p là
∂log(L)∂p=kp−N−k1−p and
−∂2log(L)∂p2=kp2+N−k(1−p)2.
Thiết là người đầu tiên không lãi suất ML ước tính p = k / N và cắm đó vào đối ứng của biểu thức thứ hai mang lại phương sai p ( 1 - p ) / N , đó là bình phương của sai số chuẩn.p^=k/Np^(1−p^)/N
Các số liệu thống kê t sẽ được lấy từ ước lượng dựa trên dữ liệu được nhóm bởi bộ rút ra; cụ thể là sự khác biệt của các phương tiện (một từ nhóm A và khác từ nhóm B) chia cho sai số chuẩn của chênh lệch đó, được lấy từ độ lệch chuẩn của phương tiện. Sau đó, hãy nhìn vào độ lệch trung bình và độ lệch chuẩn cho một nhóm nhất định. Equals bình , đó là giống với ML ước lượng p . Độ lệch chuẩn trong câu hỏi là độ lệch chuẩn của phương tiện vẽ; đó là độ lệch chuẩn của tập hợp k i / nk/Np^ki/n . Đây là mấu chốt của vấn đề, vì vậy hãy khám phá một số khả năng.
Giả sử dữ liệu không được chia thành các nhóm rút ở tất cả: đó là, và m = N . Các k i là phương tiện bốc thăm. Họ mẫu đúng bằng N / ( N - 1 ) lần p ( 1 - p ) . Từ đó suy ra rằng lỗi tiêu chuẩn giống hệt với lỗi tiêu chuẩn ML ngoài một yếu tốn=1m=NkiN/(N−1)p^(1−p^) , về cơ bản là1khiN=1800N/(N−1)−−−−−−−−−√1N=1800 . Do đó - ngoài sự khác biệt nhỏ này - bất kỳ thử nghiệm nào dựa trên hồi quy logistic sẽ giống như thử nghiệm t và chúng tôi sẽ đạt được sức mạnh cơ bản như nhau.
Khi dữ liệu được nhóm lại, phương sai (đúng) của bằng p ( 1 - p ) / n vì các thống kê k i đại diện cho tổng của n biến Bernoulli ( p ), mỗi biến có p ( 1 - p) ) . Do đó, lỗi tiêu chuẩn dự kiến về giá trị trung bình của m của các giá trị này là căn bậc hai của p ( 1 - p ) / n / m =ki/np(1−p)/nkinpp(1−p)mp(1−p)/n/m=p(1−p)/N , giống như trước đây.
Số 2 cho thấy sức mạnh của bài kiểm tra không nên thay đổi đáng kể với cách rút thăm được phân bổ (nghĩa là, với cách và n được biến đổi theo chủ đề m n = Nmnmn=N ), ngoài hiệu ứng khá nhỏ từ điều chỉnh trong mẫu phương sai (trừ khi bạn quá ngu ngốc khi sử dụng cực kỳ ít bộ rút thăm trong mỗi nhóm).
Mô phỏng giới hạn để so sánh với p = 0,74 (với 10.000 lần lặp mỗi lần) liên quan đến m = 900 , n = 1 (về cơ bản là hồi quy logistic); m = n = 30 ; và m = 2 , n = 450 (tối đa hóa điều chỉnh phương sai mẫu) mang lại điều này: công suất (tại α =p=0.70p=0.74m=900,n=1m=n=30m=2,n=450α=0.05, một phía) trong hai trường hợp đầu tiên là 0,59 trong khi ở trường hợp thứ ba, trong đó hệ số điều chỉnh tạo ra sự thay đổi vật chất (hiện chỉ có hai bậc tự do thay vì 1798 hoặc 58), nó giảm xuống còn 0,36. Một thử nghiệm khác so sánh đến p = 0,52 cho các sức mạnh lần lượt là 0,22, 0,21 và 0,15: một lần nữa, chúng tôi chỉ quan sát thấy một sự sụt giảm nhẹ từ việc không nhóm vào rút thăm (= hồi quy logistic) để nhóm thành 30 nhóm và giảm đáng kể chỉ hai nhóm.p=0.50p=0.52
Đạo đức của phân tích này là:
- Bạn sẽ không mất nhiều khi phân vùng các giá trị dữ liệu của bạn thành một số lượng lớn m các nhóm "rút thăm" tương đối nhỏ.Nm
- Bạn có thể mất sức mạnh đáng kể khi sử dụng số lượng nhỏ các nhóm ( là nhỏ, n - lượng dữ liệu trên mỗi nhóm - là lớn).mn
- Tốt nhất bạn không nên nhóm các giá trị dữ liệu của bạn thành "vẽ". Chỉ cần phân tích chúng nguyên trạng (sử dụng bất kỳ kiểm tra hợp lý nào, bao gồm hồi quy logistic và kiểm tra t).N