Chà, nếu bạn biết phương sai trong cặp không ghép đôi và trong cặp (thường sẽ là một thỏa thuận nhỏ hơn), trọng số tối ưu cho hai ước tính chênh lệch trong các nhóm có nghĩa là có trọng số tỷ lệ nghịch với phương sai của cá nhân ước tính của sự khác biệt về phương tiện.
[Chỉnh sửa: hóa ra khi ước tính phương sai, đây được gọi là công cụ ước tính của Graybill-Deal. Có khá nhiều giấy tờ về nó. Đây là một]
Nhu cầu ước tính phương sai gây ra một số khó khăn (tỷ lệ kết quả của ước tính phương sai là F và tôi nghĩ rằng trọng số kết quả có phân phối beta và thống kê kết quả là khá phức tạp), nhưng vì bạn đang xem xét bootstrapping, nên điều này có thể là ít quan tâm
Một khả năng khác có thể đẹp hơn theo một nghĩa nào đó (hoặc ít nhất là mạnh hơn một chút so với tính phi quy tắc, vì chúng ta đang chơi với các tỷ lệ phương sai) với rất ít sự mất hiệu quả ở mức bình thường là dựa trên ước tính kết hợp của sự thay đổi các thử nghiệm xếp hạng được ghép đôi và không ghép cặp - trong mỗi trường hợp, một loại ước tính Hodges-Lehmann, trong trường hợp không ghép cặp dựa trên các giá trị trung bình của các khác biệt giữa các cặp và trong trường hợp được ghép giữa các trung vị của các khác biệt trung bình theo cặp. Một lần nữa, tổ hợp tuyến tính trọng số phương sai tối thiểu của cả hai sẽ có trọng số tỷ lệ thuận với nghịch đảo của phương sai. Trong trường hợp đó, tôi có lẽ nghiêng về hoán vị (/ ngẫu nhiên) hơn là bootstrap - nhưng tùy thuộc vào cách bạn triển khai bootstrap của mình, chúng có thể kết thúc ở cùng một nơi.
Trong cả hai trường hợp, bạn có thể muốn củng cố phương sai / thu nhỏ tỷ lệ phương sai của mình. Vào đúng sân bóng cho trọng lượng là tốt, nhưng bạn sẽ mất rất ít hiệu quả ở mức bình thường bằng cách làm cho nó hơi mạnh mẽ. ---
Một số suy nghĩ bổ sung mà tôi không có đủ rõ ràng sắp xếp trong đầu trước đây:
Vấn đề này có những điểm tương đồng khác biệt với vấn đề BehDR-Fisher, nhưng thậm chí còn khó hơn.
Nếu chúng tôi cố định các trọng số, chúng tôi chỉ có thể đánh vào một xấp xỉ loại Welch-Satterthwaite; cấu trúc của vấn đề là như nhau.
Vấn đề của chúng tôi là chúng tôi muốn tối ưu hóa các trọng số, điều đó có nghĩa là trọng số không cố định - và thực tế, có xu hướng tối đa hóa thống kê (ít nhất là gần và nhiều hơn trong các mẫu lớn, vì bất kỳ tập hợp trọng lượng nào cũng là một đại lượng ngẫu nhiên ước tính như nhau tử số và chúng tôi đang cố gắng giảm thiểu mẫu số; cả hai không độc lập).
Điều này, tôi hy vọng, sẽ làm cho xấp xỉ chi bình phương trở nên tồi tệ hơn, và gần như chắc chắn sẽ ảnh hưởng đến df của một xấp xỉ hơn nữa.
[Nếu vấn đề này có thể thực hiện được, thì cũng có thể có một quy tắc tốt sẽ nói rằng 'bạn cũng có thể làm tốt nếu bạn chỉ sử dụng dữ liệu được ghép nối trong các tập hợp tình huống này, chỉ có ghép nối dưới các bộ khác này điều kiện và trong phần còn lại, sơ đồ cân nặng cố định này thường rất gần với tối ưu '- nhưng tôi sẽ không nín thở chờ đợi cơ hội đó. Quy tắc quyết định như vậy chắc chắn sẽ có một số tác động đến tầm quan trọng thực sự trong từng trường hợp, nhưng nếu hiệu ứng đó không quá lớn, quy tắc ngón tay cái như vậy sẽ giúp mọi người sử dụng phần mềm kế thừa dễ dàng, vì vậy có thể mong muốn cố gắng xác định quy tắc như thế cho người dùng trong tình huống như vậy.]
---
Chỉnh sửa: Lưu ý về bản thân - Cần quay lại và điền thông tin chi tiết về công việc vào các thử nghiệm 'mẫu chồng chéo', đặc biệt là các mẫu thử nghiệm chồng chéo
---
Nó xảy ra với tôi rằng một thử nghiệm ngẫu nhiên sẽ hoạt động tốt -
nơi dữ liệu được ghép nối, bạn hoán vị ngẫu nhiên các nhãn nhóm trong các cặp
trong đó dữ liệu không được ghép đôi nhưng được coi là có phân phối chung (dưới giá trị null), bạn hoán vị các bài tập nhóm
bây giờ bạn có thể căn cứ trọng số cho hai ước tính thay đổi ngoài ước tính phương sai tương đối ( w1=1/(1+v1v2)), tính toán ước tính trọng số của từng mẫu ngẫu nhiên và xem nơi mẫu phù hợp với phân phối ngẫu nhiên.
(Đã thêm nhiều sau)
Giấy có thể liên quan:
Derrick, B., Russ B., Toher, D. và White, P. (2017),
"Thống kê thử nghiệm để so sánh các phương tiện cho hai mẫu bao gồm cả quan sát độc lập và quan sát độc lập"
Tạp chí về phương pháp thống kê ứng dụng hiện đại , tháng 5 , Tập 16, số 1, 137-157.
doi: 10.22237 / jmasm / 1493597280
http://digitalcommons.wayne.edu/cgi/viewcontent.cgi?article=2251&context=jmasm