Hiểu nghịch lý của Simpson: Ví dụ của Andrew Gelman với thu nhập thoái lui về tình dục và chiều cao


22

Andrew Gelman trong một trong những bài đăng trên blog gần đây của mình nói:

  1. Tôi không nghĩ rằng các tác dụng phụ hoặc kết quả tiềm năng là cần thiết cho nghịch lý của Simpson. Tôi nói điều này bởi vì người ta có thể thiết lập nghịch lý của Simpson với các biến không thể thao tác được hoặc do đó các thao tác không được quan tâm trực tiếp.

  2. Nghịch lý của Simpson là một phần của một vấn đề tổng quát hơn mà hồi quy có thể thay đổi nếu bạn thêm nhiều yếu tố dự đoán, việc lật dấu hiệu là không thực sự cần thiết.

Đây là một ví dụ mà tôi sử dụng trong giảng dạy minh họa cả hai điểm:

Tôi có thể chạy hồi quy dự đoán thu nhập từ tình dục và chiều cao. Tôi thấy rằng giá trị giới tính là 10.000 đô la (nghĩa là so sánh một người đàn ông và một người phụ nữ có cùng chiều cao, trung bình người đàn ông sẽ kiếm thêm 10.000 đô la) và hệ số chiều cao là 500 đô la (tức là so sánh hai người đàn ông hoặc hai người phụ nữ có chiều cao khác nhau, trung bình người cao hơn sẽ kiếm thêm 500 đô la cho mỗi inch chiều cao).

Làm thế nào tôi có thể giải thích những coefs này? Tôi cảm thấy rằng chiều cao của chiều cao rất dễ diễn giải (thật dễ tưởng tượng khi so sánh hai người cùng giới tính với các chiều cao khác nhau), thực sự có vẻ như bằng cách nào đó, Sai đã sai khi thoái lui về chiều cao mà không kiểm soát được giới tính, nhiều như vậy sự khác biệt giữa người thấp và người cao có thể được giải thích bởi sự khác biệt giữa nam và nữ. Nhưng ví dụ về tình dục trong mô hình trên có vẻ rất khó diễn giải: tại sao lại so sánh một người đàn ông và một người phụ nữ đều cao 66 inch chẳng hạn? Đó sẽ là so sánh của một người đàn ông thấp với một người phụ nữ cao. Tất cả lý do này có vẻ mơ hồ là nguyên nhân nhưng tôi không nghĩ sẽ hợp lý khi nghĩ về việc sử dụng kết quả tiềm năng.

Tôi đã suy ngẫm về nó (và thậm chí bình luận trên bài đăng) và nghĩ rằng có một cái gì đó xin được hiểu với sự rõ ràng hơn ở đây.

Cho đến khi phần giải thích về giới tính thì không sao. Nhưng tôi không thấy vấn đề gì đằng sau việc so sánh một người đàn ông thấp và một người phụ nữ cao. Đây là quan điểm của tôi: Trên thực tế, nó thậm chí còn có ý nghĩa lớn hơn (với giả định rằng đàn ông cao hơn trung bình). Bạn không thể so sánh một người đàn ông 'ngắn' và một phụ nữ 'ngắn' vì cùng một lý do, rằng sự khác biệt về thu nhập được giải thích ở một phần nào đó bởi sự khác biệt về chiều cao. Điều tương tự cũng xảy ra với những người đàn ông cao và phụ nữ cao và thậm chí nhiều hơn đối với những người phụ nữ thấp và những người đàn ông cao (điều này không còn nữa, có thể nói là như vậy). Vì vậy, về cơ bản, ảnh hưởng của chiều cao chỉ bị loại bỏ trong trường hợp khi so sánh đàn ông và phụ nữ cao (và điều này giúp giải thích hệ số về giới tính). Nó không rung chuông về các khái niệm cơ bản tương tự đằng sau các mô hình phù hợp phổ biến?

Ý tưởng đằng sau nghịch lý của Simpson là hiệu ứng dân số có thể khác với hiệu ứng khôn ngoan của nhóm phụ. Điều này theo một nghĩa nào đó liên quan đến điểm 2 của anh ấy và thực tế là anh ấy thừa nhận rằng chiều cao không nên được kiểm soát một mình (những gì chúng ta nói bỏ qua sai lệch biến). Nhưng tôi không thể liên hệ điều này với cuộc tranh cãi về hệ số về giới tính.

Có lẽ bạn có thể thể hiện nó rõ ràng hơn? Hoặc nhận xét về sự hiểu biết của tôi?


Xác nhận chéo xem xét các tập hợp con ngẫu nhiên của dân số, cố gắng có mức tối thiểu quá mức phù hợp và khái quát hóa tốt nhất.
EngrStudent - Phục hồi Monica

1
Nếu tôi hiểu chính xác mối quan tâm của bạn, tôi nghĩ bạn có thể được lợi từ việc nhìn vào nghịch lý của Chúa. @article {lord67, tác giả = {Lord, FM}, title = {Một nghịch lý trong việc giải thích so sánh nhóm}, tạp chí = {Bản tin tâm lý}, năm = {1967}, volume = {68}, page = {304- -305}, Keywords = {thay đổi điểm số}} @article {lord69, tác giả = {Lord, FM}, title = {Điều chỉnh thống kê khi so sánh các nhóm có từ trước}, tạp chí = {Bản tin tâm lý}, năm = {1969}, volume = {72}, trang = {336--337}, từ khóa = {thay đổi điểm số}}
mdewey

1
Judea Pearl đã thực hiện một bài đăng khác về nghịch lý của Simpson gần đây . Tôi khá chắc chắn rằng anh ấy không đồng ý với bài thuyết trình của Gelman. Lần đầu tiên, điểm thứ hai không phải là "nghịch lý". Sự đảo ngược của các ước tính như là hệ quả của những gì bạn đặt ra là một thực tế toán học. Điều làm cho nó có khả năng nghịch lý là khi bạn thực hiện các giải thích nguyên nhân của cả hai ước tính. Thứ hai, tại sao hạn chế này chỉ gây ra các nguyên nhân thao túng?
NRH

Câu trả lời:


9

Tôi không hoàn toàn chắc chắn về câu hỏi của bạn , nhưng có thể nhận xét về khiếu nại của anh ấy và sự nhầm lẫn của bạn trong mô hình ví dụ.

Andrew không hoàn toàn rõ ràng nếu mối quan tâm khoa học nằm ở hiệp hội thu nhập giới tính được điều chỉnh theo chiều cao hoặc hiệp hội thu nhập chiều cao được điều chỉnh theo giới tính . Trong một mô hình nguyên nhân khung tình dục gây ra chiều cao nhưng chiều cao không gây ra tình dục. Vì vậy, nếu chúng ta muốn tác động của tình dục, việc điều chỉnh chiều cao sẽ đưa ra sự thiên vị của người hòa giải (cũng có thể là thiên vị của người va chạm, vì người giàu cao hơn!). Tôi thấy khó hiểu và buồn cười khi thấy nghiên cứu ứng dụng diễn giải khác"hiệp phương sai" (các yếu tố gây nhiễu và các biến chính xác) được bao gồm trong một mô hình. Chúng là vô nghĩa, nhưng chỉ đơn giản là cung cấp sự phân tầng đầy đủ để làm cho sự so sánh là cần thiết. Điều chỉnh chiều cao, nếu bạn quan tâm đến suy luận về chênh lệch thu nhập dựa trên giới tính, là sai điều .

Tôi đồng ý phản tác dụng là không cần thiết để giải thích nghịch lý của Simpson. Chúng có thể chỉ đơn giản là một đặc điểm nội tại của dữ liệu. Tôi nghĩ rằng cả RR thô và điều chỉnh theo một nghĩa nào đó đều đúng mà không phải là nguyên nhân. Đó là vấn đề hơn, tất nhiên, khi mục tiêu là phân tích nguyên nhân và điều chỉnh quá mức cho thấy các vấn đề không thể thu gọn (làm tăng OR) và kích thước mẫu không đủ.

Xin nhắc lại cho độc giả: Nghịch lý của Simpson là một hiện tượng rất cụ thể đề cập đến một trường hợp trong đó một hiệp hội lật hướng sau khi kiểm soát một biến gây nhiễu. Dữ liệu Tuyển sinh Berkeley là ví dụ tạo động lực. Ở đó, RR thô cho thấy phụ nữ ít có khả năng được chấp nhận đến Berkeley. Tuy nhiên, một khi được phân tầng bởi các phòng ban , RR cho thấy phụ nữ có nhiều khả năng được chấp nhận ở mọi bộ phận . Họ chỉ có khả năng áp dụng cho các bộ phận khó khăn từ chối nhiều người.

Bây giờ trong lý thuyết suy luận nguyên nhân, chúng ta sẽ bối rối khi nghĩ rằng bộ phận được áp dụng để gây ra giới. Giới là bản chất phải không? Vâng, có và không. Miettenen lập luận cho cách tiếp cận "cơ sở nghiên cứu" đối với các vấn đề như vậy: dân số là ai? Nó không phải là tất cả các sinh viên đủ điều kiện, đó là những người áp dụng cụ thể cho Berkeley. Các bộ phận cạnh tranh hơn đã thu hút phụ nữ nộp đơn vào Berkeley khi họ không áp dụng theo cách khác. Để mở rộng: một người phụ nữ thông minh sâu sắc muốn tham gia vào chương trình kỹ thuật tốt nhất. Nếu Berkeley không có một chương trình kỹ thuật tuyệt vời, dù sao cô ấy cũng đã không nộp đơn vào Berkeley, cô ấy đã nộp đơn vào MIT hoặc CalPoly. Vì vậy, trong ánh sáng đó, dân số "sinh viên ứng tuyển", bộ phận gây ra giới tính và là một kẻ gây nhiễu. (báo trước: Tôi là sinh viên đại học thế hệ đầu tiên nên không biết nhiều về chương trình nào nổi tiếng vì điều gì).

Vậy làm thế nào để chúng tôi tóm tắt dữ liệu này? Đó là sự thật mà Berkeley có nhiều khả năng để thừa nhận một người đàn ông áp dụng hơn một người phụ nữ. Và sự thật là các bộ phận của Berkeley có nhiều khả năng thừa nhận phụ nữ hơn là thừa nhận đàn ông. RR thô và phân tầng là các biện pháp hợp lý ngay cả khi chúng không phải là nguyên nhân. Điều này nhấn mạnh tầm quan trọng của việc chính xác với cách diễn đạt của chúng tôi với tư cách là nhà thống kê (tác giả khiêm tốn không cho rằng mình chính xác từ xa).

Nhầm lẫn là một hiện tượng khác biệt với không sụp đổ, một dạng sai lệch biến thiên khác nhưng được biết là tạo ra hiệu ứng nhẹ hơn trên các ước tính. Không giống như hồi quy logistic, không sụp đổ không gây ra sai lệch trong hồi quy tuyến tính và xem xét liên tục trong ví dụ của Gelman nên được mô tả kỹ hơn.

Sự giải thích của Andrew về hệ số giới tính trong mô hình thu nhập được điều chỉnh theo giới tính / chiều cao của anh ấy cho thấy bản chất của các giả định của mô hình: giả định về tuyến tính. Thật vậy, trong mô hình tuyến tính, những so sánh như vậy giữa nam và nữ được kích hoạt bởi vì đối với một phụ nữ cụ thể, chúng ta có thể dự đoánnhững gì một người đàn ông có chiều cao tương tự có thể kiếm được, ngay cả khi anh ta không được quan sát. Đây cũng là trường hợp nếu một người cho phép sửa đổi hiệu ứng, do đó độ dốc của xu hướng ở phụ nữ khác với nam giới. Mặt khác, tôi không nghĩ thật điên rồ khi quan niệm đàn ông và phụ nữ có cùng chiều cao, 66 inch thực sự sẽ là một người phụ nữ cao và người đàn ông thấp. Nó có vẻ là một dự đoán nhẹ với tôi, hơn là ngoại suy thô. Hơn nữa, vì các giả định mô hình có thể được nêu rõ ràng, nó giúp người đọc hiểu rằng hiệp hội phân tầng thu nhập theo giới tính mang thông tin được mượn qua hoặc tính trung bình giữa các mẫu của nam và nữ. Nếu một hiệp hội như vậy là đối tượng của sự suy luận, nhà thống kê nghiêm túc rõ ràng sẽ xem xét khả năng sửa đổi hiệu ứng.


2
Thảo luận tuyệt vời. Là một nhà thống kê, điều đó làm tôi khó chịu khi mọi người nói về kết quả của một nghiên cứu, nhưng không chắc họ đang nói về các tác động cận biên hay điều kiện.
Vách đá AB

1

"tại sao lại so sánh một người đàn ông và một người phụ nữ đều cao 66 inch chẳng hạn? Đó sẽ là so sánh một người đàn ông thấp với một người phụ nữ cao "

Mô hình giả định rằng thu nhập phụ thuộc vào giới tính và chiều cao. Tuy nhiên, cách mà chiều cao tạo ra thu nhập cao hơn có thể không giống nhau đối với nam và nữ. Phụ nữ có thể được coi là cao "đủ" ở độ cao mà người đàn ông vẫn có thể được coi là thấp.

Đơn giản hóa mô hình theo cách sau có thể hữu ích.

Giả sử rằng bạn muốn hồi quy xác suất được tuyển dụng làm trợ lý cửa hàng trong các cửa hàng bán lẻ quần áo lớn và xem xét chiến lược nhận dạng sau đây.

Bạn quan sát rằng các nhà tuyển dụng có nhiều khả năng thuê những người lao động có chiều cao tối thiểu nhất định, trong đó "mức tối thiểu" có liên quan đến giới tính.

Thay vì đo chiều cao tính bằng cm, giả sử tồn tại hai giá trị ngưỡng xác định chiều cao tương ứng giữa nam và nữ là "cao":> = 180 cm đối với nam và> = 170 cm đối với nữ.

Giả sử rằng các ngưỡng tồn tại trong thực tế (tức là nhà tuyển dụng tạo ra sự khác biệt thực sự rõ rệt giữa nữ và cao 169cm hoặc 171cm), và họ là những người chính xác, bạn có thể xây dựng một hình nộm xác định nam và nữ cao / ngắn. Đàn ông và phụ nữ có chiều cao khác nhau vẫn có thể thuộc cùng một loại hình nộm của bạn và đồng thời biện pháp của bạn phù hợp với động lực thực sự của thị trường lao động cụ thể đó.


-1

Bạn có thể nói (nói một cách đơn giản hơn) rằng cuộc chiến giới tính điển hình nói rằng đàn ông có nhiều cơ hội hơn phụ nữ vì thu nhập của họ cao hơn p% sẽ bị thiên lệch?

Có lẽ đó là một điểm. Chúng ta có xu hướng nhìn mọi thứ trông như thế nào và không phân tích những tác động cơ bản.

để vượt lên trên nghịch lý của Simpson, chúng ta sẽ phải trả lời câu hỏi "một người phụ nữ làm được bao nhiêu công việc không thiên vị so với một người đàn ông?" sau đó ai đó có thể nói rằng họ phải mang thai và nuôi con nhiều hơn những gì đối tác của họ là đúng nhưng vấn đề quan trọng là người ta thở dài chỉ nói, "phụ nữ vì thực tế là phụ nữ có ít cơ hội hơn" và sâu sắc phân tích với số liệu thống kê có điều kiện sẽ khiến chúng ta thấy rằng về bản chất có xu hướng có cơ hội như nhau và chúng là những yếu tố khác không liên quan đến tình dục, điều khiến cho số liệu thống kê trông giống như sự phân biệt đối xử liên quan đến vấn đề giới tính.


Có thể hữu ích để hiểu rằng một phân tích như vậy có thể không nhất thiết là nguyên nhân cũng như giải thích, nhưng mô tả về hiện tượng hiện có.
AdamO
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.