Có gì sai với (một số) giả ngẫu nhiên


23

Tôi đã bắt gặp một nghiên cứu trong đó các bệnh nhân, những người đều trên 50 tuổi, được giả ngẫu nhiên theo năm sinh. Nếu năm sinh là một số chẵn, chăm sóc thông thường, nếu là số lẻ, can thiệp.

Thực hiện dễ dàng hơn, khó lật đổ hơn (dễ dàng kiểm tra xem bệnh nhân nên điều trị gì), thật dễ nhớ (nhiệm vụ được thực hiện trong vài năm). Tuy nhiên, tôi không thích nó, tôi cảm thấy ngẫu nhiên thích hợp sẽ tốt hơn. Nhưng tôi không thể giải thích tại sao.

Tôi có sai không khi cảm thấy điều đó, hay có một lý do chính đáng để thích sự ngẫu nhiên 'thực sự'?


1
Chào mừng đến với trang web! Vui mừng khi thấy bài viết của bạn ở đây.
Andy W

Bằng các câu trả lời ở trên, tôi cảm thấy tốt hơn để "ngẫu nhiên hóa" vào NGÀY sinh! Ngày kỳ lạ để điều trị, thậm chí cả ngày để kiểm soát ... Adalberto
AADF

6
@Adalberto Điều đó bỏ lỡ điểm chính, đó là bất kỳ thủ tục xác định ngẫu nhiên, không ngẫu nhiên nào về việc gán đối tượng cho các nhóm không thể được đảm bảo có các đặc tính mong muốn mà một thủ tục ngẫu nhiên có. Giả sử bạn dành nhiều năm cho một nghiên cứu như vậy chỉ sau đó để có một nhà phê bình chỉ ra một mối quan hệ bất ngờ nhưng mạnh mẽ giữa điều trị và tương đương của ngày sinh? Bởi vì chúng tôi không thể lường trước tất cả những rắc rối như vậy, chúng tôi vượt qua vấn đề bằng cách gán ngẫu nhiên.
whuber

Câu trả lời:


28

Bạn có quyền được hoài nghi. Nói chung, người ta nên sử dụng ngẫu nhiên 'thực', bởi vì thông thường người ta không có tất cả kiến ​​thức về các yếu tố liên quan (không quan sát được). Nếu một trong những thứ không quan sát được tương quan với độ tuổi là số lẻ hoặc số chẵn, thì nó cũng tương quan với việc họ có được điều trị hay không. Nếu đây là trường hợp, chúng tôi không thể xác định hiệu quả điều trị: các hiệu ứng chúng tôi quan sát có thể là do điều trị hoặc do (các) yếu tố không quan sát được.

Đây không phải là vấn đề với ngẫu nhiên thực sự, nơi chúng tôi không mong đợi bất kỳ sự phụ thuộc nào giữa điều trị và không quan sát được (mặc dù, tất nhiên, đối với các mẫu nhỏ có thể có ở đó).

Để xây dựng một câu chuyện tại sao thủ tục ngẫu nhiên này có thể là một vấn đề, giả sử nghiên cứu chỉ bao gồm các đối tượng ở tuổi 17/18 khi, chiến tranh Việt Nam bắt đầu. Với 17 không có cơ hội để được soạn thảo (sửa tôi nếu tôi sai về điều đó), trong khi đó có cơ hội ở tuổi 18. Giả sử cơ hội là không đủ điều kiện và kinh nghiệm chiến tranh thay đổi con người, điều đó ngụ ý rằng, nhiều năm sau, hai nhóm này là khác nhau, mặc dù họ chỉ cách nhau 1 năm. Vì vậy, có lẽ phương pháp điều trị (thuốc) có vẻ như không hiệu quả, nhưng vì chỉ có nhóm cựu chiến binh Việt Nam nhận được nó, điều này thực sự có thể là do nó không hoạt động trên những người bị PTSD (hoặc các yếu tố khác liên quan đến là một cựu chiến binh). Nói cách khác, bạn cần cả hai nhóm (điều trị và kiểm soát) giống hệt nhau, ngoại trừ việc điều trị, để xác định hiệu quả điều trị.

Vì vậy, trừ khi bạn có thể loại trừ rằng không có sự khác biệt không quan sát được giữa các nhóm (nhưng làm thế nào để bạn làm điều đó nếu nó không được quan sát?), Thì ngẫu nhiên thực sự là tốt hơn.


Cảm ơn. Ví dụ tốt đẹp. (Tôi quên gọi nó là ngẫu nhiên giả, tôi đã chỉnh sửa nó trong câu hỏi).
Jeremy Miles

2
(+1) Khi tôi đang đọc câu hỏi, Việt Nam là ví dụ đầu tiên ngay lập tức nảy ra trong đầu. Thật buồn cười khi thấy bạn đã thực hiện chiến thuật tương tự. Tôi cho rằng đó là sự lựa chọn rõ ràng nhất với các độ tuổi đã nêu của các đối tượng, mặc dù độ tuổi từ đầu đến giữa 60 gần hơn một chút.
Đức Hồng Y

Xin lỗi về ping ngoài chủ đề: có một gợi ý trên Meta để biến [thử nghiệm ngẫu nhiên] thành một từ đồng nghĩa của thẻ [phân bổ ngẫu nhiên] ( stats.meta.stackexchange.com/a/4651 ). Bạn có đủ danh tiếng trong thẻ này để bỏ phiếu cho đề xuất này tại đây: stats.stackexchange.com/tags/random-allocation/synonymouss - hiện cần 4 lượt upvote để đi qua. Nếu bạn không đồng ý với đề xuất này, hãy xem xét nhận xét về Meta để giải thích lý do. Tôi sẽ xóa bình luận này sớm. Chúc mừng.
amip nói rằng Phục hồi Monica

18

Thỉnh thoảng, đây là một bài tập tốt để duy trì quan điểm đối lập, vì vậy hãy để tôi bắt đầu bằng cách đưa ra một vài lý do có lợi cho hình thức giả ngẫu nhiên này. Về cơ bản, chúng ít khác biệt so với bất kỳ hình thức lấy mẫu có hệ thống nào khác , chẳng hạn như lấy mẫu môi trường tại các điểm của lưới trong trường hoặc lấy mẫu mọi cây khác trong vườn, và do đó việc lấy mẫu này có thể có lợi thế tương đương .

Sự tương tự ở đây là hoàn hảo: tuổi được "ghi điểm" theo năm bắt đầu từ gốc 0 và gán cho các nhóm xen kẽ dọc theo lưới (một chiều) này. Một số ưu điểm của phương pháp này là đảm bảo phân tán rộng, thậm chí phân tán mẫu trên cánh đồng hoặc vườn cây (hoặc độ tuổi, trong trường hợp này), giúp thậm chí giúp giảm các ảnh hưởng liên quan đến vị trí (hoặc thời gian). Điều này có thể đặc biệt hữu ích khi lý thuyết cho thấy rằng vị trí là yếu tố chính trong sự thay đổi của phản ứng. Hơn nữa, ngoại trừ các mẫu thực sự nhỏ, phân tích dữ liệu như thểchúng là một mẫu ngẫu nhiên đơn giản giới thiệu tương đối ít lỗi. Hơn nữa, một số ngẫu nhiên là có thể: trong lĩnh vực chúng ta có thể chọn ngẫu nhiên nguồn gốc và hướng của lưới. Trong trường hợp hiện tại, ít nhất chúng ta có thể ngẫu nhiên hóa liệu các năm chẵn là đối tượng kiểm soát hay đối tượng điều trị.

Một ưu điểm khác của lấy mẫu lưới là phát hiện biến thể cục bộ. Trong lĩnh vực này, đây sẽ là "túi" của các phản ứng bất thường. Theo thống kê, chúng ta có thể nghĩ về chúng như những biểu hiện của mối tương quan không gian. Trong tình huống hiện tại, nếu có khả năng một độ tuổi tương đối hẹp gặp phải những phản ứng bất thường, thì thiết kế có lưới là một lựa chọn tuyệt vời, bởi vì một thiết kế hoàn toàn ngẫu nhiên có thể tình cờ chứa những khoảng trống lớn ở một trong các nhóm. (Nhưng một thiết kế tốt hơn có thể là phân tầng: sử dụng tính chẵn lẻ của tuổi để tạo thành hai tầng phân tích và sau đó, độc lập trong mỗi tầng, phân ngẫu nhiên bệnh nhân vào các nhóm kiểm soát và điều trị.)

9được liên kết với các yếu tố quan trọng cho thí nghiệm. Điều này làm cho mối quan tâm trong câu hỏi ít hơn giả thuyết: nó có thật. Tại thời điểm này, các câu trả lời trước trong chủ đề này có khả năng trình bày những suy nghĩ bổ sung mà tôi sẽ quan tâm để thực hiện, vì vậy tôi sẽ dừng lại và mời bạn đọc lại chúng.


(+1) Đặc biệt, đối với đối tượng được thiết lập.
Đức Hồng Y

13

Tôi đồng ý ví dụ bạn đưa ra khá vô hại nhưng ...

Nếu các tác nhân liên quan (hoặc người thực hiện can thiệp hoặc người được can thiệp) nhận thức được kế hoạch chuyển nhượng, họ có thể tận dụng lợi thế của nó. Lựa chọn bản thân như vậy nên khá rõ ràng tại sao nó có vấn đề trong hầu hết các thiết kế thử nghiệm.

Một ví dụ tôi nhận thức được trong tội phạm học như thế này; Thí nghiệm nhằm kiểm tra hiệu quả răn đe của một đêm trong tù sau một cuộc tranh chấp trong nước so với việc chỉ yêu cầu thủ phạm rời đi trong đêm. Các cảnh sát viên được phát một tập tài liệu và màu của tờ hiện tại ở trên có nghĩa là xác định cách xử lý cá rô. trong sự cố cụ thể đã được nhận.

Điều cuối cùng xảy ra là các nhân viên cố tình không tuân theo thiết kế nghiên cứu và chọn một tờ dựa trên sở thích cá nhân cho những gì nên được thực hiện cho cá rô. Nó không phải là cực đoan để nghi ngờ sự mờ nhạt tương tự của năm ít nhất là có thể trong ví dụ của bạn.


Một ví dụ tuyệt vời, cảm ơn, nhưng một phần lý do là việc xì hơi khó hơn nhiều - họ không thể tranh luận rằng tờ giấy có màu vàng, bởi vì tôi có thể đi và kiểm tra ngày sinh và xem họ có được chỉ định chính xác không.
Jeremy Miles

3
Tôi đồng ý @JeremyMiles, đó chỉ là một lý do khác cho các nghiên cứu ngẫu nhiên mù đôi. Nó chỉ đơn thuần là một lập luận có chủ đích chống lại ngẫu nhiên giả - rằng việc phá vỡ điều trị dự định sẽ dễ dàng hơn so với ngẫu nhiên thực tế. (Ví dụ của tôi thực sự không phải là một ví dụ về giả ngẫu nhiên, nhưng nó minh họa điểm này một cách cô đọng.)
Andy W

Chà, điều đó phụ thuộc vào cách ngẫu nhiên (thật) được thực hiện - những người tham gia vào nghiên cứu đã làm một phần để tránh các vấn đề với lật đổ. Nếu bạn sử dụng ngẫu nhiên thực tế, bạn cần lưu giữ hồ sơ tốt để đảm bảo rằng người xác định ngẫu nhiên giao tiếp với người điều trị và người giao hàng thực hiện đúng. Với ví dụ của bạn, nếu họ đã sử dụng số nhà (giả sử), các cảnh sát viên có thể đã khó lật đổ hơn, mặc dù điều đó không phải là ngẫu nhiên.
Jeremy Miles

1
Xin lỗi về ping ngoài chủ đề: có một gợi ý trên Meta để biến [thử nghiệm ngẫu nhiên] thành một từ đồng nghĩa của thẻ [phân bổ ngẫu nhiên] ( stats.meta.stackexchange.com/a/4651 ). Bạn có đủ danh tiếng trong thẻ này để bỏ phiếu cho đề xuất này tại đây: stats.stackexchange.com/tags/random-allocation/synonymouss - hiện cần 4 lượt upvote để đi qua. Nếu bạn không đồng ý với đề xuất này, hãy xem xét nhận xét về Meta để giải thích lý do. Tôi sẽ xóa bình luận này sớm. Chúc mừng.
amip nói rằng Phục hồi Monica

0

Hoàn toàn ngẫu nhiên dựa trên phân phối ngẫu nhiên là không thể dự đoán được, trong trường hợp của bạn, người ta biết rằng liệu một trường hợp sẽ được chỉ định cho Can thiệp hoặc Kiểm soát trước khi xác nhận đủ điều kiện.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.