Có một thử nghiệm thống kê để so sánh hai mẫu cỡ 1 và 3 không?


19

Đối với một dự án sinh thái, nhóm phòng thí nghiệm của tôi đã thêm giấm vào 4 bể chứa lượng nước ao bằng nhau, 1 đối chứng không có elodea (một loại cây thủy sinh) và 3 phương pháp xử lý với cùng một lượng elodea trong mỗi bể. Mục đích của việc thêm giấm là để giảm độ pH. Giả thuyết được đưa ra là các bể chứa elodea sẽ quay trở lại độ pH bình thường nhanh hơn. đây quả nhiên là một trường hợp đấy! Chúng tôi đã đo độ pH của mỗi bể hàng ngày trong khoảng hai tuần. Tất cả các bể cuối cùng đã trở về độ pH tự nhiên của chúng, nhưng khoảng thời gian mà việc này mất nhiều thời gian hơn đối với các bể có elodea.

Khi chúng tôi nói với giáo sư của chúng tôi về thiết kế thử nghiệm của chúng tôi, ông nói rằng không tồn tại thử nghiệm thống kê nào có thể được thực hiện trên dữ liệu để so sánh kiểm soát với điều trị. Điều đó bởi vì không có bản sao cho điều khiển (chúng tôi chỉ sử dụng một bể điều khiển), chúng tôi không thể tính toán phương sai và vì vậy chúng tôi không thể so sánh các phương tiện mẫu của điều khiển và xử lý. Vì vậy, câu hỏi của tôi là, điều này có đúng không? Tôi chắc chắn hiểu ý của anh ấy. Ví dụ: nếu bạn lấy chiều cao của một nam và một nữ, bạn không thể đưa ra kết luận về dân số tương ứng của họ. Nhưng chúng tôi đã thực hiện 3 phương pháp điều trị và phương sai rất nhỏ. Có vẻ hợp lý khi cho rằng phương sai sẽ tương tự trong điều khiển?

Cập nhật:

Cảm ơn bạn đã trả lời tuyệt vời. Chúng tôi đã nhận được nhiều nước và elodea từ vùng đất ngập nước và quyết định chúng tôi sẽ chạy lại thí nghiệm với các bể nhỏ hơn nhưng lần này với 5 điều khiển và 5 phương pháp điều trị. Chúng tôi sẽ kết hợp dữ liệu này với dữ liệu ban đầu của chúng tôi nhưng độ pH ban đầu của các bể đủ khác nhau đến mức dường như không hợp lệ khi xem xét thí nghiệm mới được lấy mẫu từ cùng một quần thể như thí nghiệm ban đầu.

Chúng tôi đã xem xét bổ sung lượng elodea khác nhau và cố gắng tương quan tốc độ khắc phục pH (được đo khi thời gian trôi qua cho đến khi pH trở về giá trị ban đầu) với lượng elodea, nhưng chúng tôi quyết định rằng điều đó là không cần thiết. Mục tiêu của chúng tôi chỉ là chỉ ra rằng elodea tạo ra sự khác biệt tích cực, chứ không phải để xây dựng một loại mô hình dự đoán nào đó cho chính xác cách pH phản ứng với các lượng elodea khác nhau. Sẽ rất thú vị khi xác định lượng elodea tối ưu, nhưng đó có lẽ chỉ là lượng tối đa có thể sống sót. Cố gắng điều chỉnh đường cong hồi quy cho dữ liệu sẽ không được chiếu sáng đặc biệt vì những thay đổi phức tạp khác nhau xảy ra với cộng đồng khi thêm một lượng lớn. Elodea chết, phân hủy, các sinh vật mới bắt đầu thống trị, và như vậy.


4
Bạn đã thêm cùng một lượng Elodea vào mỗi trong 3 bể 'điều trị' chưa?
gung - Tái lập Monica

2
Có, chúng tôi đã thêm cùng một lượng Elodea vào mỗi lần điều trị.
Simon Hunt

Câu trả lời:


21

Lưu ý câu hỏi của gung; nó quan trọng. Tôi sẽ cho rằng việc điều trị là giống nhau cho mọi bể trong nhóm điều trị.

Nếu bạn có thể lập luận phương sai sẽ bằng nhau cho hai nhóm (mà bạn thường giả sử cho một bài kiểm tra hai mẫu dù thế nào đi nữa), bạn có thể làm một bài kiểm tra. Bạn không thể kiểm tra giả định đó, bất kể nó có thể bị vi phạm nghiêm trọng đến mức nào.

Những mối quan tâm thể hiện trong câu trả lời này cho một câu hỏi liên quan thậm chí còn phù hợp hơn với tình huống của bạn, nhưng bạn sẽ không thể làm gì về nó.

[Bạn hỏi về việc có hợp lý không khi cho rằng phương sai là bằng nhau. Chúng tôi không thể trả lời rằng đối với bạn, đó là điều bạn phải thuyết phục các chuyên gia về chủ đề (tức là các nhà sinh thái học) là một giả định hợp lý. Có những nghiên cứu khác mà mức độ như vậy đã được đo lường dưới cả điều trị và kiểm soát? Những người khác trong đó các thử nghiệm tương tự ( đặc biệt là kiểm tra t hoặc anova - Tôi cá là bạn có thể tìm thấy tiền lệ tốt hơn) đã được thực hiện hoặc các giả định tương tự được thực hiện? Một số hình thức lý luận chung mà bạn có thể thấy để áp dụng?]

x¯y¯σ2x¯-y¯μx-μyσ2(1/nx+1/ny)n

ny

(x¯-y¯)Sx1/nx+1

Sxtnx-1

σSxSpny

Chỉnh sửa:

Đây là một đường cong sức mạnh mô phỏng cho thử nghiệm này. Cỡ mẫu ở null là 10000, tại các điểm khác là 1000. Như bạn thấy, tỷ lệ loại bỏ ở null là 0,05 và đường cong công suất, trong khi nó đòi hỏi một sự khác biệt lớn về dân số có nghĩa là có sức mạnh khá, có đúng hình. Đó là, thử nghiệm này làm những gì nó được cho là.

đường cong sức mạnh

(Kết thúc chỉnh sửa)

Tuy nhiên, với kích thước mẫu quá nhỏ, điều này sẽ hơi nhạy cảm với các giả định phân phối.

Nếu bạn chuẩn bị đưa ra các giả định khác nhau hoặc muốn kiểm tra sự bình đẳng của một số lượng dân số khác, một số thử nghiệm vẫn có thể thực hiện được.

Vì vậy, tất cả không bị mất ... nhưng nếu có thể, nói chung tốt hơn là có ít nhất một số bản sao trong cả hai nhóm.


1
Lưu ý bạn sẽ cần tuân theo các công thức @Glen_b đã nêu. Cả Excel và Minitab sẽ không tính toán điều này.
zbicyclist

10
(+1) Một cách tiếp cận tương đương (sử dụng cùng một công thức) - và do đó có nhiều đạn hơn để biện minh cho câu trả lời này - là bạn có thể tính một khoảng dự đoán cho một giá trị tương lai từ nhóm điều trị. Nếu giá trị kiểm soát không nằm trong khoảng dự đoán đó, bạn có bằng chứng quan trọng về sự khác biệt giữa hai nhóm. Sự khác biệt có thể là sự kết hợp của một sự khác biệt về trung bình hoặc sự khác biệt về phương sai, nhưng có (có thể) một sự khác biệt.
whuber

3
σ(x¯12)sx1/nxt

2
@Glen_b: Không chắc điều này có thay đổi vào tháng 11 năm ngoái không, nhưng R 3.0 sẽ thực hiện kiểm tra tổng hợp khi một trong các kích thước mẫu là một và đưa ra câu trả lời tương tự như anova.
Aaron - Phục hồi Monica

2
Đối với bất kỳ ai muốn dùng thử trong R: t.test(x=c(4.5,4.8,4.6),y=5.2, var.equal=TRUE) - có vẻ như điều này hoạt động trong cả R2.15.2 và R3.0.0 (hai phiên bản duy nhất tôi có tiện dụng).
Glen_b -Reinstate Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.