Một khối trong thiết kế thí nghiệm là gì?


20

Tôi có hai câu hỏi về khái niệm khối trong thiết kế thử nghiệm: (1) Sự khác biệt giữa khối và yếu tố là gì? (2) Tôi đã cố đọc một số cuốn sách nhưng có một điều không rõ ràng: dường như các tác giả luôn cho rằng không có sự tương tác giữa "yếu tố khối" và các yếu tố khác. Có đúng không, và nếu có thì tại sao?

Câu trả lời:


13
  1. Khối là một yếu tố. Mục đích chính của việc chặn là để giảm sự biến đổi không giải thích được của một thiết kế được so sánh với thiết kế không bị chặn-. Chúng tôi không quan tâm đến hiệu ứng khối mỗi se , thay vào đó chúng tôi chặn khi chúng tôi nghi ngờ "tiếng ồn" nền sẽ cho thấy hiệu ứng của yếu tố thực tế.(SSResidual)
    Chúng tôi nhóm các đơn vị thử nghiệm thành các khối "đồng nhất" trong đó tất cả các cấp của yếu tố chính được biểu diễn như nhau. Việc phân tích phương sai của thiết kế Khối điều khiển ngẫu nhiên phân chia thời hạn còn lại của một yếu tố duy nhất tương đương Hoàn thành thiết kế ngẫu nhiên trong khối và các thành phần còn lại. Tuy nhiên, chúng ta nên lưu ý rằng thành phần sau có ít bậc tự do hơn trong các thiết kế CR nhân tố đơn lẻ, dẫn đến ước tính cao hơn cho .MSResidual=SSResidual/d.f.
    Quyết định chặn hay không chặn nên được đưa ra khi chúng tôi cho rằng việc giảm số dư sẽ nhiều hơn bù cho việc giảm df

  2. Thông thường một mô hình phụ gia được gắn vào dữ liệu thiết kế RCB, trong đó biến phản hồi là sự kết hợp phụ gia của yếu tố và hiệu ứng khối và người ta cho rằng không có tương tác tồn tại giữa hai yếu tố này. Tôi nghĩ rằng điều này được giải thích bởi thực tế là RCB không cho phép chúng tôi phân biệt BxF tương tác với biến thiên trong Khối và biến thiên trong các đơn vị thử nghiệm. Điểm mấu chốt là chúng ta phải giả sử không có tương tác vì chúng ta không thể đo lường được. Tuy nhiên, chúng tôi có thể kiểm tra xem nó hiện diện trực quan hay bằng thử nghiệm của Tukey.

Một nguồn lực tốt về thiết kế thử nghiệm là đây .


(+1) Một tác phẩm hay khác là Thiết kế và Phân tích Thí nghiệm của Montgomery .
chl

Cảm ơn bạn @chl. Montgomery nằm trong danh sách mua sắm của tôi nhưng tôi đã chọn không mua nó vì nó thiên về kỹ thuật hơn là sinh thái học. Tôi đã nhận thấy một phiên bản mới sẽ được xuất bản vào tháng 4 năm 2012, bạn sẽ cập nhật R đồng hành với nó chứ?
Charlie

1
Cảm ơn tất cả mọi người. Tôi khá có đầu óc toán học, sau đó tôi gặp khó khăn khi đọc những cuốn sách như cuốn Montgomery, trong đó có quá nhiều văn bản và không đủ toán học
Stéphane Laurent

@Charlie Yup, đó là một dự án có từ năm 2006 khi chế độ xem Nhiệm vụ Doe CRAN hoàn toàn không tồn tại. Tôi sẽ tiếp tục làm việc trên phiên bản thứ 6 với hy vọng hoàn thành nó trong năm nay (nhưng tôi nói rằng mỗi năm mới, vì vậy ...). Bên cạnh lĩnh vực ứng dụng 'thiên vị', tôi vẫn nghĩ rằng văn bản vẫn còn tuyệt vời cho các nhà tâm lý học và nhà sinh học.
chl

1
@ Stéphane Tôi có thể đề nghị xem qua Câu trả lời trên máy bay cho các câu hỏi phức tạp , bởi Christensen: ít DoE hơn, nhiều toán học hơn và giới thiệu tốt về Mô hình tuyến tính.
chl

8

Đây là một câu trả lời súc tích. Rất nhiều chi tiết và ví dụ có thể được tìm thấy trong hầu hết các tài liệu xử lý thiết kế thí nghiệm; đặc biệt là trong nông học.

Thông thường, nhà nghiên cứu không quan tâm đến hiệu ứng khối mỗi se, nhưng anh ta chỉ muốn tính đến sự thay đổi trong đáp ứng giữa các khối. Vì vậy, tôi sử dụng để xem khối là một yếu tố có vai trò cụ thể. Đáng lưu ý, hiệu ứng khối thường được coi là hiệu ứng ngẫu nhiên. Cuối cùng, nếu bạn mong đợi "hiệu quả điều trị" khác nhau từ khối này sang khối khác, thì nên xem xét các tương tác.


7

Đây là một cách diễn giải lời giải thích yêu thích của tôi, từ Freedom King, giáo viên cũ của tôi.

Bạn đang nghiên cứu làm thế nào bột bánh mì và nhiệt độ nướng ảnh hưởng đến độ ngon của bánh mì. Bạn có một thang đánh giá cho sự ngon miệng. Và giả sử bạn đang mua bột bánh mì đóng gói từ một số công ty thực phẩm thay vì tự trộn. Mỗi ổ bánh mì nướng là một đơn vị thử nghiệm.

Giả sử bạn có 2 bột và 8 nhiệt độ, bạn có thể nhét 4 ổ bánh mì vào lò nướng cùng một lúc và bạn muốn chạy n=160

Trong một hoàn toàn ngẫu nhiên 2×2

Ngoài ra, bạn có thể coi chạy lò là một yếu tố chặn . Trong trường hợp này, bạn sẽ chạy lò 40 lần, điều này có thể giúp thu thập dữ liệu nhanh hơn. Mỗi lần chạy lò sẽ có bốn ổ bánh, nhưng không nhất thiết phải là hai trong số mỗi loại bột. (Tỷ lệ chính xác sẽ được chọn ngẫu nhiên.) Bạn sẽ có 5 lần chạy lò cho mỗi nhiệt độ; điều này có thể giúp bạn tính đến sự thay đổi trong các lần chạy cùng nhiệt độ.

Thậm chí fancier, bạn có thể chặn bằng bột cũng như chạy lò. Trong thiết kế này, bạn sẽ có chính xác hai trong số mỗi loại bột trong mỗi lần chạy lò.

Khi tôi có thời gian để suy nghĩ kỹ, tôi sẽ cập nhật thêm với những cái tên lạ mắt phù hợp cho những thiết kế thử nghiệm đó.


2×82×2

Đây có phải là một ví dụ về chặn không đầy đủ?
SmallChess

6

Thiết kế thí nghiệm là sự kết hợp của ba cấu trúc:

  1. Cấu trúc điều trị: Các phương pháp điều trị được hình thành từ các yếu tố quan tâm như thế nào?
  2. Cấu trúc thiết kế: Các đơn vị thí nghiệm được nhóm lại và được chỉ định để điều trị như thế nào?
  3. Cấu trúc đáp ứng: Các quan sát được thực hiện như thế nào?

Các khối là "các yếu tố" thuộc về cấu trúc thiết kế (để phân biệt, không nên gọi chúng là "các yếu tố chặn" so với "các yếu tố xử lý"). Chúng là những ví dụ tốt về các thông số phiền toái : mô hình bạn phải có và sự hiện diện mà bạn phải tính đến, nhưng giá trị của chúng không đặc biệt thú vị. Xin lưu ý rằng điều này không liên quan gì đến bản chất của một yếu tố - các yếu tố chặn có thể là cố định hoặc ngẫu nhiên, giống như các yếu tố điều trị có thể cố định hoặc ngẫu nhiên.

Quy tắc cá nhân của tôi về vị trí của một yếu tố trong thiết kế thử nghiệm là: Nếu tôi muốn ước tính các tham số liên quan đến yếu tố đó và so sánh chúng trong phạm vi yếu tố hoặc các yếu tố khác, thì nó thuộc về cấu trúc xử lý. Nếu tôi không quan tâm đến các giá trị của các tham số liên quan và không quan tâm so sánh chúng, thì yếu tố này thuộc về cấu trúc thiết kế.

Vì vậy, trong ví dụ về bánh mì ở những nơi khác trong chủ đề này, tôi phải lo lắng về sự khác biệt giữa chạy và chạy. Nhưng tôi không quan tâm so sánh Run 1 vs Run 24. Chạy lò nướng thuộc về cấu trúc thiết kế . Tôi làm muốn so sánh hai công thức nấu ăn bột: công thức thuộc về cấu trúc điều trị. Tôi quan tâm đến nhiệt độ lò: cũng thuộc về cấu trúc xử lý. Hãy xây dựng một thiết kế thử nghiệm.

Cấu trúc thiết kế có một yếu tố (chạy lò, chạy) và cấu trúc xử lý hai yếu tố (Công thức và nhiệt độ). Bởi vì mỗi lần chạy phải là một nhiệt độ (danh nghĩa) duy nhất, Nhiệt độ và Chạy phải xảy ra ở cùng một mức của thiết kế thí nghiệm. Tuy nhiên, có không gian cho 4 ổ bánh trong mỗi lần chạy. Rõ ràng, chúng ta có thể chọn nướng 1, 2, 3 hoặc 4 ổ bánh mỗi lần chạy.

Nếu chúng tôi nướng một ổ bánh cho mỗi lần chạy và chọn ngẫu nhiên thứ tự trình bày Công thức, chúng tôi sẽ nhận được Cấu trúc Thiết kế ngẫu nhiên hoàn toàn (CRD). Nếu chúng tôi nướng hai ổ bánh, một trong mỗi Công thức cho mỗi lần chạy, chúng tôi có Cấu trúc Thiết kế khối hoàn chỉnh ngẫu nhiên (RCB). Xin lưu ý rằng điều quan trọng là mỗi Công thức xảy ra trong mỗi lần chạy. Nếu không có sự cân bằng đó, các so sánh Recipe sẽ bị ô nhiễm bởi sự khác biệt của Run. Hãy nhớ rằng: mục tiêu của việc chặn là loại bỏ sự khác biệt của Run. Nếu chúng ta nướng ba ổ bánh cho mỗi lần chạy, có lẽ chúng ta sẽ bị điên: 3 không phải là hệ số 160, vì vậy chúng ta sẽ có một hoặc hai khối có kích thước khác nhau. Khả năng hợp lý khác là bốn ổ bánh cho mỗi lần chạy. Trong trường hợp này, chúng tôi sẽ nướng hai ổ bánh của mỗi công thức trong mỗi lần chạy. Một lần nữa, đây là một cấu trúc RCB. Chúng tôi có thể ước tính độ biến thiên trong khi chạy bằng cách sử dụng sự khác biệt giữa hai ổ của mỗi Công thức trong mỗi lần chạy.

Nếu chúng ta chọn một trong các Cấu trúc thiết kế RCB, hiệu ứng Nhiệt độ hoàn toàn ngẫu nhiên ở cấp độ Chạy. Công thức được lồng trong nhiệt độ và có cấu trúc lỗi khác với nhiệt độ, vì mỗi bột xuất hiện trong mỗi lần chạy. Sự tương phản nhìn vào công thức và công thức bằng cách không gây nghiện (tương tác) không có sự biến đổi run-to-run trong chúng. Về mặt kỹ thuật, đây được gọi là cấu trúc thiết kế chia nhỏ hoặc cấu trúc thiết kế đo lường lặp lại .

Điều tra viên sẽ sử dụng? Có lẽ RCB với bốn ổ bánh: 40 chạy so với 80 so với 160 mang rất nhiều trọng lượng. Tuy nhiên, điều này có thể được sửa đổi - nếu mối quan tâm là lò nướng gia đình thay vì sản xuất công nghiệp, có thể có lý do để sử dụng CRD nếu người ta tin rằng thợ làm bánh tại nhà hiếm khi nướng nhiều ổ bánh.


2
Tôi không theo dõi phân tích của bạn về thí nghiệm bánh mì, có lẽ vì một số thiết kế khác nhau của thí nghiệm đó đã được đề cập và bạn không chỉ định (các) bạn đang đề cập đến. Điều đó làm cho hầu hết các ý kiến ​​của bạn khó hiểu hơn là chiếu sáng. Nếu bạn có thể làm rõ điều này tôi tin rằng câu trả lời của bạn sẽ nổi bật.
whuber

1
Tầm quan trọng của # 2 xứng đáng được đưa ra. Phân tích có thể được thực hiện dựa trên sự phân công ngẫu nhiên của các phương pháp điều trị thử nghiệm: các khối thể hiện các hạn chế đối với việc chỉ định ngẫu nhiên đó.
Scortchi - Phục hồi Monica

1
@whuber Đó là bởi vì tôi đã không phân tích nó, tôi đã thiết kế một thí nghiệm từ những thông số de novo . Làm rõ trong phần chỉnh sửa.
Dennis

3

Tôi nghĩ rằng hầu hết thời gian chỉ là vấn đề quy ước, có thể phù hợp với từng lĩnh vực. Tôi nghĩ rằng trong bối cảnh y tế, trong hai yếu tố anova, một trong những yếu tố hầu như luôn được gọi là "điều trị" và "khối" khác.

Thông thường, như ocram nói, hiệu ứng khối sẽ là hiệu ứng ngẫu nhiên, nhưng tôi không nghĩ đây là hệ thống. Giả sử bạn muốn đánh giá hiệu quả của các phương pháp điều trị y tế khác nhau:

  • Thiết kế đầu tiên: mỗi bệnh nhân chỉ mất một lần điều trị và hiệu quả được đo lường trên thang điểm thích hợp. Bạn nghi ngờ rằng giới tính của bệnh nhân là mối quan tâm: bạn sẽ có một "khối" nam và một khối bệnh nhân nữ. Trong trường hợp này, khối là một yếu tố có hiệu ứng cố định.

  • Thiết kế thứ hai: mỗi bệnh nhân thử tất cả các phương pháp điều trị tại những thời điểm khác nhau. Vì có một số thay đổi giữa các bệnh nhân, bạn coi mỗi bệnh nhân là một "khối". Bạn quan tâm đến sự tồn tại của một sự thay đổi trong dân số, nhưng không phải là giá trị của nó ở những bệnh nhân cụ thể này. Trong trường hợp này, khối là một yếu tố có hiệu ứng ngẫu nhiên.

Chà, tôi chỉ dạy những thứ này, cố gắng tuân thủ các quy ước của miền (ở Pháp) khi tôi nhận được chúng từ sách giáo khoa, nhưng tôi chưa bao giờ tham gia một thử nghiệm lâm sàng (và không muốn) ... vì vậy đây là chỉ hai xu của tôi ...!


1
Đối với tôi, dường như việc chặn biểu thị một chiến lược tổng quát hơn để giảm các lỗi thử nghiệm (bằng cách tính đồng nhất trong khối), một biểu hiện của phương pháp này là sử dụng các phép đo lặp lại . Ý tôi là, chặn như đã thấy trong RBD là một cách để kết hợp ngẫu nhiên và kiểm soát đối với các yếu tố gây nhiễu tiềm năng ở cấp độ của các đơn vị thống kê. Chặn cũng được sử dụng khi chúng ta không thể thực hiện sao chép hoàn toàn một (2khoặc khác) thiết kế giai thừa trong một khối duy nhất.
chl

@chl Tôi nghĩ bạn đúng! Tôi chỉ đưa ra một số ví dụ rất cơ bản ...
Elvis

Chúng là tốt (một ví dụ với thí nghiệm năng suất / cây trồng từ nông học sẽ làm cho nó rõ ràng hơn); Tôi chỉ chỉ ra rằng "chặn" vượt ra ngoài khái niệm "yếu tố" và sự phân biệt cố định và ngẫu nhiên.
chl

@chl, nếu bạn có một tài liệu tham khảo tốt (và đơn giản) về loại nội dung này, tôi rất vui khi đọc nó (và bạn nên đăng dưới dạng câu trả lời) ... (không phải là tài liệu tham khảo đơn giản được chấp nhận!)
Elvis

Ý bạn là example(aov)hay gói R NNolae ? :-)
chl
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.