Trung bình trung bình (trung bình, trung bình cộng)


8

Hãy xem xét các thí nghiệm sinh học tế bào sau đây. Chúng tôi đang so sánhTphương pháp điều trị khác nhau của các tế bào nuôi cấy. Mỗi điều trịtđược nhân rộng trong một số giếng (microtiter) , được lập chỉ mục bởi biếnw{1,2,,W}. Để đo lường đáp ứng với điều trị tốtw, Tổng cộng Fwcác vi sóng không chồng lấp, hoặc các trường , được ghi lại. Sau đó, cho từng lĩnh vựcf tốt w, Tổng cộng Cwf các ô được xác định tính toán, theo đó mỗi ô c (tốt w, cánh đồng f) được đại diện bởi một bộ Pwfcđiểm ảnh. Cuối cùng, được liên kết với từng pixelp là một phép đo xwfcp (xuất phát từ cường độ của các tín hiệu huỳnh quang khác nhau được ghi ở pixel đó).

Vấn đề là tổng hợp tất cả các phép đo pixel xwfcp để tạo ra một "biện pháp hợp lý" Xt hiệu quả của điều trị t trên các tế bào được điều trị với nó, cũng như một số biện pháp "lây lan" của Xt.

Cách tiếp cận tiêu chuẩn cho các vấn đề như vậy là sử dụng giá trị trung bình là "số đo" và phương sai (hoặc độ lệch chuẩn) làm "mức chênh lệch". Tuy nhiên, trong trường hợp này, có nhiều cách, không tương đương trong đó phương tiện và phương sai có thể được tính toán.

Bây giờ tập trung vào các phương tiện, ở một thái cực, người ta có thể chỉ cần thêm vào xwfcp trên tất cả các pixel (bỏ qua phân phối của chúng trên các ô, trường và giếng) và chia tổng này cho tổng số pixel P (điều trị t):

1PΣw= =1WΣf= =1FwΣc= =1CwfΣp= =1Pwfcxwfcp

Ở thái cực ngược lại, chúng ta có thể trung bình ở mỗi cấp: đầu tiên tính trung bình xwfc của xwfcp cho mỗi ô, sau đó tính trung bình xwf sau đó xwfc cho từng lĩnh vực, v.v.

1WΣw= =1W[1FwΣf= =1Fw[1CwfΣc= =1Cwf[1PwfcΣp= =1Pwfcxwfcp]]]

Nói chung, hai biểu thức này sẽ không bằng nhau. Thêm vào đó là một số biến thể ở giữa. Theo tính toán của tôi, có 8 cách để làm điều này (bao gồm cả hai cách trên); Tôi đã liệt kê tất cả trong vinh quang đầy đủ của họ ở cuối bài này. Ví dụ: người ta có thể tính toán điều này (số 6 trong danh sách bên dưới):

1WΣw= =1W[1CwΣf= =1FwΣc= =1Cwf[1PwfcΣp= =1Pwfcxwfcp]]

...Ở đâu Cw= =ΣfΣc1 là tổng số ô (tổng hợp trên tất cả các trường) w. (Công thức được mã hóa bởi biểu thức này cho biết: "tính giá trị trung bình củaxwfcp cho mỗi tế bào, cụ thể là xwfc= =[Σpxwfcp]/Pwfcp; sau đó, cho mỗi giếngw, tính trung bình của những xwfc tính trung bình trên tất cả Cw tế bào tốt wTổ chức phân phối của họ trên các lĩnh vực, cụ thể là xw= =[ΣfΣcxwfc]/Cw; và cuối cùng, trung bìnhxw trên tất cả W giếng, [Σwxw]/W. ")

Đối mặt với tất cả các cách khác nhau để "sử dụng trung bình" để đo lường hiệu quả điều trị tTất nhiên, câu hỏi ngay lập tức là chọn cái nào? Một phiên bản sắc nét hơn của câu hỏi sẽ là: làm thế nào tôi có thể xác định theo kịch bản nào một biến thể nhất định sẽ phù hợp / thông tin / hữu ích?

Và, nói chung hơn: có bất kỳ cạm bẫy nào trong tính toán trung bình trung bình (trung bình ...) không?

Cảm ơn!


(chỉnh sửa chào mừng)
1.1PΣw= =1WΣf= =1FwΣc= =1CwfΣp= =1Pwfcxwfcp2.1WΣw= =1W[1PwΣf= =1FwΣc= =1CwfΣp= =1Pwfcxwfcp]wherePw= =Σf= =1FwΣc= =1CwfΣp= =1Pwfc13.1FΣw= =1WΣf= =1Fw[1PwfΣc= =1CwfΣp= =1Pwfcxwfcp]whereF= =Σw= =1WΣf= =1Fw1,Pwf= =Σc= =1CwfΣp= =1Pwfc14.1CΣw= =1WΣf= =1FwΣc= =1Cwf[1PwfcΣp= =1Pwfcxwfcp]whereC= =Σw= =1WΣf= =1FwΣc= =1Cwf15.1WΣw= =1W[1FwΣf= =1Fw[1PwfΣc= =1CwfΣp= =1Pwfcxwfcp]]6.1WΣw= =1W[1CwΣf= =1FwΣc= =1Cwf[1PwfcΣp= =1Pwfcxwfcp]]whereCw= =Σf= =1FwΣc= =1Cwf17.1FΣw= =1WΣf= =1Fw[1CwfΣc= =1Cwf[1PwfcΣp= =1Pwfcxwfcp]]số 8.1WΣw= =1W[1FwΣf= =1Fw[1CwfΣc= =1Cwf[1PwfcΣp= =1Pwfcxwfcp]]]


1
Bạn có thể làm một anova lồng nhau để xác định xem bất kỳ tác dụng điều trị nào là đáng kể. Một tài liệu tham khảo tốt là Biometry của Sokal và Rholf.
aaronjg

Tất cả các phương trình ở dưới cùng của câu hỏi là bằng nhau, bởi vì trung bình số học là một hàm tuyến tính. Phân số là vô hướng, vì vậy có thể được di chuyển ra ngoài tổng trong mỗi trường hợp. Thứ tự của các khoản tiền không quan trọng. Tất cả đều tương đương với
1WFCPΣw,f,c,pW,F,C,Pxwfcp
.
ness101

@ naught101: Tôi hoàn toàn không đồng ý. Để bắt đầu, biểu thức trong nhận xét của bạn thậm chí không phù hợp với ký hiệu tôi đã sử dụng trong câu hỏi của mình.
kjo

Bạn đã thử tính toán chúng? Lưu ý rằng có một điểm tôi đã bỏ lỡ: bạn đề cập đến phương sai và trong trường hợp đó (phương tiện của phương sai so với phương sai) chắc chắn là khác nhau, bởi vì phương sai không phải là toán tử tuyến tính (nó có tổng bình phương trong đó).
ness101

Câu trả lời:


5

Đây không phải là câu trả lời trực tiếp cho câu hỏi của bạn ('Loại trung bình nào để chọn'), mà là một đề xuất để tránh tính toán trung bình ở tất cả:

Kịch bản của bạn có vẻ giống như một trường hợp cho các mô hình phân cấp / đa cấp (MLM), vì dữ liệu được lồng hoàn hảo. Bạn có ba mức hiệu ứng ngẫu nhiên: pixel (Cấp 1) được lồng trong các ô (L2), được lồng trong các trường (L3), được lồng trong các giếng (L4). Phương pháp điều trị nên được coi là tác dụng cố định.

Bạn chỉ quan tâm đến hiệu quả của điều trị; phương pháp MLM quan tâm đến các phương sai khác nhau của từng cấp độ và cung cấp cho bạn ước tính mức độ chênh lệch được giải thích theo cấp độ nào. Vì vậy, bạn không 'mất' bất kỳ phương sai nào bằng cách coi giá trị trung bình là 'phép đo', nhưng bạn ước tính mô hình về mức độ dữ liệu thô.

Tuy nhiên, phương pháp này yêu cầu đủ số lượng nhóm cho mỗi hiệu ứng ngẫu nhiên (nghĩa là đủ pixel, đủ ô, đủ trường, đủ giếng). Vì bạn không quan tâm đến các tương tác ngang cấp, các khuyến nghị chung nói khoảng 10 đến 30 đơn vị tối thiểu (tất nhiên, tùy thuộc vào kịch bản cụ thể, v.v. Xem, ví dụ, tại đây ).


Liên kết đầu tiên bạn cung cấp (mô hình phân cấp / đa cấp) dường như đã bị hỏng ngay bây giờ.
steko
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.