Tại sao một số biểu tượng thống kê lại có một bình phương vuông, ví dụ Variance , Bình R bình phương hoặc khả năng di truyền


7

Đôi khi tôi gặp các biểu tượng trong số liệu thống kê có biểu tượng mang "bình phương". Trong các lĩnh vực khác, chẳng hạn như cơ học, bạn đưa ra số lượng bạn quan tâm đến một chữ cái bình thường và sau đó xác định công thức của bạn để bạn có thể sắp xếp lại chúng cho đến khi số lượng bạn quan tâm là một chữ cái bình thường ở phía bên trái của công thức. Một ví dụ là vị trí sau khi di chuyển trong thời gian và vận tốc :xtv

x=vt

Tuy nhiên, trong thống kê, đôi khi số lượng bình phương nằm ở phía bên trái, bởi vì đó là những gì được sử dụng để giải thích thêm về kết quả:

  1. Phương sai của biến ngẫu nhiên với giá trị kỳ vọng E [X] = Bang :σX2XE[X]=µ

    σX2=E[(Xµ)2]

    Ở đây, một thực thể bình phương đứng ở phía bên trái của công thức.

  2. Hệ số xác định R2 , thậm chí chỉ được gọi là "R bình phương" mọi lúc bởi các nhà thống kê. Tại sao bạn không cho anh ấy một lá thư "bình thường" nếu nó được sử dụng thường xuyên như vậy?

  3. Khả năng di truyền là một biện pháp được sử dụng trong di truyền học khi số lượng biến dị xuất phát từ môi trường so với lượng biến dị xuất phát từ di truyền sẽ được đặt theo tỷ lệ. Một đặc điểm định lượng P (ví dụ chiều cao tăng trưởng) được mô hình hóa như thế này phụ thuộc vào hiệu ứng kiểu gen G và hiệu ứng môi trường E (tất cả các biến ngẫu nhiên):

    P=G+E

    Khả năng di truyền cảm giác rộng được định nghĩa [src]H2H2=Var(G)/Var(P)

    Không ai quan tâm đến , chỉ có .HH2

Ý nghĩa của quy ước này là gì? Nó nói gì với các nhà thống kê? Hoặc có một số nguyên nhân không liên quan?


5
Nếu bạn muốn bạn có thể báo cáo độ lệch chuẩn thay vì phương sai. Xem stats.stackexchange.com/questions/118/...stats.stackexchange.com/questions/83347/... không có phép thuật trong quảng trường, chỉ đơn giản là một số giá trị bình phương có ý nghĩa và tốt đẹp để làm việc với. Hơn nữa, trực tiếp hơn là có ví dụ như để bạn phải nhớ rằng ...σ2ξ=σ2ξ=σ
Tim

6
Ký hiệu là một nhánh của nghi thức, thay vì logic, và phát triển một cách lộn xộn, như lịch sử chuyên dụng cho thấy. Sử dụng càng ít ký hiệu càng tốt là một tiêu chí rõ ràng, đặc biệt là khi bảng chữ cái tiện lợi đã bị quá tải (bao giờ phải vật lộn với xác suất, số lượng dự đoán và giá trị trong cùng một cuộc thảo luận?). Trong lịch sử, mối tương quan đi trước nhận ra rằng hình vuông của nó là hữu ích và thú vị; cũng nhấn mạnh vào phương sai (chủ yếu) theo sau căng thẳng về độ lệch chuẩn hoặc bội số của chúng. Vì vậy, việc thêm một hình vuông vào một biểu tượng hiện có ý nghĩa trong những trường hợp đó. P
Nick Cox

Câu trả lời:


6

Mặc dù chúng tôi có thể phân tích nhiều công thức khác nhau mà chúng tôi tìm thấy trong thống kê và thấy rằng khoảnh khắc thứ hai có một vị trí đặc biệt ...

... có lẽ là một vị trí thống kê đặc biệt hơn trong vật lý (đôi khi cũng sử dụng thuật ngữ bình phương cho đơn giản, ví dụ 'bán kính hồi chuyển' Và cũng là một thuật ngữ như ' thời điểm quán tính' không hoàn toàn đơn giản hóa hạn và chứa origin của nó lúc này giống như thuật ngữ thống kê chứa nguồn gốc của chúng vuông . Ngày đầu này, các nhà vật lý như đơn giản như , trong khi thống kê, tốt) ...rg2=h2π

Tuy nhiên, lý do cho việc sử dụng thuật ngữ bình phương này (ví dụ: dễ dàng bị xem là chứa "hằng số" thay vì , khi bạn lấy nó ra khỏi ngoặc) có thể dễ dàng tìm thấy hơn trong các lý do lịch sử .(xσ)2σ2σ


h2R2

Qua câu trả lời của Nick Cox về câu hỏi CV trước đó Ai là người sáng tạo hay phát minh ra hệ số xác định (bình phương R)? chúng tôi thấy rằng lịch sử có ảnh hưởng lớn đến thuật ngữ này. Và điều này không chỉ dành cho , thuật ngữ được "phát minh" bởi cùng một người. Chỉ cần xem một bài viết tìm kiếm trên google:R2h2

https://scholar.google.com/scholar?q="degree+of+determination"&as_ylo=1918&as_yhi=1924

Bạn thấy rằng Sewall Wright đã làm rất nhiều về những mô tả đầu tiên về khái niệm 'mức độ quyết tâm'. Ông đã biểu thị cả và theo bình phương của một thứ khác 1) hệ số tương quan và 2) di truyền hoặc hệ số tương quan tương đương (xem một nguồn sớm hơn được đề cập bởi Nick Cox: Wright 1920 ) .R2h2Rh

Trong một bài viết như Mordecai Ezekiel 1929 Ý nghĩa và tầm quan trọng của các hệ số tương quan bạn thấy rằng trong một thời gian đáng kể mọi người sử dụng tất cả các loại biểu thức với hệ số tương quan (trong bài viết ví dụ cụ thể: , , , ) ngoài , điều này làm cho ký hiệu rõ ràng của quan trọng ( vật lý không cung cấp quyền tự do lựa chọn này, trong đó chúng ta cần xem xét loại nào thời điểm, thứ nhất, thứ hai, thứ ba, hoặc chức năng của chúng, hoặc một cái gì đó khác như trung vị, là tốt nhất để mô tả một phân phối hoặc tình huống nhất định ).r2r1r211r2r2r2

Trong tổng quan tuyệt vời từ Wright 1934 " phương pháp các hệ số đường dẫn ", ông gợi ý

"Hệ số đường bình phương theo đó có thể được gọi là hệ số xác định. Các hệ số như vậy đã được sử dụng trước khi hệ số đường dẫn được áp dụng cho căn bậc hai."

mặc dù mọi người vẫn sử dụng định nghĩa bình phương. Có lẽ 'phương pháp hệ số đường dẫn' này không được yêu thích lắm, bởi vì hiện tại ai đang dạy / học điều này và những gì các chuyên gia thống kê khác đã sử dụng các định nghĩa này?

Trong tổng quan này từ Wright năm 1934, bạn cũng tìm thấy một tài liệu tham khảo cho một bài báo năm 1918 trong đó ông sử dụng bình phương các hệ số tương quan nhưng chưa phải là một thuật ngữ liên quan đến 'quyết tâm'.


σ2

Thuật ngữ này rất thường không được sử dụng như vậy. Và thay vào đó nó được sử dụng

  • không có hình vuông ở phía bên trái của phương trìnhσ=E[(Xμ)2]
  • hoặc được thay thế bằng thuật ngữ "phương sai". Một biểu thức điển hình là .Var(X)

    Một biểu thức hiện có khác là (được sử dụng rộng rãi trong các văn bản cũ hơn). Các chỉ số biểu thị thứ tự của thời điểm. Vì vậy, (hoặc tốt hơn ) là khoảnh khắc thô đầu tiên hoặc trung bình, chỉ số 2 có nghĩa là khoảnh khắc thứ hai (phương sai trong trường hợp giây thứ hai trung tâm), chỉ số 3 có nghĩa là khoảnh khắc thứ ba , .... , Vân vânμ2μ1=μμ1=μ

    (Một vấn đề với biểu tượng này là không rõ khoảng thời điểm nào, ví dụ: trung tâm hoặc thô, được xác định, ngay cả khi vs tồn tại để phân biệt giữa thô và trung tâm. Biểu tượng cho có nghĩa là thực sự có cùng một vấn đề, mặc dù nó đã trở nên rất chuẩn sao cho sự mơ hồ không phù hợp trong hầu hết các trường hợp)μ2μμμ

Chà, văn bản lớn dưới mục này giải thích một chút lý do tại sao có thể dễ dàng hơn đối với nhiều nhà khoa học và nhà thống kê. Vẫn giống như và có nguồn gốc lịch sử. Thú vị đọc:σ2h2R2

  • Pearson 1894 Đóng góp cho Lý thuyết tiến hóa toán học, trong đó, tại một số điểm, độ lệch chuẩn thực sự được viết làσ=μ2
  • Airy 1861 (người sử dụng chữ thay cho và lỗi mô tả của bình phương trung bình , nhưng cũng so sánh với các khái niệm khác nhau, không bình phương, có nghĩa là lỗilỗi có thể xảy ra )cσ
  • Fisher kiểm tra vào năm 1920 sự khác biệt giữa và chưa biết được ước tính bởi khoảnh khắc trung tâm đầu tiên 'lỗi trung bình' hoặc khoảnh khắc trung tâm thứ hai 'lỗi bình phương'.σ1σ2σ
  • Theo Wikipedia (Okt 19 2017) , lần đầu tiên Fisher sử dụng thuật ngữ 'phương sai'.

    "Do đó, rất mong muốn trong việc phân tích các nguyên nhân của sự biến đổi để đối phó với bình phương độ lệch chuẩn là thước đo độ biến thiên. Chúng tôi sẽ gọi đại lượng này là phương sai"

    Nếu bạn đọc bài viết bạn thấy rằng ông thường đặt đúng vào phía bên tay trái của phương trình và biểu thị nó với một chữ cái . Việc sử dụng chữ thực sự vẫn còn phổ biến hiện nay trong các công trình về thống kê toán học. Trong bài viết này, anh ta thường sử dụng , nhưng đó là vì đơn giản. Hãy tưởng tượng định lý của Fermat được viết với một thuật ngữ như thay vì . Theo cách này, sự đơn giản trong các phương trình, việc sử dụng trở nên mạnh mẽ hơn. Lưu ý rằng việc thay thế bằng không phải lúc nào cũng hữu ích. Đôi khi, người ta muốn chỉ ra rằng phép tính là vềVVσ2c=an+bnncn=an+bnσ2σ2Vσ2. Ví dụ: phương trình 1 trong bài viết năm 1918 rõ ràng hơn , nếu , nội dung của nó, được viết rõ ràng trong phương trình.σ2=a2V=a2σ

  • Trước đó hơn Fisher, có đề cập đến 'tính biến thiên' : 1916 James Johstone ( LÝ THUYẾT TOÁN HỌC CỦA VARIABILITY ) mô tả một khái niệm về tính biến đổi liên quan đến phân phối Gaussian. Liên quan đến 'độ lệch bình phương' hoặc 'độ lệch bình phương', bạn sẽ tìm thấy một số nguồn trước đó. Một tài liệu tham khảo thú vị trong số những sử dụng đầu tiên của 'độ lệch bình phương' là Francis Ysidro Edgeworth (1917) , người đã nói, trong một chú thích, về 'biến động' thay cho .σ2


1

Khả năng di truyền cảm giác hẹp được ký hiệu là vì mọi người (không chắc là ai nhưng xem Felsenstein, 2016, Ch. IX, vấn đề 7) lần đầu tiên giới thiệu ký hiệu cho mối tương quan giữa hiệu ứng di truyền phụ gia và kiểu hình , Nếu thành phần phụ gia và kiểu hìnhh2hxz=x+e

h=corr(x,z)=Cov(x,z)Var(x)Var(z)=Cov(x,x+e)Var(x)Var(z)=Var(x)Var(x)Var(z)=Var(x)Var(z)
xzlà ngẫu nhiên chung, sau đó độ dốc của hồi quy của thành phần di truyền phụ gia hoặc giá trị nhân giống trên kiểu hình (khả năng di truyền xác định đáp ứng với lựa chọn xuất hiện trong phương trình của nhà tạo giống) trở thành .xz
βx|z=Cov(x,y)Var(z)=Var(x)Var(z)=h2.
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.