Chính xác thì khoảnh khắc là gì? Chúng có nguồn gốc như thế nào?


19

Chúng tôi thường được giới thiệu phương pháp ước tính khoảnh khắc bằng cách "đánh đồng khoảnh khắc dân số với đối tác mẫu của họ" cho đến khi chúng tôi ước tính tất cả các tham số của dân số; do đó, trong trường hợp phân phối bình thường, chúng ta sẽ chỉ cần khoảnh khắc thứ nhất và thứ hai vì chúng mô tả đầy đủ phân phối này.

E(X)=μi=1nXi/n=X¯

E(X2)=μ2+σ2i=1nXi2/n

Và về mặt lý thuyết chúng ta có thể tính toán tới khoảnh khắc bổ sung như:n

E(Xr)i=1nXir/n

Làm thế nào tôi có thể xây dựng trực giác cho những khoảnh khắc thực sự là gì? Tôi biết chúng tồn tại như một khái niệm trong vật lý và trong toán học, nhưng tôi thấy không thể áp dụng trực tiếp, đặc biệt là vì tôi không biết làm thế nào để trừu tượng hóa từ khái niệm đại chúng thành điểm dữ liệu. Thuật ngữ này dường như được sử dụng theo một cách cụ thể trong thống kê, khác với việc sử dụng trong các ngành khác.

Đặc điểm nào của dữ liệu của tôi xác định có bao nhiêu ( r ) khoảnh khắc có tổng thể?


7
Thuật ngữ này có nghĩa tương tự như trong vật lý, khi áp dụng vào phân phối xác suất. Xem ở đây , có phương trình μn= =rnρ(r)dr , " trong đó ρ là phân bố mật độ điện tích, khối lượng hoặc bất kỳ số lượng nào đang được xem xét ". Khi "điều đang được xem xét" là mật độ xác suất, bạn có thời điểm xác suất tương ứng. Đó là những khoảnh khắc thô (khoảnh khắc về nguồn gốc). Bằng cách so sánh ... (ctd)
Glen_b -Reinstate Monica

2
Khoảnh khắc là các đặc tính tham số của phân phối các biến ngẫu nhiên, như lượng tử. Khoảnh khắc được tham số hóa bằng các số tự nhiên và hoàn toàn mô tả phân phối (xem hàm tạo mô men ). Điều này không loại trừ rằng đối với một số bản phân phối có thể có sự phụ thuộc chức năng hoàn hảo giữa các khoảnh khắc, vì vậy không phải tất cả các khoảnh khắc luôn được yêu cầu để mô tả phân phối. (1/2)
tchakravarty

Moments phụ thuộc chức năng vào hai cái đầu tiên cho phân phối bình thường, vì vậy hai cái đầu tiên đủ để mô tả phân phối, bao gồm giá trị trung bình và phương sai. (2/2)3
tchakravarty

5
(ctd) ... các khoảnh khắc trong toán học là như nhau ( ), ngoại trừ về chứ không phải 0 (tức là chỉ là một dạng tổng quát của vật lý - nhưng vì chúng giống nhau với sự thay đổi nguồn gốc đơn thuần, một nhà vật lý sẽ nói đúng "nó khác nhau như thế nào?"). Đây là giống như trong xác suất, khi là một mật độ. Đối với tôi, cả ba người đang nói về cùng một điều khi họ nói 'khoảnh khắc', không phải những điều khác nhau. c fμn=(xc)nf(x)dxcf
Glen_b -Reinstate Monica

3
Tôi chắc rằng bạn có thể tìm thấy câu trả lời trong nhiều chủ đề đã được đăng về khoảnh khắc và trực giác . Thống kê sử dụng các khoảnh khắc theo cách chính xác giống như cách chúng được sử dụng trong vật lý và toán học - đó là cùng một khái niệm với cùng một định nghĩa trong cả ba lĩnh vực.
whuber

Câu trả lời:


17

Đã lâu rồi tôi mới tham gia một lớp học vật lý, vì vậy hãy cho tôi biết nếu điều này không đúng.

Mô tả chung về khoảnh khắc với các chất tương tự vật lý

Hãy biến ngẫu nhiên, . Các khoảnh khắc -thứ của xung quanh là: tương ứng này chính xác đến ý nghĩa vật lý của một khoảnh khắc. Hãy tưởng tượng là một tập hợp các điểm dọc theo đường thẳng thực với mật độ được cho bởi pdf. Đặt một điểm tựa dưới dòng này tại và bắt đầu tính toán các khoảnh khắc liên quan đến điểm tựa đó và các phép tính sẽ tương ứng chính xác với các khoảnh khắc thống kê.n X c m n ( c ) = E [ ( X - c ) n ] X cXnXc

mn(c)= =E[(X-c)n]
Xc

Hầu hết thời gian, các khoảnh khắc -thứ của đề cập đến thời điểm khoảng 0 (khoảnh khắc mà các điểm tựa được đặt ở mức 0): Các -thứ trung tâm thời điểm là: Điều này tương ứng với những khoảnh khắc mà điểm tựa được đặt ở trung tâm khối lượng, do đó phân bố được cân bằng. Nó cho phép các khoảnh khắc dễ dàng được giải thích hơn, như chúng ta sẽ thấy bên dưới. Khoảnh khắc trung tâm đầu tiên sẽ luôn bằng không, vì phân phối được cân bằng.X m n = E [ X n ] n X m n = m n ( m 1 ) = E [ ( X - m 1 ) n ]nX

mn= =E[Xn]
nX
m^n= =mn(m1)= =E[(X-m1)n]

Các -thứ chuẩn khoảnh khắc của là: Một lần nữa, điều này quy mô khoảnh khắc bằng sự lan truyền của phân phối, cho phép giải thích cụ thể hơn về Kurtosis. Khoảnh khắc chuẩn hóa đầu tiên sẽ luôn là 0, giây thứ hai sẽ luôn là một. Điều này tương ứng với thời điểm của điểm chuẩn (z-points) của một biến. Tôi không có một tương tự vật lý tuyệt vời cho khái niệm này.X ~ m n = m nnX

m~n= =m^n(m^2)n= =E[(X-m1)n](E[(X-m1)2])n

Những khoảnh khắc thường dùng

Đối với bất kỳ phân phối có khả năng có vô số khoảnh khắc. Đủ các khoảnh khắc sẽ hầu như luôn luôn đặc trưng và phân phối đầy đủ (có được các điều kiện cần thiết để điều này là chắc chắn là một phần của vấn đề thời điểm ). Bốn khoảnh khắc thường được nói về rất nhiều trong thống kê:

  1. Có nghĩa là - khoảnh khắc đầu tiên (tập trung quanh số không). Nó là trung tâm khối lượng của phân phối, hoặc thay vào đó, nó tỷ lệ thuận với mô men xoắn của phân phối so với điểm tựa là 0.
  2. Phương sai - thời điểm trung tâm thứ 2. Được giải thích là đại diện cho mức độ phân phối của được trải ra. Nó tương ứng với thời điểm quán tính của một phân bố cân bằng trên điểm tựa của nó.X
  3. Skewness - khoảnh khắc trung tâm thứ 3 (đôi khi được chuẩn hóa). Một thước đo độ lệch của phân phối theo hướng này hay hướng khác. Liên quan đến phân phối bình thường (không có độ lệch), phân phối lệch dương có xác suất kết quả cực kỳ thấp, phân phối lệch có xác suất nhỏ có kết quả cực kỳ thấp. Tương tự vật lý là khó khăn, nhưng lỏng lẻo nó đo lường sự bất đối xứng của một phân phối. Ví dụ, hình dưới đây được lấy từ Wikipedia . Skewness, lấy từ Wikipedia
  4. Kurtosis - khoảnh khắc tiêu chuẩn hóa thứ 4, thường là Kurtosis dư thừa, khoảnh khắc tiêu chuẩn hóa thứ 4 trừ ba. Kurtosis đo lường mức độ đặt xác suất cao hơn vào trung tâm phân phối so với đuôi. Kurtosis cao hơn có nghĩa là độ lệch ít thường xuyên hơn so với độ lệch trung bình và độ lệch nhỏ hơn thường xuyên hơn. Nó thường được giải thích liên quan đến phân phối bình thường, có thời điểm chuẩn hóa thứ 4 là 3, do đó Kurtosis dư thừa bằng 0. Ở đây một tương tự vật lý thậm chí còn khó khăn hơn, nhưng trong hình dưới đây, được lấy từ Wikipedia , các phân phối có đỉnh cao hơn có Kurtosis lớn hơn. XKurtosis, cũng từ WIkipedia

Chúng tôi hiếm khi nói về những khoảnh khắc ngoài Kurtosis, chính xác bởi vì có rất ít trực giác với chúng. Điều này tương tự như các nhà vật lý dừng lại sau khoảnh khắc thứ hai.


6

Đây là một chút của một chủ đề cũ, nhưng tôi muốn sửa chữa một sai lầm trong nhận xét của Fg Nu, người đã viết "Khoảnh khắc được tham số hóa bởi các số tự nhiên, và hoàn toàn mô tả phân phối".

Khoảnh khắc KHÔNG hoàn toàn đặc trưng cho một phân phối. Cụ thể, kiến ​​thức về tất cả số lượng khoảnh khắc vô hạn, ngay cả khi chúng tồn tại, không nhất thiết phải xác định duy nhất phân phối.

Theo cuốn sách xác suất yêu thích của tôi, Feller "Giới thiệu về lý thuyết xác suất và ứng dụng của nó Vol II" (xem câu trả lời của tôi tại các ví dụ thực tế về phân phối chung ), ví dụ phần VII.3 trên trang 227-228, Lognatural không được xác định bởi các khoảnh khắc của nó, có nghĩa là có các phân phối khác có tất cả số lượng khoảnh khắc vô hạn giống như các hàm phân phối Lognatural, nhưng khác nhau. Như được biết đến rộng rãi, Hàm tạo khoảnh khắc không tồn tại cho Lognatural, cũng như không thể cho các bản phân phối khác này sở hữu cùng một khoảnh khắc.

Như đã nêu trên p. 228, một biến ngẫu nhiên được xác định bởi các khoảnh khắc của nó nếu tất cả chúng tồn tại vàX

Σn= =1(E[X2n])-1/(2n)

phân kỳ. Lưu ý rằng đây không phải là nếu và chỉ khi. Điều kiện này không giữ cho Lognatural, và thực sự nó không được xác định bởi các khoảnh khắc của nó.

Mặt khác, các phân phối (biến ngẫu nhiên) chia sẻ tất cả số lượng khoảnh khắc vô hạn, chỉ có thể khác nhau rất nhiều, do sự bất bình đẳng có thể được bắt nguồn từ khoảnh khắc của chúng.


Điều này được đơn giản hóa đáng kể khi phân phối bị giới hạn, trong trường hợp đó, các khoảnh khắc luôn xác định phân phối hoàn toàn (duy nhất).
Alex R.

@Alex Đó là hậu quả tức thời của kết quả được trích dẫn trong Feller.
whuber

Nó không hoàn toàn chính xác để nói rằng chức năng tạo khoảnh khắc không tồn tại cho logic bất thường. Các định lý hữu ích nhất về mgf giả sử nó tồn tại trong một khoảng mở chứa 0 và theo nghĩa chặt chẽ thì nó không tồn tại. Nhưng nó tồn tại trong một tia phát ra từ 0!, Và điều đó cũng cung cấp thông tin hữu ích.
kjetil b halvorsen

@ kjetil b halvorsen, bạn có thể mô tả (một số) thông tin hữu ích bạn sẽ nhận được từ sự tồn tại của MGF của một logic bất thường trên một tia phát ra từ 0 không? Tia đó sẽ là gì?
Mark L. Stone

Bump của nhận xét trên như câu hỏi cho @kjetil b halvorsen ..
Mark L. Stone

2

Một hệ quả của nhận xét của Glen_b là khoảnh khắc đầu tiên, trung bình, tương ứng với trọng tâm của một vật thể và khoảnh khắc thứ hai xung quanh giá trị trung bình, tương ứng với thời điểm quán tính của nó. Sau đó, bạn là của riêng bạn.


3
Tôi thích mối quan hệ của khoảnh khắc đầu tiên và ý nghĩa ... nhưng khoảnh khắc thứ hai không phải là phương sai ... phương sai là khoảnh khắc thứ hai trung tâm ... . v a r [ x ] = E [ ( x - E [ x ] ) 2 ] = ( x - E [ x ] ) 2 f ( x ) d xE[x2]= =x2f(x)dx vmộtr[x]= =E[(x-E[x])2]= =(x-E[x])2f(x)dx
Zachary Blumenfeld

0

Một cây nhị thức có hai nhánh, mỗi nhánh có thể bằng 0,5. Trên thực tế, p = 0,5 và q = 1-0,5 = 0,5. Điều này tạo ra một phân phối bình thường với khối lượng xác suất phân bố đồng đều.

Trên thực tế, chúng ta phải giả định rằng mỗi tầng trong cây đã hoàn thành. Khi chúng tôi chia dữ liệu thành các thùng, chúng tôi nhận được một số thực từ bộ phận, nhưng chúng tôi làm tròn số. Chà, đó là một tầng chưa hoàn chỉnh, vì vậy chúng tôi không kết thúc với một biểu đồ gần đúng với mức bình thường.

Thay đổi xác suất phân nhánh thành p = 0,9999 và q = 0,0001 và điều đó khiến chúng ta bị lệch bình thường. Khối lượng xác suất thay đổi. Điều đó cho sự sai lệch.

Có các tầng hoặc thùng không đầy đủ dưới 2 ^ n sẽ tạo ra các cây nhị thức với các khu vực không có khối lượng xác suất. Điều này cho chúng ta kurtosis.


Trả lời bình luận:

Khi tôi đang nói về việc xác định số lượng thùng, hãy làm tròn đến số nguyên tiếp theo.

Các máy quincunx thả các quả bóng mà cuối cùng gần đúng với phân phối bình thường thông qua nhị thức. Một số giả định được thực hiện bởi một máy như vậy: 1) số lượng thùng là hữu hạn, 2) cây bên dưới là nhị phân và 3) xác suất được cố định. Máy Quincunx tại Bảo tàng Toán học ở New York, cho phép người dùng thay đổi linh hoạt xác suất. Các xác suất có thể thay đổi bất cứ lúc nào, ngay cả trước khi lớp hiện tại kết thúc. Do đó ý tưởng về các thùng không được lấp đầy.

Không giống như những gì tôi đã nói trong câu trả lời ban đầu của tôi khi bạn có một khoảng trống trên cây, bản phân phối thể hiện sự bứt rứt.

Tôi đang xem xét điều này từ quan điểm của các hệ thống thế hệ. Tôi sử dụng một hình tam giác để tóm tắt cây quyết định. Khi một quyết định mới được đưa ra, nhiều thùng được thêm vào đáy của hình tam giác, và về mặt phân phối, ở đuôi. Cắt tỉa cây con từ cây sẽ để lại khoảng trống trong khối xác suất của phân phối.

Tôi chỉ trả lời để cung cấp cho bạn một cảm giác trực quan. Nhãn? Tôi đã sử dụng Excel và chơi với các xác suất trong nhị thức và tạo ra các độ lệch dự kiến. Tôi đã không làm như vậy với kurtosis, nó không giúp chúng ta buộc phải suy nghĩ về khối lượng xác suất là tĩnh trong khi sử dụng chuyển động gợi ý ngôn ngữ. Các dữ liệu cơ bản hoặc quả bóng gây ra kurtosis. Sau đó, chúng tôi phân tích nó một cách khác nhau và gán cho nó để định hình các thuật ngữ mô tả như trung tâm, vai và đuôi. Điều duy nhất chúng ta phải làm việc với các thùng. Thùng sống cuộc sống năng động ngay cả khi dữ liệu không thể.


2
Điều này là hấp dẫn, nhưng rất sơ sài. Các nhãn trên cây nhị thức của bạn là gì, ví dụ? Nó tốt hơn là một cây vô hạn nếu bạn muốn có một phân phối bình thường - nhưng sau đó các nhãn rõ ràng (sử dụng bước đi ngẫu nhiên hoặc sử dụng biểu diễn nhị phân của số thực) hoàn toàn không dẫn đến phân phối bình thường. Không có những chi tiết này, quá nhiều để lại cho trí tưởng tượng của độc giả. Bạn có thể giải thích về chúng?
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.