Tầm quan trọng của hàm


19

Trong lớp tính toán của tôi, chúng tôi đã gặp hàm ex2 hoặc "đường cong hình chuông" và tôi được cho biết rằng nó có các ứng dụng thường xuyên trong thống kê.

Vì tò mò, tôi muốn hỏi: Hàm ex2 thực sự quan trọng trong thống kê không? Nếu vậy, điều gì về ex2 làm cho nó hữu ích, và một số ứng dụng của nó là gì?

Tôi không thể tìm thấy nhiều thông tin về chức năng trên internet, nhưng sau khi thực hiện một số nghiên cứu, tôi đã tìm thấy một liên kết giữa các đường cong hình chuông nói chung và một thứ gọi là phân phối bình thường . Một trang Wikipedia liên kết các loại chức năng này với ứng dụng thống kê, với phần đánh dấu của tôi, nêu rõ:

"Phân phối chuẩn được coi là phân phối xác suất nổi bật nhất trong thống kê. Có một số lý do cho việc này: 1 Đầu tiên, phân phối bình thường phát sinh từ định lý giới hạn trung tâm, trong đó nêu rõ trong điều kiện nhẹ, tổng số lượng lớn các biến ngẫu nhiên được rút ra từ cùng một phân phối được phân phối xấp xỉ bình thường, bất kể hình thức phân phối ban đầu . "

Vì vậy, nếu tôi thu thập một lượng lớn dữ liệu từ một loại khảo sát hoặc tương tự, chúng có thể được phân phối đồng đều giữa một chức năng như ex2 không? Hàm này là đối xứng, vì vậy tính đối xứng của nó tức là tính hữu dụng của nó đối với phân phối bình thường, điều gì làm cho nó rất hữu ích trong thống kê? Tôi chỉ đang suy đoán.

Nói chung, điều gì làm cho ex2 hữu ích trong thống kê? Nếu phân phối bình thường là khu vực duy nhất, thì điều gì làm cho độc đáo hoặc đặc biệt hữu ích trong số các hàm loại gaussian khác trong phân phối bình thường?ex2


Vâng để bắt đầu mà nên đọc "có nghĩa là" không "tổng hợp".
Tristan

2
Tổng hợp quá. Rốt cuộc, nó chỉ là giá trị trung bình nhân với số lượng mẫu.
Erik

1
Báo giá cho thấy các từ khóa cho tìm kiếm bao gồm "phân phối bình thường". Thực hiện tìm kiếm ở đây tìm thấy hơn 600 chủ đề - trung bình một chủ đề mỗi ngày kể từ khi trang web này bắt đầu. Một thời gian ngắn lướt qua các hit này sẽ nhanh chóng giúp bất cứ ai đánh giá cao vai trò của "đường cong chuông" trong thống kê.
whuber

4
Từ chủ đề được bình chọn hàng đầu liên quan đến phân phối bình thường : "Mọi người đều tin vào luật hàm mũ [nghĩa là phân phối chuẩn]: các nhà thí nghiệm, vì họ nghĩ rằng nó có thể được chứng minh bằng toán học và các nhà toán học, vì họ tin rằng nó có được thành lập bằng cách quan sát. "
ai

Xem câu trả lời cho câu hỏi của tôi "đặc điểm đáng ngạc nhiên nhất của phân phối gaussian là gì" stats.stackexchange.com/questions/4364/ Kẻ
cướp girard

Câu trả lời:


12

Lý do chức năng này thực sự quan trọng là phân phối bình thường và đồng hành liên kết chặt chẽ của nó, định lý giới hạn trung tâm (chúng tôi có một số giải thích tốt về CLT trong các câu hỏi khác ở đây).

Trong thống kê, CLT thường có thể được sử dụng để tính toán xác suất xấp xỉ, đưa ra các tuyên bố như "chúng tôi tin tưởng 95% rằng ..." có thể (ý nghĩa của "95% tự tin" thường bị hiểu nhầm, nhưng đó là một vấn đề khác).

Hàm là (một phiên bản thu nhỏ của) hàm mật độ của phân phối chuẩn. Nếu một đại lượng ngẫu nhiên có thể được mô hình hóa bằng cách sử dụng phân phối bình thường, hàm này mô tả khả năng các giá trị có thể khác nhau của đại lượng nói trên có khả năng như thế nào. Kết quả ở những vùng có mật độ cao có nhiều khả năng hơn kết quả ở những vùng có mật độ thấp.exp((xμ)22σ2)

σ là các thông số xác định vị trí và quy mô của hàm mật độ. Nó là đối xứng về μ , vì vậy thay đổi μ có nghĩa là bạn chuyển chức năng sang phải hoặc sang trái. σ xác định giá trị của hàm mật độ tối đa của nó ( x = μ ) và nó đi đến 0 càng nhanh như thế nào x di chuyển xaμσμμσx=μx . Trong ý nghĩa đó, thay đổi σ thay đổi quy mô của hàm.μσ

Đối với sự lựa chọn đặc biệt σ =μ=0 mật độ là (tỷ lệ thuận với)eσ=1/2 . Đây không phải là một lựa chọn đặc biệt thú vị của các tham số này, nhưng nó có lợi ích là mang lại một hàm mật độ trông hơi đơn giản hơn tất cả các tham số khác.ex2

Mặt khác, chúng ta có thể đi từ cho bất kỳ mật độ bình thường khác bởi sự thay đổi-of-biến x = u - μex2. Lý do mà sách giáo khoa của bạn nói rằnge-x2chứ không phảiexp(-(x-μ)2x=uμ2σex2, một chức năng rất quan trọng làe-x2đơn giản hơn để viết.exp((xμ)22σ2)ex2


1
(+1) câu đầu tiên của đoạn áp chót: Tôi có thể nói là tỷ lệ thuận với thay .
Đức hồng y

@cardinal: Cảm ơn, bạn hoàn toàn đúng! Tôi chỉnh sửa câu trả lời.
MånsT

1
+1, tôi thực sự thích câu trả lời này. Một điều có thể đáng để chỉ ra là pdf của bình thường thường được viết bằng ở phía trước. Lý do là tổng diện tích dưới đường cong bằng12πσ2 , nhưng vì việc sử dụng điển hình của pdf là để xác định xác suất (mà số tiền đến 1), nó là thuận tiện cho diện tích dưới đường cong bằng 1, và do đó chúng tôi chia cho tổng số để đạt được kết quả đó. Tôi nghĩ bạn đã đúng rằng điều này đã bị bỏ qua vì vẻ ngoài đơn giản hơn. 2πσ2
gung - Phục hồi Monica

3

Bạn đã đúng, phân phối bình thường hoặc gaussian là một được chia tỷ lệ và thay đổi ( - x 2 ) , vì vậy tầm quan trọng của exp ( - x 2 )exp(x2)exp(x2) chủ yếu đến từ thực tế rằng đó thực chất là phân phối bình thường.

Và phân phối bình thường chủ yếu là quan trọng bởi vì ("trong điều kiện đều đặn nhẹ") tổng của nhiều biến ngẫu nhiên độc lập và phân phối giống hệt nhau đến mức bình thường, khi "nhiều" tiến đến vô cùng.

Không phải mọi thứ thường được phân phối. Ví dụ: kết quả khảo sát của bạn có thể không, ít nhất là nếu các phản hồi thậm chí không ở trên thang đo liên tục mà giống như số nguyên 1 Vượt5. Nhưng giá trị trung bình của các kết quả thường được phân phối qua lấy mẫu lặp lại, vì giá trị trung bình chỉ là một tổng (tỷ lệ chuẩn hóa) và các phản ứng riêng lẻ độc lập với nhau. Tất nhiên, giả sử mẫu đủ lớn, vì nói đúng ra, tính quy phạm chỉ xuất hiện khi kích thước của mẫu trở nên vô hạn.

Như bạn thấy trong ví dụ, phân phối bình thường có thể xuất hiện do kết quả của quá trình ước tính hoặc mô hình hóa, ngay cả khi dữ liệu không được phân phối bình thường. Do đó phân phối bình thường ở khắp mọi nơi trong thống kê. Trong thống kê bayes, nhiều phân phối tham số sau là xấp xỉ bình thường, hoặc có thể được giả định là.


ex2

Chúng không đồng nghĩa, cảm ơn vì đã chỉ ra điều này. (Ý định của tôi không phải là chính xác, chỉ có thể hiểu được với một người không thống kê. Đã có câu trả lời chính xác tốt.)
scellus

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.