Khi giảng dạy thống kê, hãy sử dụng những người bình thường, hay sử dụng những gì khác?


42

Tôi sử dụng chủ yếu là "phân phối Gaussian" trong cuốn sách của mình, nhưng ai đó chỉ đề nghị tôi chuyển sang "phân phối bình thường". Bất kỳ sự đồng thuận về thuật ngữ nào để sử dụng cho người mới bắt đầu?

Tất nhiên hai thuật ngữ này là từ đồng nghĩa , vì vậy đây không phải là câu hỏi về chất, mà hoàn toàn là vấn đề thuật ngữ nào được sử dụng phổ biến hơn. Và tất nhiên tôi sử dụng cả hai thuật ngữ. Nhưng cái nào nên dùng nhất?


1
Có một phần xem trước / chương mẫu của cuốn sách của bạn có sẵn ở đâu đó không? Tôi nghe những điều tốt về nó.
Glen_b

2
@Glen_b Tính năng "Nhìn vào bên trong" của amazon.com cho phép bạn xem trước sách. Ngoài ra, ba chương có sẵn ở đây: intuitivebiostatistics.com/excerpts
Harvey Motulsky

6
Vấn đề "mà hạn được sử dụng phổ biến hơn" có thể dễ dàng được giải quyết, mặc dù thô sơ: Một Google tìm kiếm phân phối "Gaussian" có khoảng 2/3 trong những hit của một tìm kiếm cho "phân phối bình thường." Tỷ lệ này hơi khác một chút trên Google Scholar, trong đó hiện tại "phân phối Gaussian" có một nửa số lần truy cập "phân phối bình thường" (nhưng chỉ một phần tư khi loại trừ "nghịch đảo"). Những kết quả này cho thấy (1) "bình thường" phổ biến hơn nhưng (2) "Gaussian" được công nhận rộng rãi. Nhìn vào kết quả cho thấy rằng các cụm từ như "bình thường không có triệu chứng" có thể mất nhiều thời gian để được thay thế, nếu có bao giờ.
whuber

2
Trong phần mở rộng của @whuber, tôi nghĩ cũng có một sự khác biệt giữa các lĩnh vực: "Gaussian" dường như chiếm ưu thế hơn trong khoa học, trong khi "Bình thường" dường như là thuật ngữ bình thường trong khoa học xã hội ...
abaumann

1
Hãy thử "bất thường": P
Mehrdad

Câu trả lời:


47

Mặc dù tôi có xu hướng nói 'bình thường' thường xuyên hơn (vì đó là điều tôi được dạy khi mới học), tôi nghĩ "Gaussian" là lựa chọn tốt hơn, miễn là học sinh / người đọc khá quen thuộc với cả hai thuật ngữ:

  • Bình thường không đặc biệt điển hình, vì vậy tên của nó là sai lệch. Nó chắc chắn đóng một vai trò quan trọng (không phải vì CLT), nhưng dữ liệu được quan sát thường ít đặc biệt gần Gaussian hơn đôi khi được đề xuất.

  • Từ (và các từ liên quan như "bình thường hóa") có một số nghĩa có thể liên quan đến thống kê (ví dụ: "cơ sở trực giao" chẳng hạn). Nếu ai đó nói "Tôi đã bình thường hóa mẫu của mình", tôi không thể chắc chắn liệu họ có biến đổi thành quy tắc hay không, tính điểm z, chia tỷ lệ vectơ thành đơn vị chiều dài, theo chiều dài hoặc một số khả năng khác. Nếu chúng ta có xu hướng gọi phân phối là "Gaussian" thì ít nhất tùy chọn đầu tiên bị loại bỏ và một cái gì đó mang tính mô tả hơn sẽ thay thế nó.n

  • Gauss ít nhất có một mức độ hợp lý của yêu cầu phân phối.


3
+1 cho bit "miễn là học sinh / người đọc khá quen thuộc với cả hai thuật ngữ". Tôi nghĩ rằng việc học sinh chỉ dạy "Gaussian" là một sự bất lợi, chỉ vì "bình thường" quá phổ biến.
Patrick Coulombe

6
Tôi đồng ý rằng chúng tôi phải dạy cả hai. Nếu chúng ta bắt đầu từ đầu và biết những gì chúng ta biết bây giờ, chúng ta sẽ không bao giờ cho phép "bình thường" xuất hiện, bởi vì (1) thuật ngữ bị quá tải theo bất kỳ cách nào (2) bình thường (Gaussian) không bình thường (thông thường hoặc dự kiến) Dữ liệu. "Gaussian" là sự thay thế phổ biến nhất, mặc dù có một lịch sử trước Gauss. ET Jaynes đề xuất "trung tâm", đó là một ý tưởng khôi hài, nhưng nó đã không được thực hiện. (Tôi nhận ra các đối số dựa trên định lý giới hạn trung tâm.)
Nick Cox

Liên quan đến viên đạn số 2, khi nói đến khoa học và toán học rộng lớn hơn, không nhất thiết phải rõ liệu " bình thường " hay " Gauss " là phổ biến hơn. ;-)
hồng y

@cardinal - Tôi hoàn toàn đồng ý với đề xuất rằng nó có xu hướng nghiêng nhiều hơn về "Gaussian" trong các lĩnh vực đó - và tôi cũng sẽ thêm kỹ thuật.
Glen_b

1
@Glen_b: Đồng ý. (Trong mô hình tinh thần của tôi, tôi bao gồm kỹ thuật dưới cái ô chung của khoa học, mặc dù, có lẽ, phần nào nằm ngoài, ahem, định mức.) :-)
hồng y

36

Tôi sẽ sử dụng Gaussian.

Một vấn đề mà mọi người phải đối mặt khi học thống kê là chúng ta sử dụng các từ tiếng Anh hàng ngày để chỉ những thứ khác nhau (sức mạnh, ý nghĩa, phân phối, v.v.). Trong phạm vi mà chúng ta có thể giảm thiểu điều này, chúng ta nên. "Bình thường" đã có một loạt các ý nghĩa.


2
Peter: Tôi đồng ý. Đó là lý do tại sao tôi luôn sử dụng "Gaussian". Nhưng một nhận xét từ một nhà phê bình về phiên bản mới (súc tích), đã đẩy mạnh "bình thường".
Harvey Motulsky

25

Một đối số có lợi cho bình thường là ký hiệu định cho phân phối, trong đó là viết tắt của "bình thường". Tôi chưa thấy ai đề xuất thay đổi điều này thành .N(μ,σ2)NG(μ,σ2)


1
G có lẽ cũng sẽ xung đột với Gamma, nên được ký hiệu là nhưng thật không may, đó là do chức năng cùng tên. Một thay thế có thể là hoặc , mà cũng sẽ phù hợp với và abbrevation thường xuyên của để . Nhưng tôi thực sự thích ký hiệu , bởi vì tôi viết nó liên tục và đó là một bức thư dễ viết nguệch ngoạc. ΓGaussGaussianBernoullibinomialbinomN
Shadowtalker

Đó là một điểm công bằng, mặc dù nếu cả hai thuật ngữ được trình bày, thì việc sử dụng có thể được giới thiệu sau đó. N
Glen_b

8
Đặt ;-)GN(μ,σ2)
Stéphane Laurent

1
@ StéphaneLaurent: Tôi đoán quan điểm của tôi là nếu bạn tránh từ "bình thường", sinh viên có thể khó nhớ được nghĩa là gì, vì nó sẽ không còn là ghi nhớ nữa. N(μ,σ2)
Nate Eldredge

10

Trong tiếng Đức, nó thường được gọi là Gaußsche Normalverteilung nên gần như không thể xung đột dễ dàng.

Nó sẽ thích hợp để bạn kết hợp gaussianbình thường ?


8
Có lẽ gnormalsẽ làm việc bằng tiếng Anh!
Dilip Sarwate

2
@DilipSarwate Tôi là một người bình thường, bất lịch sự (xin lỗi những kẻ gây rối. Flanders và Swann)
hobbs

9

Theo bách khoa toàn thư Wolfram :

Trong khi các nhà thống kê và nhà toán học sử dụng thống nhất thuật ngữ "phân phối bình thường" cho phân phối này, đôi khi các nhà vật lý gọi đó là phân phối Gaussian và, vì hình dạng cong của nó, các nhà khoa học xã hội gọi nó là "đường cong hình chuông".

Tôi đồng ý rằng "bình thường" dễ nhầm lẫn hơn - nhưng tôi nghi ngờ sách thống kê thường sử dụng "bình thường".


+1 cho câu trả lời mang tính mô tả thay vì kê đơn. Tôi thực sự đồng ý với các câu trả lời khác rằng Gaussian thích hợp hơn, bất kể là lĩnh vực nào, nhưng đó là thông tin để bắt đầu từ bối cảnh của những gì phổ biến trong sử dụng hiện có.
R ..

Đối với cụm từ "đường cong hình chuông", tôi sẽ tránh nó hoàn toàn trong bất kỳ môi trường giảng dạy nào. Nó có những âm mưu phân biệt chủng tộc rất cao do kết quả của cuốn sách khét tiếng cùng tên, và bất kỳ học sinh nào của bạn biết về nó đều có khả năng bị phân tâm bởi nó và liên kết bất cứ điều gì bạn nói với những lý thuyết vô nghĩa về ưu thế chủng tộc hơn là có chủ đề tự đứng
R ..

@R .. Mô tả, có, nhưng mô tả đó bị mâu thuẫn trực tiếp bởi các câu trả lời ở đây, điều này cho thấy rằng một phần đáng kể các nhà thống kê và nhà toán học thực sự sử dụng thuật ngữ "Gaussian".
David Richerby

Một lý do khác cho việc không sử dụng thuật ngữ "đường cong chuông" để biểu thị (hàm mật độ của) phân phối Gaussian / bình thường là có nhiều phân phối có hàm mật độ xác suất (pdf) giống với đường cong chuông. Ngay cả bản pdf của bản phân phối Cauchy trông giống như một đường cong hình chuông!
Mico

+1 để giải thích các thuật ngữ tương đối trong các ngành khác nhau. Cảm ơn!
Nhiệt tình

7

Tôi muốn chỉ ra rằng S. Stigler sử dụng phân phối Bình thường / Gauss / Laplace-Gauss để chứng minh 'Định luật về biệt danh của Stigler' được xuất bản trong Số liệu thống kê trên Bảng (một số trang có sẵn trên sách.google ).

Đặc biệt thú vị và có liên quan đến câu hỏi này là trên trang 288-288, có các bảng về cách sử dụng lịch sử của 'Bình thường' so với 'Gauss' so với 'Laplace' và dường như qua nhiều năm, việc sử dụng đã thay đổi từ 2:15 bình thường trong 1816-1884 đến 8:14 (1888-1917) đến 5:17 (1919-1939) đến 9:10 (1947-1976).

Vì vậy, theo điều này, việc sử dụng 'bình thường' so với 'Gauss' ngày càng bình đẳng hơn. Hoặc nếu bạn tin rằng xu hướng sẽ tiếp tục thì 'Gauss' sẽ đánh bại 'bình thường' sau 50 - 100 năm.


5

Một câu trả lời tôi chưa thấy trong số tất cả các câu trả lời hay:

Tôi chủ yếu sử dụng "bình thường" vì lý do quen thuộc trước đây, nhưng tôi thích viết hoa nó để nhấn mạnh ý nghĩa kỹ thuật của nó: "... nếu dữ liệu được phân phối bình thường ..." (Tôi không biết liệu tôi có sao chép thực tiễn này từ ở một nơi khác hoặc (tái-) tự phát minh ra nó)


5

Việc sử dụng nào phụ thuộc vào mức độ thống kê được dạy. Thật không may, kinh nghiệm giảng dạy của tôi chỉ ra rằng phần lớn các sinh viên đại học không bao giờ hoàn toàn nắm bắt được khái niệm phân phối xác suất. Tuy nhiên, tất cả họ phải bằng cách nào đó nắm bắt được CLT và cách suy nghĩ về sự không chắc chắn. Đối với một lớp đại học, Bình thường là thích hợp hơn vì nó không thêm sự lo lắng của một từ mới lạ. Đối với sinh viên tốt nghiệp, Gaussian được ưa thích vì tất cả những nhầm lẫn đã đề cập ở trên về bình thường hóa và bối cảnh lịch sử mà nó cung cấp. Tôi dạy một lớp nghiên cứu đại học đòi hỏi hai lớp thống kê tiên quyết và tất cả các cuốn sách đại học mà tôi đã thấy được sử dụng trong 30 năm qua đã sử dụng Bình thường.


1
"Phần lớn sinh viên đại học không bao giờ hoàn toàn nắm bắt được khái niệm phân phối xác suất" +1
Code-Guru

4

Tên normalđến từ một số quan sát rằng lỗi hoạt động bình thường. Bạn sẽ tìm thấy thêm chi tiết ở đây . Nếu đó là lý do để gọi phân phối này là phân phối bình thường, nó có thể tạo ra sự nhầm lẫn mới vì phân phối bình thường cho số vụ tai nạn là poisson. Tôi tin rằng chúng ta nên tiến về phía trước và bắt đầu gọi nó là một Gaussianthay thế.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.