Tại sao mọi người sử dụng giá trị p thay vì xác suất tính toán của mô hình được cung cấp dữ liệu?


43

Nói một cách đơn giản một giá trị p đưa ra xác suất về kết quả quan sát được của một thí nghiệm được đưa ra giả thuyết (mô hình). Có xác suất này (giá trị p), chúng tôi muốn đánh giá giả thuyết của chúng tôi (khả năng của nó). Nhưng sẽ không tự nhiên hơn khi tính xác suất của giả thuyết đưa ra kết quả quan sát được?

Trong chi tiết. Chúng tôi có một đồng tiền. Chúng tôi lật nó 20 lần và chúng tôi nhận được 14 cái đầu (14 trên 20 là cái mà tôi gọi là "kết quả của thí nghiệm"). Bây giờ, giả thuyết của chúng tôi là đồng tiền là công bằng (xác suất của đầu và đuôi bằng nhau). Bây giờ chúng tôi tính toán giá trị p, bằng với xác suất để có được 14 đầu trở lên trong 20 lần tung đồng xu. OK, bây giờ chúng tôi có xác suất này (0,058) và chúng tôi muốn sử dụng xác suất này để đánh giá mô hình của chúng tôi (làm thế nào có khả năng chúng tôi có một đồng tiền công bằng).

Nhưng nếu chúng ta muốn ước tính xác suất của mô hình, tại sao chúng ta không tính xác suất của mô hình được đưa ra thử nghiệm? Tại sao chúng ta tính xác suất của thí nghiệm đưa ra mô hình (giá trị p)?


Bạn vẫn sẽ phải lập mô hình thử nghiệm của mình bằng cách nào đó để có thể tính toán hàm khả năng.
Raskolnikov

11
Pete Dixon đã viết một bài báo vào năm 1998 có tên "Tại sao các nhà khoa học đánh giá cao giá trị p" ( psychonom.org/backissues/1631/R382.pdf ) có thể là một thông tin đọc. Theo dõi tốt sẽ là bài báo năm 2004 của Glover & Dixon về tỷ lệ khả năng là một số liệu thay thế ( pbr.psychusiness-journals.org/content/11/5/791.full.pdf ).
Mike Lawrence

2
Mike, có vẻ nghi ngờ như một câu trả lời tốt cho tôi. Nó đang làm gì trong các bình luận?
Matt Parker

John D Cook đã đăng một câu trả lời tuyệt vời cho một câu hỏi của tôi, mà tôi nghĩ bạn sẽ thấy thú vị: stats.stackexchange.com/questions/1164/iêu
doug

Mọi người không sử dụng giá trị p, các nhà thống kê làm. (Không thể cưỡng lại một câu nói hay, điều đó cũng đúng. Tất nhiên, một khi bạn bắt đầu đủ điều kiện cho mỗi danh từ, nó sẽ mất đi tính chính đáng của nó.)
Wayne

Câu trả lời:


31

Tính toán xác suất giả thuyết là đúng không phù hợp với định nghĩa thường xuyên của xác suất (tần số chạy dài), được áp dụng để tránh tính chủ quan được cho là của định nghĩa Bayes về xác suất. Sự thật của một giả thuyết cụ thể không phải là một biến ngẫu nhiên, nó là đúng hoặc không phải và không có tần suất chạy dài. Thật sự tự nhiên hơn khi quan tâm đến xác suất của sự thật của giả thuyết, đó là IMHO tại sao giá trị p thường bị hiểu sai là xác suất mà giả thuyết null là đúng. Một phần của khó khăn là từ quy tắc Bayes, chúng ta biết rằng để tính xác suất hậu nghiệm rằng một giả thuyết là đúng, bạn cần bắt đầu với một xác suất trước rằng giả thuyết đó là đúng.

Một người Bayes sẽ tính toán xác suất giả thuyết đó là đúng, dựa trên dữ liệu (và niềm tin trước đó của anh ấy / cô ấy).

Về cơ bản trong việc quyết định giữa cách tiếp cận thường xuyên và Bayes là một lựa chọn liệu tính chủ quan được cho là của phương pháp Bayes có đáng ghê tởm hơn thực tế là cách tiếp cận thường xuyên không đưa ra câu trả lời trực tiếp cho câu hỏi bạn thực sự muốn hỏi - nhưng vẫn còn chỗ cho cả hai.

Trong trường hợp hỏi liệu một đồng xu có công bằng hay không, tức là xác suất của một cái đầu bằng với xác suất của một cái đuôi, chúng ta cũng có một ví dụ về một giả thuyết mà chúng ta biết trong thế giới thực gần như chắc chắn là sai ngay từ đầu. Hai mặt của đồng xu là không đối xứng, vì vậy chúng ta nên mong đợi một sự bất cân xứng nhỏ trong xác suất của đầu và đuôi, vì vậy nếu đồng xu "vượt qua" thử nghiệm, điều đó chỉ có nghĩa là chúng ta không có đủ các quan sát để có thể kết luận những gì chúng ta đã biết là đúng - rằng đồng tiền rất thiên vị!


4
Trên thực tế, hầu hết các đồng tiền thực sự rất gần với công bằng và thật khó để đưa ra một cách hợp lý về mặt vật lý để thiên vị chúng rất nhiều - xem ví dụ: stat.columbia.edu/~gelman/research/published/diceRev2.pdf
Ben Bolker

8
Rất gần với công bằng không giống như chính xác công bằng, đó là giả thuyết không có giá trị. Tôi đã chỉ ra một trong những đặc điểm riêng của thử nghiệm giả thuyết, cụ thể là chúng ta thường biết rằng giả thuyết null là sai, nhưng dù sao cũng nên sử dụng nó. Một thử nghiệm thực tế hơn sẽ nhằm mục đích phát hiện xem có bằng chứng nào cho thấy đồng xu bị sai lệch đáng kể hay không, thay vì bằng chứng quan trọng cho thấy đồng xu bị sai lệch.
Dikran Marsupial

1
Xin chào, có thể tôi nhầm nhưng tôi nghĩ trong khoa học, bạn không bao giờ có thể nói rằng giả thuyết thay thế là đúng, bạn chỉ có thể nói rằng giả thuyết khống bị bác bỏ và bạn chấp nhận giả thuyết thay thế. Đối với tôi, giá trị p phản ánh cơ hội bạn sẽ mắc lỗi loại 1, tức là bạn sẽ từ chối giả thuyết thay thế và chấp nhận giả thuyết null (giả sử p = 0,05 hoặc 5% thời gian. Điều quan trọng là phải phân biệt giữa loại 1 lỗi và lỗi loại 2 và vai trò của sức mạnh trong việc mô hình hóa các sự kiện của bạn.
user2238

3
Đối với các bài kiểm tra thường xuyên, tôi sẽ sử dụng một tuyên bố thậm chí còn yếu hơn, đó là bạn "từ chối giả thuyết khống" hoặc bạn "không từ chối giả thuyết khống" và không chấp nhận bất cứ điều gì. Điểm mấu chốt là (như trong trường hợp của đồng xu thiên vị) đôi khi bạn biết a-prori rằng giả thuyết khống là không đúng, bạn chỉ không có đủ dữ liệu để chứng minh rằng điều đó không đúng; trong trường hợp đó sẽ là kỳ quặc khi "chấp nhận" nó. Các xét nghiệm thường xuyên có tỷ lệ lỗi loại I và loại II, nhưng điều đó không có nghĩa là họ có thể nói về xác suất của một giả thuyết cụ thể là đúng, như trong OP.
Dikran Marsupial

2
@ user2238 Các giá trị p là cơ hội của một lỗi loại I chỉ khi giả thuyết là "đơn giản" (không phải composite) và nó sẽ xảy ra là sự thật. Ví dụ: trong thử nghiệm một phía về việc liệu đồng xu có bị lệch về phía đuôi hay không ( ), sử dụng đồng xu hai đầu đảm bảo khả năng xảy ra lỗi loại I là 0 mặc dù giá trị p từ bất kỳ mẫu hữu hạn sẽ là khác không. H0:p<0.5
whuber

18

Không có gì giống như trả lời một câu hỏi thực sự cũ, nhưng ở đây đi ....

giá trị p là các thử nghiệm giả thuyết gần như hợp lệ. Đây là một đoạn trích được điều chỉnh một chút được lấy từ cuốn sách lý thuyết xác suất năm 2003 của Jaynes (Thí nghiệm lặp lại: xác suất và tần suất). Giả sử chúng ta có một giả thuyết null mà chúng ta muốn kiểm tra. Chúng tôi có dữ liệu và thông tin trước . Giả sử rằng có một số giả thuyết không xác định mà chúng tôi sẽ kiểm tra . Tỷ lệ cược sau cho so với sau đó được đưa ra bởi: D I H A H 0 H A H 0H0DIHAH0HAH0

P(HA|DI)P(H0|DI)=P(HA|I)P(H0|I)×P(D|HAI)P(D|H0I)

Bây giờ thuật ngữ đầu tiên ở phía bên phải là độc lập với dữ liệu, vì vậy dữ liệu chỉ có thể ảnh hưởng đến kết quả thông qua thuật ngữ thứ hai. Bây giờ, chúng ta luôn có thể phát minh ra một giả thuyết thay thế sao cho - một giả thuyết "phù hợp hoàn hảo". Do đó, chúng ta có thể sử dụng như một thước đo mức độ dữ liệu có thể hỗ trợ bất kỳ giả thuyết thay thế nào đối với null. Không có giả thuyết thay thế nào cho thấy dữ liệu có thể hỗ trợ trên lớn hơn . Chúng ta cũng có thể hạn chế lớp thay thế và thay đổi là được thay thế bằng khả năng tối đa hóa (bao gồm cả hằng số chuẩn hóa) trong lớp đó. NếuHAP(D|HAI)=11P(D|H0I)H01P(D|H0I)1P(D|H0I)bắt đầu trở nên quá nhỏ, sau đó chúng tôi bắt đầu nghi ngờ về giá trị null, vì số lượng lựa chọn thay thế giữa và tăng lên (bao gồm một số có xác suất trước không đáng kể). Nhưng điều này rất gần với những gì được thực hiện với giá trị p, nhưng với một ngoại lệ: chúng tôi không tính xác suất cho cho một số thống kê và một số khu vực "xấu" của thống kê. Chúng tôi tính toán xác suất cho - thông tin chúng tôi thực sự có, thay vì một số tập hợp con của nó, .H0HAt(D)>t0t(D)Dt(D)

Một lý do khác khiến mọi người sử dụng giá trị p là họ thường đạt được một thử nghiệm giả thuyết "phù hợp", nhưng có thể dễ tính toán hơn. Chúng ta có thể chỉ ra điều này với ví dụ rất đơn giản về kiểm tra giá trị trung bình bình thường với phương sai đã biết. Chúng tôi có dữ liệu với mô hình giả định (một phần thông tin trước ). Chúng tôi muốn kiểm tra . Sau đó, chúng tôi có, sau một chút tính toán:D{x1,,xN}xiNormal(μ,σ2)IH0:μ=μ0

P(D|H0I)=(2πσ2)N2exp(N[s2+(x¯μ0)2]2σ2)

Trong đó và . Điều này cho thấy giá trị tối đa của sẽ đạt được khi . Giá trị tối đa là:x¯=1Ni=1Nxis2=1Ni=1N(xix¯)2P(D|H0I)μ0=x¯

P(D|HAI)=(2πσ2)N2exp(Ns22σ2)

Vì vậy, chúng tôi lấy tỷ lệ của hai, và chúng tôi nhận được:

P(D|HAI)P(D|H0I)=(2πσ2)N2exp(Ns22σ2)(2πσ2)N2exp(Ns2+N(x¯μ0)22σ2)=exp(z22)

Trong đó là "thống kê Z". Giá trị lớn củađặt ra nghi ngờ về giả thuyết khống, liên quan đến giả thuyết về giá trị trung bình bình thường được hỗ trợ mạnh mẽ nhất bởi dữ liệu. Chúng ta cũng có thể thấy rằng là phần duy nhất của dữ liệu cần thiết và do đó là một thống kê đầy đủ cho thử nghiệm.z=Nx¯μ0σ|z|x¯

Cách tiếp cận giá trị p cho vấn đề này gần như giống nhau, nhưng ngược lại. Chúng tôi bắt đầu với thống kê đầy đủ và chúng tôi nhân đôi phân phối lấy mẫu của nó, dễ dàng được hiển thị là - trong đó tôi đã sử dụng chữ in hoa để phân biệt biến ngẫu nhiên với giá trị quan sát . Bây giờ chúng ta cần tìm một khu vực đặt ra nghi ngờ về giả thuyết null: đây có thể dễ dàng được xem là những khu vực cólà lớn Vì vậy, chúng tôi có thể tính xác suất đểx¯X¯Normal(μ,σ2N)X¯x¯|X¯μ0||X¯μ0||x¯μ0|như một thước đo khoảng cách dữ liệu quan sát được từ giả thuyết null. Như trước đây, đây là một phép tính đơn giản và chúng tôi nhận được:

p-value=P(|X¯μ0||x¯μ0||H0)
=1P[N|x¯μ0|σNX¯μ0σN|x¯μ0|σ|H0]
=1P(|z|Z|z||H0)=2[1Φ(|z|)]

Bây giờ, chúng ta có thể thấy rằng giá trị p là hàm giảm đơn điệu của, có nghĩa là về cơ bản chúng tôi nhận được câu trả lời giống như bài kiểm tra giả thuyết "đúng". Từ chối khi giá trị p nằm dưới một ngưỡng nhất định cũng giống như từ chối khi tỷ lệ cược sau vượt quá ngưỡng nhất định. Tuy nhiên, lưu ý rằng khi thực hiện bài kiểm tra phù hợp, chúng tôi phải xác định lớp thay thế và chúng tôi phải tối đa hóa xác suất đối với lớp đó. Đối với giá trị p, chúng ta phải tìm một thống kê và tính toán phân phối lấy mẫu của nó và đánh giá giá trị này ở giá trị quan sát được. Trong một số ý nghĩa, việc chọn một thống kê tương đương với việc xác định giả thuyết thay thế mà bạn đang xem xét.|z|

Mặc dù cả hai đều là những điều dễ dàng để làm trong ví dụ này, nhưng chúng không phải lúc nào cũng dễ dàng trong các trường hợp phức tạp hơn. Trong một số trường hợp, có thể dễ dàng hơn để chọn thống kê phù hợp để sử dụng và tính toán phân phối lấy mẫu của nó. Trong những trường hợp khác, có thể dễ dàng hơn để xác định lớp thay thế và tối đa hóa lớp đó.

Ví dụ đơn giản này chiếm một lượng lớn thử nghiệm dựa trên giá trị p, đơn giản là vì rất nhiều thử nghiệm giả thuyết thuộc loại "gần đúng bình thường". Nó cũng cung cấp một câu trả lời gần đúng cho vấn đề tiền xu của bạn (bằng cách sử dụng xấp xỉ bình thường cho nhị thức). Nó cũng cho thấy giá trị p trong trường hợp này sẽ không khiến bạn lạc lối, ít nhất là về mặt kiểm tra một giả thuyết. Trong trường hợp này, chúng ta có thể nói rằng giá trị p là thước đo bằng chứng chống lại giả thuyết khống.

Tuy nhiên, giá trị p có thang đo ít dễ hiểu hơn yếu tố vịnh - liên kết giữa giá trị p và "số lượng" bằng chứng chống lại null là phức tạp. giá trị p trở nên quá nhỏ quá nhanh - điều này khiến chúng khó sử dụng đúng cách. Họ có xu hướng phóng đại sự hỗ trợ chống lại null được cung cấp bởi dữ liệu. Nếu chúng tôi giải thích giá trị p là xác suất so với null - ở dạng tỷ lệ cược là , khi bằng chứng thực tế là và ở dạng tỷ lệ cược là khi bằng chứng thực tế là . Hoặc nói cách khác, sử dụng giá trị p làm xác suất null là sai ở đây, tương đương với việc đặt tỷ lệ cược trước. Vậy đối với giá trị p là0.193.870.05196.830.1tỷ lệ cược trước ngụ ý so với null là và với giá trị p tỷ lệ cược trước ngụ ý so với null là .2.330.052.78


4
+1. "... Chọn một thống kê tương đương với việc xác định giả thuyết thay thế mà bạn đang xem xét" đánh vào tôi như một cái nhìn sâu sắc.
whuber

Câu trả lời tốt. Điều đáng chú ý (mặc dù rõ ràng) rằng làm việc với một nhóm các lựa chọn thay thế lớn hơn đối với một số nhỏ thường có thể bị cấm tính toán, hãy để một mình nếu phải làm việc với số lượng thay thế vô hạn hoặc không thể đếm được, cũng có thể xảy ra trong thực tế. Một điểm cộng lớn của cách tiếp cận giá trị p là nó thường (thường là?) Tính toán đơn giản / dễ điều khiển. kkk
Faheem Mitha

1
@ faheemmitha- bạn nói đúng về vụ nổ tổ hợp, tuy nhiên điều này không xảy ra đối với phương pháp tôi mô tả (thực tế bạn có thể chỉ ra rằng phương pháp bay đang xác định hiệu quả phần dư). Điều này là do chúng ta chỉ cần xác định lớp sau đó tối đa hóa. Chúng ta không cần phải đánh giá từng phương án, chỉ cần tìm ra phương án tốt nhất.
xác suất

Tại sao câu trả lời này là Wiki cộng đồng?
amip nói rằng Phục hồi lại

10

Là một cựu học giả đã chuyển sang thực hành, tôi sẽ chụp. Mọi người sử dụng giá trị p vì chúng hữu ích. Bạn không thể nhìn thấy nó trong các ví dụ trong sách giáo khoa về việc lật đồng xu. Chắc chắn rằng chúng không thực sự vững chắc về nền tảng, nhưng có lẽ điều đó không cần thiết như chúng ta muốn nghĩ khi chúng ta suy nghĩ về mặt học thuật. Trong thế giới dữ liệu, chúng ta bị bao quanh bởi vô số những điều có thể theo nghĩa đen để xem xét tiếp theo. Với các tính toán giá trị p, tất cả những gì bạn cần là một ý tưởng về những gì không thú vị và một heuristic số cho loại dữ liệu nào có thể thú vị (tốt, cộng với một mô hình xác suất cho việc không quan tâm). Sau đó, cá nhân hoặc tập thể chúng ta có thể quét mọi thứ khá đơn giản, từ chối phần lớn những điều không thú vị. Giá trị p cho phép chúng ta nói "Nếu tôi không đặt ưu tiên nhiều cho việc suy nghĩ về điều này nếu không,


10

Câu hỏi của bạn là một ví dụ tuyệt vời về lý luận thường xuyên và thực sự khá tự nhiên. Tôi đã sử dụng ví dụ này trong các lớp học của mình để chứng minh bản chất của các bài kiểm tra giả thuyết. Tôi yêu cầu một tình nguyện viên dự đoán kết quả của việc lật đồng xu. Bất kể kết quả là gì, tôi ghi lại một phỏng đoán "chính xác". Chúng tôi làm điều này nhiều lần cho đến khi lớp học trở nên đáng ngờ.

Bây giờ, họ có một mô hình null trong đầu. Họ cho rằng đồng tiền là công bằng. Cho rằng giả định đúng 50% khi mọi thứ đều công bằng, mỗi lần đoán đúng liên tiếp làm dấy lên nghi ngờ rằng mô hình tiền xu công bằng là không chính xác. Một vài dự đoán đúng và họ chấp nhận vai trò của cơ hội. Sau 5 hoặc 10 lần đoán đúng, lớp luôn bắt đầu nghi ngờ rằng cơ hội của một đồng tiền công bằng là thấp. Do đó, với bản chất của kiểm tra giả thuyết theo mô hình thường xuyên.

Đó là một đại diện rõ ràng và trực quan của người thường xuyên thực hiện kiểm tra giả thuyết. Đó là xác suất của dữ liệu quan sát được cho rằng null là đúng. Nó thực sự khá tự nhiên như được chứng minh bằng thí nghiệm dễ dàng này. Chúng tôi chấp nhận rằng mô hình là 50-50 nhưng như bằng chứng gắn kết, tôi từ chối mô hình đó và nghi ngờ rằng có một cái gì đó khác đang chơi.

Vì vậy, nếu xác suất của những gì tôi quan sát là thấp với mô hình mà tôi giả định (giá trị p) thì tôi có thể tự tin từ chối mô hình giả định của mình. Do đó, giá trị p là thước đo hữu ích của bằng chứng chống lại mô hình giả định của tôi có tính đến vai trò của cơ hội.

Một từ chối trách nhiệm: Tôi đã lấy bài tập này từ một bài báo bị lãng quên từ lâu, trong đó tôi nhớ lại, là một trong những tạp chí ASA.


Brett, đây là thú vị và một ví dụ tuyệt vời. Mô hình ở đây đối với tôi dường như là mọi người mong đợi thứ tự của đầu và đuôi xảy ra theo kiểu ngẫu nhiên. Ví dụ, nếu tôi thấy 5 đầu liên tiếp, tôi suy luận rằng đây là một ví dụ về quy trình không ngẫu nhiên. Trên thực tế, và tôi có thể sai ở đây, xác suất của một cosin (giả sử ngẫu nhiên) là 50% đầu và 50% đuôi, và điều này hoàn toàn độc lập với kết quả trước đó. Vấn đề là nếu chúng ta ném một đồng xu 50000 lần và 25000 đầu tiên là đầu, với điều kiện 25000 còn lại là đuôi, điều này vẫn phản ánh sự thiếu thiên vị
dùng2238

@ user2238: Tuyên bố cuối cùng của bạn là đúng, nhưng nó sẽ cực kỳ hiếm. Trong thực tế, nhìn thấy một loạt 5 đầu trong 5 lần tung sẽ xảy ra chỉ 3% thời gian nếu đồng tiền công bằng. Luôn luôn có thể là null là đúng và chúng tôi đã chứng kiến ​​một sự kiện hiếm gặp.
Brett

6

"Giá trị p nói một cách thô thiển đưa ra xác suất về kết quả quan sát được của một thí nghiệm đưa ra giả thuyết (mô hình)."

Nhưng nó không. Thậm chí không đại khái - điều này làm mờ đi một sự khác biệt thiết yếu.

Mô hình không được chỉ định, như Raskolnikov chỉ ra, nhưng giả sử bạn có nghĩa là mô hình nhị thức (tung đồng xu độc lập, cố định xu hướng không xác định). Giả thuyết là tuyên bố rằng tham số có liên quan trong mô hình này, độ lệch hoặc xác suất của các đầu là 0,5.

"Có xác suất này (giá trị p), chúng tôi muốn đánh giá giả thuyết của chúng tôi (khả năng của nó)"

Chúng tôi thực sự có thể muốn đưa ra phán quyết này nhưng giá trị p sẽ không (và không được thiết kế để) giúp chúng tôi làm như vậy.

"Nhưng sẽ không tự nhiên hơn khi tính xác suất của giả thuyết đưa ra kết quả quan sát được?"

Có lẽ nó sẽ. Xem tất cả các cuộc thảo luận về Bayes ở trên.

"[...] Bây giờ chúng tôi tính giá trị p, bằng với xác suất để có được 14 đầu trở lên trong 20 lần tung đồng xu. OK, bây giờ chúng tôi có xác suất này (0,058) và chúng tôi muốn sử dụng xác suất này để đánh giá mô hình của chúng tôi (làm thế nào có khả năng chúng ta có một đồng tiền công bằng). "

'Giả thuyết của chúng tôi, giả sử mô hình của chúng tôi là đúng', nhưng về cơ bản: có. Giá trị p lớn cho thấy hành vi của đồng tiền phù hợp với giả thuyết rằng nó công bằng. (Chúng cũng thường phù hợp với giả thuyết là sai nhưng gần đúng với sự thật, chúng tôi không có đủ dữ liệu để nói; xem 'sức mạnh thống kê'.)

"Nhưng nếu chúng ta muốn ước tính xác suất của mô hình, tại sao chúng ta không tính xác suất của mô hình đưa ra thử nghiệm? Tại sao chúng ta tính xác suất của thử nghiệm được đưa ra cho mô hình (giá trị p)?"

Chúng tôi thực sự không tính xác suất của các kết quả thử nghiệm được đưa ra giả thuyết trong thiết lập này. Rốt cuộc, xác suất chỉ khoảng 0,176 khi nhìn thấy chính xác 10 cái đầu khi giả thuyết là đúng và đó là giá trị có thể xảy ra nhất . Đây không phải là một số tiền lãi.

Nó cũng có liên quan mà chúng ta thường không ước tính xác suất của mô hình. Cả hai câu trả lời thường xuyên và Bayes thường cho rằng mô hình là đúng và đưa ra suy luận của họ về các tham số của nó. Trên thực tế, không phải tất cả Bayesians sẽ ngay cả trong nguyên tắc quan tâm đến xác suất của các mô hình, đó là: xác suất mà toàn bộ tình hình được mô hình hóa cũng bởi một phân phối nhị thức. Họ có thể thực hiện nhiều kiểm tra mô hình, nhưng thực sự không bao giờ hỏi khả năng nhị thức nằm trong không gian của các mô hình có thể khác. Người Bayes quan tâm đến yếu tố Bayes được quan tâm, những người khác không quá nhiều.


2
Hmm, hai phiếu giảm. Nếu câu trả lời là quá tệ, nó sẽ tốt đẹp có một số bình luận.
liên hợp chiến binh

Tôi thích câu trả lời này. Đôi khi mọi người bỏ phiếu trả lời vì nó không giống với sách giáo khoa và cố gắng loại bỏ tất cả các trang web thảo luận có chứa một ý nghĩa thông thường hoặc giáo dân như mô tả.
Vass

Tôi đã không downvote nhưng tôi nghĩ một vấn đề là quan điểm của bạn không rõ ràng.
Elvis


3

Tôi sẽ chỉ thêm một vài nhận xét; Tôi đồng ý với bạn rằng việc lạm dụng giá trị là có hại.p

  • Một số người trong các số liệu thống kê được áp dụng giải thích sai giá trị , đáng chú ý là hiểu chúng là xác suất mà các giả thuyết null là đúng; cf các giấy tờ này: Giá trị P không phải là Xác suất LỗiTại sao chúng ta không thực sự biết "Ý nghĩa thống kê" có nghĩa là gì: Một thất bại giáo dục lớn .p

  • Một quan niệm sai lầm phổ biến khác là giá trị phản ánh kích thước của hiệu ứng được phát hiện hoặc tiềm năng phân loại của chúng, khi chúng phản ánh cả kích thước của mẫu và kích thước của hiệu ứng. Điều này dẫn đến một số người viết bài để giải thích tại sao các biến được hiển thị "liên kết mạnh" với một ký tự (nghĩa là với các giá trị p rất nhỏ) là các phân loại kém, như thế này ...p

  • Để kết luận, ý kiến ​​của tôi là giá trị được sử dụng rộng rãi vì các tiêu chuẩn xuất bản. Trong các khu vực ứng dụng (biostats ...) kích thước của chúng đôi khi là mối quan tâm duy nhất của một số người đánh giá.p


2

Xác định xác suất . Ý tôi là thế Trước khi chúng tôi tiến bộ hơn nữa, chúng tôi cần giải quyết theo các điều khoản.

Một định nghĩa trực quan về xác suất là thước đo của sự không chắc chắn. Chúng tôi không chắc chắn việc tung đồng xu tiếp theo sẽ xuất hiện đầu hay đuôi. Đó là sự không chắc chắn trong các dữ liệu . Chúng tôi cũng không chắc chắn liệu đồng tiền có công bằng hay không. Đó là sự không chắc chắn về mô hình ... hoặc bạn có thể gọi sự không chắc chắn về tình trạng của thế giới.MDM

Để đến phân phối có điều kiện , bạn cần có phân phối chung - tức là kiến ​​thức về toàn bộ dân số tiền đang lưu hành, bao nhiêu trong số chúng được rèn và cách thức đồng tiền giả mạo hoạt động ( có thể phụ thuộc vào cách các đồng xu được quay và bắt trong không khí).P ( M , D )P(M|D)P(M,D)

Trong ví dụ cụ thể về tiền xu, điều này ít nhất có thể về mặt khái niệm - các số liệu của chính phủ có sẵn trên các đồng tiền được cho là công bằng (28 10 9 mỗi năm), hoặc ít nhất là những người có đặc điểm ổn định. Theo như các đồng tiền giả mạo, quy mô sản xuất dưới một triệu có lẽ không đáng nói, vì vậy có thể là một khả năng mà đồng tiền bạn nhận được từ một nhân viên thu ngân là không công bằng. Sau đó, bạn cần đưa ra một mô hình về cách thức hoạt động của đồng tiền không công bằng ... và có được sự phân phối chung, và điều kiện trên dữ liệu.10 6 / 28 10 9106/28109

Trong các vấn đề của thế giới thực tế với các điều kiện y tế nói và cách chúng hoạt động, bạn có thể không thể đưa ra bất kỳ thành phần nào trong phân phối chung này và không thể điều kiện.

P(M,D)p=0.5P(p=0.5)=0B(0.5,0.5)B(1000,1000)0.528109/(28109+106)

Bên cạnh những khó khăn trong việc nói về chính xác các mô hình phù hợp là gì, các phương pháp Bayes có những cách hạn chế để xử lý lỗi chính tả mô hình. Nếu bạn không thích lỗi Gaussian hoặc bạn không tin vào tính độc lập của việc tung đồng xu (bàn tay của bạn sẽ mệt mỏi sau 10.000 lần ném đầu tiên hoặc lâu hơn, vì vậy bạn không ném nó cao tới 1000 lần đầu tiên, whch có thể ảnh hưởng đến xác suất), tất cả những gì bạn có thể làm trong thế giới Bayes là xây dựng một mô hình phức tạp hơn - phá vỡ các linh mục cho các hỗn hợp thông thường, các xác suất theo thời gian, bất cứ điều gì. Nhưng không có lỗi tương tự trực tiếp với lỗi tiêu chuẩn của Huber mà thừa nhận rõ ràng rằng mô hình có thể bị sai, và được chuẩn bị để giải quyết điều đó.

<Ω,F,P>ΩFσPAΩAFXt,t[0,1]{Xt>0,t[0,0.5]}k σ{Xt>0,t{t1,t2,,tk}}kvà trên thực tế tạo ra -đau khớp. Nhưng điều đó là không đủ, rõ ràng.) Vì vậy, xác suất trong các kích thước lớn có thể trở nên khó khăn ngay cả ở cấp độ định nghĩa, chứ đừng nói đến việc tính toán.σ


1

Nhưng nếu chúng ta muốn ước tính xác suất của mô hình, tại sao chúng ta không tính xác suất của mô hình được đưa ra thử nghiệm?

Bởi vì chúng ta không biết làm thế nào. Có vô số mô hình có thể, và không gian xác suất của chúng không được xác định.

Đây là một ví dụ thực tế. Hãy nói rằng tôi muốn dự báo GDP của Mỹ. Tôi có được chuỗi thời gian, và phù hợp với một mô hình. Xác suất mà mô hình này là đúng là gì?

Vì vậy, hãy thực sự phù hợp với mô hình đi bộ ngẫu nhiên vào chuỗi GDP: trong đó là tốc độ tăng trưởng và là một lỗi ngẫu nhiên. Mã của tôi dưới đây thực hiện điều đó và nó cũng tạo ra dự báo (màu đỏ) và so sánh nó với dữ liệu lịch sử (màu xanh). μ e t

Δlnyt=μ+et
μet

nhập mô tả hình ảnh ở đây

Tuy nhiên, ai nói rằng GDP là một quá trình đi bộ ngẫu nhiên? Đó là một quá trình xu hướng là gì? Vì vậy, hãy phù hợp với xu hướng: trong đó là độ dốc của xu hướng thời gian. Dự báo sử dụng mô hình xu hướng được hiển thị trên cùng biểu đồ (màu vàng). c

lnyt=ct+et
c

Bây giờ, làm thế nào bạn sẽ tính xác suất rằng mô hình đi bộ ngẫu nhiên của tôi là đúng? Trong MLE chúng ta có thể tính toán khả năng của trôi dạt cho tập dữ liệu, nhưng đó không phải là xác suất. Thứ hai, và quan trọng hơn, làm thế nào bạn sẽ tính xác suất để mô hình đi bộ ngẫu nhiên với sự trôi dạt này khi biết rằng nó cũng có thể là một mô hình xu hướng? Nó có thể là bất kỳ số lượng mô hình khác sản xuất loại năng động này.μ

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.