Kiểm định giả thuyết Bayes có ý nghĩa gì trong khuôn khổ suy luận và lý thuyết quyết định?


15

Nền tảng của tôi chủ yếu là học máy và tôi đã cố gắng tìm hiểu ý nghĩa của thử nghiệm giả thuyết Bayes. Tôi ổn với cách giải thích bayesian về xác suất và tôi quen với nó trong bối cảnh các mô hình đồ họa xác suất. Tuy nhiên, điều làm tôi bối rối là từ "Giả thuyết" nghĩa là gì trong bối cảnh suy luận thống kê.

Tôi nghĩ rằng tôi chủ yếu bị nhầm lẫn về từ vựng mà tôi đã quen với việc học máy so với những gì thường được sử dụng trong thống kê và suy luận.

Trong bối cảnh học tập có giám sát , tôi thường nghĩ về giả thuyết là hàm dự đoán ánh xạ các ví dụ tới các nhãn của nó, ví dụ . Tuy nhiên, dường như đối với tôi, thuật ngữ giả thuyết, trong các bài đọc mà tôi đang làm không có cùng ý nghĩa. Hãy để tôi dán một đoạn trích các bài đọc tôi đang đọc:h:XY

nhập mô tả hình ảnh ở đây

Nếu bạn đọc kỹ nó cũng nói:

có một mô hình khác nhau cho dữ liệu được quan sát ...

họ đã sử dụng mô hình từ. Đối với tôi mô hình từ làm cho tôi nghĩ về một tập hợp các hàm là chúng tôi chọn một hàm dự đoán cụ thể. tức là một lớp giả thuyết về chức năng. Ví dụ: có thể là lớp giả thuyết của các hàm bậc hai (đa thức bậc 2). Tuy nhiên, dường như đối với tôi, họ sử dụng mô hình từ và giả thuyết là đồng nghĩa trong trích đoạn này (trong đó đối với tôi chúng là những từ hoàn toàn khác nhau).Hd2

Sau đó, chúng ta sẽ đề cập đến việc chúng ta có thể đưa các linh mục vào giả thuyết (một điều hoàn toàn hợp lý để làm trong một khung cảnh bay bổng):

pH(Hm),     m={0,1,...,M1}

ngoài ra chúng ta có thể mô tả dữ liệu bằng một giả thuyết hiện tại:

py|H(|Hm),     m={0,1,...,M1}

và cập nhật niềm tin hiện tại của chúng tôi với một số dữ liệu (và quy tắc của Baye):

pH|y(Hm|y),     m={0,1,...,M1}

Tuy nhiên, tôi đoán rằng tôi quen với việc đưa ước lượng bayes vào một tham số cụ thể (giả sử ) từ một lớp giả thuyết hơn là cho toàn bộ lớp giả thuyết. Về cơ bản vì dường như những "giả thuyết" này không giống với những giả thuyết từ bối cảnh học máy mà tôi đã quen, dường như những giả thuyết này giống với một tham số cụ thể hơn là một lớp giả thuyết.θθθ

Tại thời điểm này, tôi đã bị thuyết phục rằng "giả thuyết" có nghĩa là điều tương tự như trong các chức năng tiên đoán (parametrized bởi một tham số , ví dụ), nhưng tôi nghĩ rằng tôi đã sai ...θ

Để làm cho sự nhầm lẫn của tôi trở nên tồi tệ hơn, sau đó, chính những bài đọc này đã đi trước để xác định một "giả thuyết" cụ thể cho từng ví dụ đào tạo mà họ quan sát được. Hãy để tôi dán một đoạn trích những gì tôi muốn nói:

nhập mô tả hình ảnh ở đây

Lý do khiến điều này làm tôi bối rối là vì, nếu tôi diễn giải giả thuyết là một tham số, thì đối với tôi, việc chỉ định một tham số cụ thể cho từng giá trị mẫu mà chúng ta thấy sẽ vô nghĩa. Tại thời điểm này tôi đã kết luận rằng tôi thực sự không biết ý nghĩa của giả thuyết đó là gì nên tôi đã đăng câu hỏi này.

Tuy nhiên, tôi đã không từ bỏ hoàn toàn, tôi đã nghiên cứu giả thuyết có nghĩa là gì trong thống kê thường xuyên và tìm thấy video khan sau đây của học viện . Video đó thực sự rất có ý nghĩa với tôi (có thể bạn là người thường xuyên! :) . Tuy nhiên, dường như họ nhận được một loạt dữ liệu (như một số "tập hợp mẫu") và dựa trên các thuộc tính của tập mẫu, họ quyết định chấp nhận hay từ chối giả thuyết khống về dữ liệu. Tuy nhiên, trong bối cảnh Bayes mà tôi đang đọc, đối với tôi, đối với mỗi vectơ [điểm] dữ liệu được quan sát, họ "gắn nhãn" với một giả thuyết với "Kiểm tra tỷ lệ khả năng":

nhập mô tả hình ảnh ở đây

Cách họ gán giả thuyết cho từng mẫu dữ liệu, thậm chí có vẻ như một thiết lập học tập có giám sát là chúng tôi đang gắn nhãn cho mỗi tập huấn luyện. Tuy nhiên, tôi không nghĩ đó là những gì họ đang làm trong bối cảnh này. Họ đang làm gì? Việc gán một giả thuyết cho mỗi mẫu dữ liệu có nghĩa là gì? Ý nghĩa của một giả thuyết là gì? Mô hình từ có nghĩa là gì?

Về cơ bản, sau lời giải thích dài về sự nhầm lẫn này của tôi, có ai biết thử nghiệm giả thuyết Bayes có nghĩa gì trong bối cảnh này không?


Nếu bạn cần bất kỳ sự làm rõ hoặc bất cứ điều gì để cải thiện câu hỏi của tôi hoặc để câu hỏi có ý nghĩa, tôi rất vui lòng giúp đỡ :)


Trong quá trình tìm kiếm câu trả lời tôi đã tìm thấy một số điều hữu ích liên quan đến kiểm tra giả thuyết thống kê:

Điều này đề cập đến một giới thiệu tốt về chủ đề nếu bạn đến từ một nền tảng CS (như tôi):

Giới thiệu tốt về kiểm tra giả thuyết thống kê cho các nhà khoa học máy tính là gì?

Tại một số điểm tôi đã hỏi về "tham số mặc định" (mà tôi nên xác định ý tôi là gì. Tôi nghĩ đó là một thuật ngữ tiêu chuẩn nhưng không phải vậy, vì vậy ở đây tôi sẽ giải quyết nó) và tôi nghĩ điều tôi thực sự muốn nói là làm thế nào bạn xác định tham số cho từng giả thuyết mà bạn có. Ví dụ, làm thế nào để bạn quyết định giả thuyết null của bạn là gì và các tham số của nó. Có một câu hỏi liên quan đến điều đó:

Làm thế nào để xác định giả thuyết khống trong thử nghiệm giả thuyết


@ Xi'an Tôi đã đọc bài viết trên wikipedia sau: en.wikipedia.org/wiki/Statistic_model đó có phải ý nghĩa của một mô hình và một giả thuyết không? thnx vì sự kiên nhẫn của bạn btw :)
Pinocchio

3
Tôi ngần ngại lội vào cuộc thảo luận này bởi vì tôi nghĩ vấn đề của bạn thực sự là một trong những hiểu biết về kiểm định giả thuyết có nghĩa là gì về nguyên tắc, chứ không phải cụ thể là kiểm tra giả thuyết trong khuôn khổ Bayes. Để giải quyết vấn đề này, tôi khuyên bạn nên xem cuốn sách "Các chế độ suy luận thống kê tham số" của Geisser. books.google.ca/...
Rocinante

@rocinante Tôi nghĩ tôi đồng ý với bạn. Tôi chắc chắn bối rối về thử nghiệm giả thuyết nói chung (và khuôn khổ Bayes không giúp ích gì cả). Tôi chắc chắn sẽ xem xét điều đó. Cảm ơn sự kiên nhẫn và hiểu biết của bạn, nó đánh giá rất cao.
Pinocchio

Đó không phải là một điều dễ hiểu bởi vì nó không phải là một điều dễ dàng để nói rõ một cách súc tích. Thay vì nghĩ về điều này theo thuật ngữ trừu tượng (như bản đồ), có thể nó sẽ hữu ích nếu bạn nghĩ về nó với một ví dụ đơn giản
hơn.1

1
2/2 Giả sử bạn có một đồng xu và bạn muốn xem nó có công bằng không, vì vậy bạn lật nó 50 lần. Bây giờ bạn có một bộ dữ liệu mà bạn muốn thực hiện một số suy luận (nghĩa là đồng xu có thiên vị hay không). Theo logic, nếu đồng xu công bằng, khoảng một nửa số lần tung phải là đầu. (Lưu ý rằng đây không phải là một dẫn xuất thống kê, mà là lý luận logic của riêng bạn). Đó là giả thuyết của bạn. Bạn có thể kiểm tra giả thuyết này theo 2 cách: cách Bayes và cách thường xuyên.
rocinante

Câu trả lời:


10

Một mô hình thống kê được đưa ra bởi một gia đình phân phối xác suất. Khi mô hình là tham số, gia đình này được lập chỉ mục bởi một tham số chưa biết : F = { f ( | θ ) ; θ q } Nếu ai muốn thử nghiệm một giả thuyết trên θ như H 0 :θ

F={f(|θ); θΘ}
θ , người ta có thể xem xét hai mô hình đối lập: F so với F 0 = { f ( | q ) ; q q 0 } Từquan điểm Bayesian của tôi, tôi vẽ suy luận trên chỉ số của mô hình đằng sau các dữ liệu, M . Do đó, tôi đặt ưu tiên cho chỉ số này, ρ 0 ρ a , cũng như các tham số của cả hai mô hình, π 0 ( θ ) trên Θ 0 πH0:θΘ0F
F0={f(|θ); θΘ0}
Mρ0ρaπ0(θ)Θ0 trên Θ . Và tôi sau đó suy ra sự phân bố sau của chỉ số này: π ( m = 0 | x ) = ρ 0 q 0 f ( x | θ ) π 0 ( θ ) d θπa(θ)Θ Cáctài liệu mà bạn có liên quan đếnđi vào nhiều chi tiết hơn vào viễn cảnh này và nên là sự lựa chọn của bạn trong việc kiểm tra thống kê các giả thuyết, trừ khi bạn có thể đủ khả năng để đi qua toàn bộ cuốn sách Bayes. Hoặc thậm chí là một cuốn sách học máy
π(m=0|x)=ρ0Θ0f(x|θ)π0(θ)dθρ0Θ0f(x|θ)π0(θ)dθ+(1ρ0)Θf(x|θ)πa(θ)dθ
như của Kevin Murphy .

XN(θ,1)H0:θ=0θ=0N(0,1)θθ~N(0,10)ρ0= =1/2

π(m=0|x)=12πexp{x2/2}12πexp{x2/2}+R12πexp{(xθ)2/2}12π×10exp{θ2/20}dθ=exp{x2/2}exp{x2/2}+111exp{x2/22}

pH(H0)F0θF0py|H(y|H0)H0H0

HmθFmHm=(θ,Fm)θFm

ϱ0H0F0ϱ0=0π0(θ)θH0

Vì vậy, nếu giả thuyết là một bộ mô hình thống kê được đề xuất và một tham số mặc định, thì tham số mặc định được chọn như thế nào?
Pinocchio

θ=0

4

Câu hỏi tuyệt vời. Tôi nghĩ rằng sự nhầm lẫn của bạn có thể xuất phát từ một số khác biệt cơ bản giữa các quan điểm "thường xuyên" và "Bayes". Tôi có nhiều kinh nghiệm với người trước và người mới đến sau nên việc thử một vài quan sát đơn giản cũng có thể giúp tôi. Tôi đã chỉnh sửa câu hỏi của bạn để làm rõ một vài sự phân biệt - ít nhất, như tôi hiểu chúng. Tôi hy vọng bạn không phiền! Nếu tôi có điều gì đó sai, bạn có thể chỉnh sửa lại câu hỏi của bạn hoặc thêm nhận xét về phản hồi này.

1) Có nguy cơ nghe có vẻ quá sơ đẳng: Một mô hình là bất kỳ tuyên bố nào cố gắng giải thích thực tế như "Nếu tôi có bánh kếp cho bữa sáng, thì đó phải là thứ ba." Như vậy, một mô hình là một giả thuyết. Một câu nói nổi tiếng của George Box: "Tất cả các mô hình đều sai, một số mô hình là hữu ích." Để một mô hình trở nên hữu ích, phải có một số cách để kiểm tra nó. Nhập khái niệm về các giả thuyết cạnh tranh và câu trả lời cho một trong những câu hỏi của bạn. Tôi sẽ đề xuất rằng "... trong bối cảnh suy luận thống kê", một giả thuyết là bất kỳ mô hình nào có thể hữu ích và có thể được kiểm tra về mặt toán học. Vì vậy, kiểm tra giả thuyết là một phương tiện để đưa ra quyết định về việc liệu một mô hình có hữu ích hay không. Tóm lại, một giả thuyết là một mô hình đang được xem xét. Nó có thể là các giá trị tham số khác nhau của cùng một chức năng hoặc các chức năng khác nhau.

2) Video Kahn của bạn là một ví dụ về cách mà Bayesian gọi là cách tiếp cận "Thường xuyên" để kiểm tra giả thuyết để nó có thể làm bạn bối rối khi cố gắng áp dụng nó vào ghi chú bài giảng của bạn là Bayesian. Tôi đã cố gắng đưa ra một sự phân biệt đơn giản giữa việc áp dụng hai phương pháp (có thể nguy hiểm). Tôi nghĩ rằng tôi hiểu sự phân biệt triết học hợp lý tốt. Từ những gì tôi đã thấy, "Người thường xuyên" giả định một thành phần ngẫu nhiên cho dữ liệu và kiểm tra khả năng dữ liệu quan sát được đưa ra các tham số không ngẫu nhiên. "Bayesian" giả định dữ liệu là cố định và xác định giá trị rất có thể của các tham số ngẫu nhiên. Sự khác biệt này dẫn đến các phương pháp thử nghiệm khác nhau.

Trong thử nghiệm giả thuyết "Thường xuyên", một mô hình có thể hữu ích là một mô hình giải thích một số hiệu ứng để nó được so sánh với "giả thuyết null" - mô hình không có hiệu lực. Nỗ lực này được thực hiện để thiết lập một mô hình hữu ích loại trừ lẫn nhau cho mô hình không có hiệu lực. Thử nghiệm sau đó dựa trên xác suất quan sát dữ liệu theo giả định không có hiệu lực. Nếu xác suất đó được tìm thấy là thấp, giả thuyết khống sẽ bị bác bỏ và giải pháp thay thế là tất cả những gì còn lại. . là ví dụ đơn giản nhất: "Hai nhóm là khác nhau."lớn hoặc lớn hơn được đo bằng một thí nghiệm ngẫu nhiên cho rằng chúng không khác nhau. Đây thường là một thử nghiệm t trong đó giả thuyết null là sự khác biệt của phương tiện bằng không. Vì vậy, tham số là giá trị trung bình tại một giá trị cố định bằng không.

Các Bayesian nói, "Giữ trên một phút, chúng tôi làm cho những phép đo và họ khác nhau, vậy làm thế nào có thể như vậy?" Họ tính xác suất cho mọi giá trị của tham số ngẫu nhiên (bây giờ) và chọn giá trị cao nhất có thể. Vì vậy, theo một nghĩa nào đó, mọi giá trị có thể của tham số là một mô hình riêng biệt. Nhưng bây giờ họ cần một cách để đưa ra quyết định về việc liệu mô hình có xác suất cao nhất có đủ khác biệt để quan trọng hay không. Đó là lý do tại sao bài giảng của bạn giới thiệu chức năng chi phí. Để đưa ra một quyết định tốt, một số giả định về hậu quả của việc đưa ra quyết định sai là cần thiết.

3) "Việc gán một giả thuyết cho mỗi mẫu dữ liệu có nghĩa là gì?" Tôi không nghĩ họ như vậy. Hãy cẩn thận với những gì có nghĩa là "điểm mẫu." Tôi tin rằng họ đang đề cập đến một vectơ mẫu cụ thể và muốn biết khả năng mỗi giả thuyết có khả năng cho tất cả các vectơ mẫu trong không gian mẫu. Phương trình (14) và (15) chỉ ra cách so sánh hai giả thuyết cho một vectơ mẫu cụ thể. Vì vậy, họ đang đơn giản hóa một lập luận chung về so sánh nhiều giả thuyết bằng cách chỉ ra cách so sánh chỉ hai.


0

Giả sử bạn có dữ liệu từ một bộ hộp. Dữ liệu bao gồm Chiều dài (L), Chiều rộng (W), Chiều cao (H) và Âm lượng (V).

Nếu chúng ta không biết nhiều về hộp / hình học, chúng ta có thể thử mô hình:

V = a*L + b*W + c*H + e

Mô hình này có ba tham số (a, b, c) có thể thay đổi, cộng với một lỗi / thời hạn chi phí (e) mô tả giả thuyết phù hợp với dữ liệu như thế nào. Mỗi kết hợp các giá trị tham số sẽ được coi là một giả thuyết khác nhau. Giá trị tham số "mặc định" được chọn thường bằng 0, trong ví dụ trên sẽ tương ứng với "không có mối quan hệ" giữa V và L, W, H.

Những gì mọi người làm là kiểm tra giả thuyết "mặc định" này bằng cách kiểm tra xem e có vượt quá giá trị ngưỡng hay không, thường bằng cách tính giá trị p giả sử phân phối lỗi bình thường xung quanh mô hình phù hợp. Nếu giả thuyết đó bị bác bỏ, thì họ tìm thấy sự kết hợp của các tham số a, b, c để tối đa hóa khả năng và đưa ra đây là giả thuyết có khả năng nhất. Nếu chúng là bayes, chúng nhân khả năng của nó với trước cho mỗi bộ giá trị tham số và chọn giải pháp tối đa hóa xác suất sau.

Rõ ràng chiến lược này là không tối ưu ở chỗ mô hình giả định tính gây nghiện và sẽ bỏ lỡ giả thuyết chính xác là:

V = L*W*H + e

Chỉnh sửa: @Pinocchio

Có lẽ ai đó không đồng ý với tuyên bố rằng kiểm tra giả thuyết là không tối ưu khi không có lý do hợp lý để chọn một / vài chức năng (hoặc như bạn đặt nó: "các lớp giả thuyết") trong số vô số khả năng có thể. Tất nhiên điều này là đúng, và "tối ưu" có thể được sử dụng theo nghĩa hạn chế "phù hợp nhất với chức năng chi phí và các lựa chọn được cung cấp". Nhận xét đó đã đưa nó vào câu trả lời của tôi vì tôi không thích vấn đề về đặc tả mô hình được đưa ra trong các ghi chú lớp học của bạn như thế nào. Đây là vấn đề chính mà hầu hết các công nhân khoa học phải đối mặt, mà afaik không có thuật toán.

Hơn nữa, tôi không thể hiểu giá trị p, kiểm tra giả thuyết, vv cho đến khi tôi hiểu lịch sử, vì vậy có lẽ nó cũng sẽ giúp bạn. Có nhiều nguồn gây nhầm lẫn xung quanh việc kiểm tra giả thuyết thường xuyên (tôi không quá quen thuộc với lịch sử của biến thể bayes).

Có một cái ban đầu được gọi là "thử nghiệm giả thuyết" theo nghĩa Neyman-Pearson, "thử nghiệm ý nghĩa" do Ronald Fisher phát triển, và cũng là một "lai" không xác định chính xác của hai chiến lược này được sử dụng rộng rãi trong các ngành khoa học (mà có thể được gọi ngẫu nhiên bằng cách sử dụng thuật ngữ trên hoặc "kiểm tra ý nghĩa giả thuyết null"). Mặc dù tôi không khuyên bạn nên lấy một trang wikipedia là có thẩm quyền, nhiều nguồn thảo luận về các vấn đề này có thể được tìm thấy ở đây . Một số điểm chính:

  1. Việc sử dụng một giả thuyết "mặc định" không phải là một phần của quy trình kiểm tra giả thuyết ban đầu, thay vào đó, người dùng phải sử dụng kiến ​​thức trước để xác định các mô hình đang được xem xét. Tôi chưa bao giờ thấy khuyến nghị rõ ràng của những người đề xuất mô hình này liên quan đến những việc cần làm nếu chúng ta không có lý do cụ thể để chọn một nhóm các giả thuyết nhất định để so sánh. Người ta thường nói rằng phương pháp này phù hợp để kiểm soát chất lượng, khi có dung sai đã biết để so sánh một số phép đo.

  2. Không có giả thuyết thay thế nào theo mô hình "thử nghiệm ý nghĩa" của Fisher, chỉ có một giả thuyết khống, có thể bị bác bỏ nếu xét thấy không chắc chắn được cung cấp dữ liệu. Từ cách đọc của tôi, bản thân Fisher đã không rõ ràng về việc sử dụng các giả thuyết null mặc định. Tôi không bao giờ có thể tìm thấy anh ấy bình luận rõ ràng về vấn đề này, tuy nhiên anh ấy chắc chắn không khuyến nghị rằng đây chỉ là giả thuyết không có giá trị.

  3. Việc sử dụng giả thuyết null mặc định đôi khi được hiểu là "lạm dụng" kiểm tra giả thuyết, nhưng nó là trung tâm của phương pháp lai phổ biến được đề cập. Lập luận cho rằng thực tiễn này thường là "sơ bộ vô dụng":

    "Nhà nghiên cứu đưa ra dự đoán lý thuyết, nói chung là hướng của hiệu ứng ... Khi dữ liệu trên thực tế cho thấy kết quả định hướng dự đoán, điều này dường như xác nhận giả thuyết. Nhà nghiên cứu kiểm tra giả thuyết null của" người rơm "rằng hiệu ứng thực sự là Nếu không thể loại bỏ cái sau ở mức 0,05 (hoặc một số biến thể), thì xác nhận rõ ràng về lý thuyết không thể được yêu cầu ... Một lỗi phổ biến trong loại thử nghiệm này là gây nhầm lẫn mức ý nghĩa thực sự đạt được (đối với từ chối null người rơm) với mức xác nhận đạt được cho lý thuyết ban đầu ... sức mạnh của xác nhận thực sự phụ thuộc vào [độ sắc nét của dự đoán số của nhà nghiên cứu], chứ không phụ thuộc vào mức ý nghĩa đạt được đối với người không có rơm. "

    Các thử nghiệm giả thuyết null tranh cãi trong tâm lý học. David H Krantz. Tạp chí của Hiệp hội Thống kê Hoa Kỳ; Tháng 12 năm 1999; 94, 448; 1372-1381

Video của học viện Khan là một ví dụ về phương pháp lai này và có lỗi khi phạm lỗi được ghi trong trích dẫn đó. Từ thông tin có sẵn trong video đó, chúng tôi chỉ có thể kết luận rằng những con chuột được tiêm khác với những người không được tiêm, trong khi video tuyên bố chúng tôi có thể kết luận rằng "thuốc chắc chắn có tác dụng". Một chút suy ngẫm sẽ khiến chúng ta xem xét rằng có lẽ những con chuột được thử nghiệm đã già hơn so với không tiêm, v.v. Chúng ta cần loại trừ những giải thích thay thế hợp lý trước khi đưa ra bằng chứng cho lý thuyết của mình. Dự đoán của lý thuyết càng ít cụ thể , càng khó thực hiện điều này.

Chỉnh sửa 2:

Có lẽ lấy ví dụ từ ghi chú của bạn về chẩn đoán y tế sẽ giúp ích. Nói rằng một bệnh nhân có thể là "bình thường" hoặc trong "khủng hoảng tăng huyết áp".

Chúng tôi có thông tin trước đó rằng chỉ có 1% số người bị khủng hoảng tăng huyết áp. Những người bị khủng hoảng tăng huyết áp có huyết áp tâm thu theo phân phối bình thường với mean = 180 và sd = 10. Trong khi đó, người bình thường có huyết áp từ phân phối bình thường với mean = 120, sd = 10. Chi phí đánh giá một người bình thường khi họ bằng 0, chi phí bỏ sót chẩn đoán là 1 và chi phí do tác dụng phụ do điều trị là 0,2 bất kể họ có bị khủng hoảng hay không. Sau đó, mã R sau đây tính toán ngưỡng (eta) và tỷ lệ khả năng. Nếu tỷ lệ khả năng lớn hơn ngưỡng chúng tôi quyết định điều trị, nếu ít hơn chúng tôi không:

#Prior probabilities
P0=.99 #Prior probability patient is normal
P1=1-P0 #Prior probability patient is in crisis

#Hypotheses
H0<-dnorm(x=50:250, mean=120, sd=10) #H0: Patient is normal
H1<-dnorm(x=50:250, mean=180, sd=10) #H1: Patient in hypertensive crisis

#Costs
C00=0 #Decide normal when normal
C01=1 #Decide normal when in crisis
C10=.2 #Decide crisis when normal
C11=.2 #Decide crisis when in crisis

#Threshold
eta=P0*(C10-C00)/ P1*(C01-C11)

#Blood Pressure Measurements
y<-rnorm(3, 150, 20)

#Calculate Likelihood of Each Datapoint Given Each Hypothesis
L0vec=dnorm(x=y, mean=120, sd=10) #Vector of Likelihoods under H0
L1vec=dnorm(x=y, mean=180, sd=10) #Vector of Likelihoods under H1

#P(y|H) is the product of the likelihoods under each hypothesis
L0<-prod(L0vec)
L1<-prod(L1vec)

#L(y) is the ratio of the two likelihoods
LikRatio<-L1/L0


#Plot
plot(50:250, H0, type="l", col="Green", lwd=4, 
     xlab=" Systolic Blood Pressure", ylab="Probability Density Given Model",
     main=paste0("L=",signif(LikRatio,3)," eta=", signif(eta,3)))
lines(50:250, H1, col="Red", lwd=4)
abline(v=y)

#Decision
if(LikRatio>eta){
  print("L > eta  ---> Decision: Treat Patient")
}else{
  print("L < eta  ---> Do Not Treat Patient")
}

Trong kịch bản trên, ngưỡng eta = 15,84. Nếu chúng ta thực hiện ba lần đo huyết áp và nhận 139,9237, 125,278, 190,3765, thì tỷ lệ khả năng là 27,6 nghiêng về H1: Bệnh nhân bị khủng hoảng tăng huyết áp. Vì 27.6 lớn hơn ngưỡng chúng tôi sẽ chọn để điều trị. Biểu đồ cho thấy giả thuyết bình thường màu xanh lá cây và tăng huyết áp màu đỏ. Các đường màu đen dọc cho biết các giá trị của các quan sát.

nhập mô tả hình ảnh ở đây


người mà đã bỏ phiếu này có thể giải thích? Có gì sai với câu trả lời này? : S
Pinocchio

@Pinocchio Tôi đã cố gắng làm rõ mọi thứ với một số lịch sử trong câu trả lời, "kiểm tra giả thuyết" là một chủ đề khó thảo luận rõ ràng do điều đó. Tôi nghĩ rằng tôi đã trả lời các câu hỏi liên quan đến cách sử dụng mô hình / giả thuyết thuật ngữ nhưng không hiểu điều này: 'Việc gán một giả thuyết cho mỗi mẫu dữ liệu có nghĩa là gì?'
Sống động

Tôi không thể hiểu tại sao câu trả lời này bị hạ cấp và tại sao nó không được đánh giá cao hơn. Nó thực sự xuất sắc. Nó có thể sử dụng nhiều hơn một chút định nghĩa lý thuyết, nhưng rõ ràng nó được định hướng theo hướng đối tượng rộng hơn so với các nhà thống kê. Ví dụ đầu tiên sử dụng GLM đặc biệt khai sáng và hoàn toàn phù hợp với (nhiều) bài đọc học thuật của tôi. Điểm mấu chốt là sự khác biệt chính giữa kiểm tra giả thuyết thường xuyên và bayesian là kế toán của trước để tính MAP (thay vì chỉ MLE).
gabious

Tôi có thể thêm rằng một biểu diễn đồ họa của ví dụ đầu tiên với GLM sẽ tuyệt vời và rất ngộ, có thể sử dụng một loại cốt truyện đòn bẩy ?
gabious
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.