So sánh mô hình Bayes ở trường trung học


8

Tôi dạy vật lý cho học sinh trung học, và tôi muốn học sinh của mình tiến hành so sánh mô hình Bayes thô sơ cho dữ liệu từ thí nghiệm của họ. Tôi đã tìm ra một cách để họ làm như vậy (xem bên dưới), nhưng tôi không chắc nó đúng. Tôi rất đánh giá cao bất kỳ phản hồi nào về nó (đặc biệt là phản hồi tiêu cực!), Hoặc đề xuất về cách làm điều đó tốt hơn.

Tôi muốn so sánh một lý thuyết tuyến tính, với các tham số độ dốc và chặn , với một giả thuyết khống về hằng số tức là độ dốc = 0. Trong cả hai trường hợp, tôi giả sử nhiễu đối xứng Gaussian.aba

Các sinh viên có thể rút ra, sử dụng Excel, ước tính khả năng tối đa cho độ dốc và đánh chặn ( và ), và các lỗi của họ và .a^b^dadb

  1. Đối với độ dốc trước, tôi xem xét một Gaussian rộng, tập trung vào ước tính tối đa = khả năng ( ) và với độ lệch chuẩn gấp mười lần. Lý do của tôi là tôi thực tế mong đợi họ tìm thấy các tham số dòng "chính xác" ít nhất là trong một cường độ, và trong thực tế, họ sẽ tìm thấy chúng gần hơn vì vậy nếu tôi thay thế độ dốc "chính xác" bằng MLE của nó, tôi sẽ không thay đổi số lượng quá nhiều.a^
  2. Đối với khả năng của bằng chứng đưa ra bất kỳ lý thuyết tuyến tính cụ thể nào, tôi xem xét phân phối Gaussian đa biến tiêu chuẩn, với độ lệch chuẩn ( ) liên quan đến tổng bình phương còn lại.σe
  3. Do đó, khả năng của bằng chứng cho lý thuyết tuyến tính nói chung, tức là tích phân của ưu tiên và khả năng trên, do đó được ước tính là ưu tiên và khả năng tại điểm MLE, nhân với sai số ở độ dốc .da
  4. Khả năng của các bằng chứng đưa ra giả thuyết null được giả sử là một Gaussian đa biến khác, hiện đang sử dụng tổng độ lệch chuẩn ( ), dựa trên sự khác biệt so với mức trung bình-Y.σT
  5. Đây là phần tôi ít chắc chắn nhất: Tôi ước tính hệ số Bayes là tỷ lệ của hai khả năng trên (3 và 4 ở trên), cho phép tôi đưa ra công thức sau:

    B10=da(10|a^|2π)(σT/σe)Ne

Điều này sẽ cho chúng ta ước tính hợp lý cho yếu tố Bayes? Bất kỳ thông tin phản hồi đều được chào đón.


Tôi đã chỉnh sửa công thức của bạn bằng MathJax để cho nó trông gọn gàng hơn, dễ đọc hơn. Vui lòng chỉnh sửa nó nếu tôi dịch sai
Marquis de Carabas

Cảm ơn bạn! Tuy nhiên, hai số hạng cuối cùng (tỷ lệ s và căn bậc hai của e) phải nằm ngoài phân số hoặc trong tử số.
ChemistryTeacher

1
Oh! Nó giống như LaTex! Tôi đã sửa các công thức; cảm ơn lần nữa
ChemistryTeacher

Câu trả lời:


1

Trước tiên, hãy để tôi nói rằng thử nghiệm hợp lý của một giả thuyết sắc nét như đòi hỏi phải có sự phân phối trước một cách chu đáo cho , bởi vì yếu tố Bayes phụ thuộc rất nhiều vào điều này trước. Nhiều người Bayes sẽ không kiểm tra một giả thuyết sắc bén, nhưng tôi sẽ làm.a=0a

Trước khi tiếp tục, tôi phải nói với bạn rằng tôi không thực sự hiểu những gì bạn nói bạn đang làm và vì vậy tôi có thể cho bạn lời khuyên mà bạn không tìm kiếm. Tôi hy vọng bạn có thể làm theo ký hiệu có thể.

Đặt dữ liệu là quan sát: , trong đó (theo mô hình tổng quát hơn và bao gồm độ dốc) (Tôi đang loại bỏ biến độc lập khỏi danh sách các đối số điều hòa để đơn giản hóa công chứng.) Khả năng được đưa ra bởi Đặt trước cho , phân phối sau là trong đó khả năng của dữ liệu theo mô hình tổng quát hơn là ny=((x1,y1),,(xn,yn))

p(yi|a,b,σ2)=N(yi|b+axi,σ2).
xi
p(y|a,b,σ2)=i=1np(yi|a,b,σ2).
(a,b,σ2)
p(a,b,σ2|y)=p(y|a,b,σ2)p(a,b,σ2)p(y),
p(y)=p(y|a,b,σ2)p(a,b,σ)dσ2dbda=(p(y|a,b,σ2)p(b,σ2)dσ2db)p(a|b,σ2)da=p(y|a)p(a|b,σ2)da,
trong đó tôi đã sử dụng . Lưu ý rằng là khả năng (cận biên) cho và là điều kiện trước cho . Nếu ưu tiên cho độc lập với , thì . Tôi sẽ cho rằng đó là sự thật.p(a,b,σ2)=p(a|b,σ2)p(b,σ2)p(y|a)ap(a|b,σ2)aa(b,σ2)p(a|b,σ2)=p(a)

Với các biểu thức này, giờ đây chúng ta có thể viết phần sau cho : Bây giờ chúng ta sẽ sắp xếp lại biểu thức này: Vì biểu thức này đúng với mọi giá trị của , nên nó đặc biệt đúng với : Lưu ý rằng tử số trong phân số ở phía bên trái là khả năng của dữ liệu theo mô hình bị hạn chế (nghĩa là bị giới hạn ởa

p(a|y)=p(y|a)p(a)p(y).
p(y|a)p(y)=p(a|y)p(a).
aa=0
p(y|a=0)p(y)=p(a=0|y)p(a=0).
a=0). Và, như đã lưu ý, mẫu số là khả năng của dữ liệu theo mô hình tổng quát hơn. Do đó, phía bên trái là yếu tố Bayes ủng hộ mô hình bị hạn chế so với mô hình tổng quát hơn.

Phân số bên tay phải cho chúng ta một cách để đánh giá yếu tố Bayes: Nó nói để chia mật độ sau được đánh giá ở mức cho mật độ trước được đánh giá ở mức . (Nhân tiện, "công thức" được gọi là tỷ lệ mật độ Savage-Dickey.) Bây giờ thì rõ ràng tại sao cần phải có một suy nghĩ trước cho . Nếu chúng ta để cho mật độ trước cho thể rất bấp bênh, mật độ trước sẽ rất thấp ở khắp mọi nơi trong đó có , nhưng mật độ sau tại sẽ không đi đến số không, và hậu quả là các yếu tố Bayes sẽ đi đến vô cùng. Trong trường hợp này, "rác trong" tạo ra "rác ra".a=0a=0aaa=0a=0

Bạn có thể tưởng tượng rằng nếu bạn không làm theo các bước tôi đã vạch ra, thì bạn sẽ không phải chịu vấn đề này, nhưng bạn sẽ sai. Logic tôi đã trình bày áp dụng bất kể "thuật toán" bạn áp dụng.

Nhưng các bước cung cấp một thuật toán có thể hữu ích. Giả sử ưu tiên cho các tham số được đưa ra bởi "Jeffreys trước" Điều này có nghĩa là việc sử dụng không đúng trước các "tham số phiền toái" . Đây là okay, nhưng như vậy một trước sẽ không thích hợp cho vì lý do tôi đã thảo luận ở trên. Với trước, điều này --- các (biên) khả năng cho --- sẽ tỷ lệ với một sinh viên phân phối, các thông số trong đó phụ thuộc vào các dữ liệu . Đây phân phối hoàn tất bản tóm tắt các dữ liệu, có thể được loại bỏ. Bây giờ bạn phải chọn một thông tin thích hợp và đầy đủ trước

p(b,σ2)1/σ2.
(b,σ2)ap(y|a)atyta . Làm như vậy, bạn có thể tính toán số lượng theo phương trình "Savage-Dickey".

Tôi hy vọng bạn tìm thấy một cái gì đó trong những gì tôi đã nói hữu ích.


Hmm, rõ ràng tôi không thể để lại bình luận dài hoặc chỉnh sửa chúng trong nhiều thời gian. Tôi sẽ cắt theo đuổi: Làm thế nào tôi phải tính toán phía bên tay phải? Ưu tiên của tôi là Tôi giả sử sau dữ liệu đó là Vì vậy, yếu tố Bayes là tỷ lệ của hai yếu tố này tại a = 0?p(a)=110|a^|2πe(aa^)22(10|a^|2p(a|y)=1σa|2πe(aa^)22σa2
ChemistryTeacher

Tôi không hiểu trước của bạn vì nó dường như liên quan đến dữ liệu thông qua ước tính khả năng tối đa.
MEF

Vâng, chúng tôi đang chơi một chút giả vờ ở đây (nó dành cho trường trung học!). Giá trị thực trước là như nhau ngoại trừ giá trị được đưa ra trong tài liệu cho độ dốc dự kiến ​​được sử dụng thay vì . Để đưa ra một công thức dạng đóng không phụ thuộc vào thử nghiệm rõ ràng, tôi cho rằng vì đó là một ưu tiên rộng và sẽ không nằm xa giá trị tài liệu, chúng ta có thể trao đổi chúng mà không thay đổi số nhiều a^hata
ChemistryTeacher

Tôi không hiểu lý do cho các giả định của bạn về trước. Tuy nhiên, câu trả lời cho câu hỏi trong bình luận đầu tiên của bạn là "có." Tôi nghĩ bạn sẽ thấy yếu tố Bayes (BF) khá nhạy cảm với lựa chọn phương sai trước đó của bạn. Nếu bạn thay đổi 10 thành 20 (ví dụ), tôi nghi ngờ bạn sẽ nhận được một thay đổi lớn trong BF. Và đó là điểm tôi đang cố gắng thực hiện.
MEF

Cảm ơn rất nhiều! Tôi vẫn không hiểu liệu tính toán ban đầu của tôi có hợp lý hay không, nhưng ít nhất bây giờ tôi có một điểm so sánh. Tôi sẽ kiểm tra phản hồi về sự thay đổi của yếu tố từ 10 đến 20, và sự hoán đổi của tài liệu so với giá trị . a^
ChemistryTeacher
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.