Tại sao thống kê Bayes không phổ biến hơn cho kiểm soát quá trình thống kê?


18

Sự hiểu biết của tôi về cuộc tranh luận Bayesian và thường xuyên là số liệu thống kê thường xuyên:

  • là (hoặc tuyên bố là) khách quan
  • hoặc ít nhất là không thiên vị
  • vì vậy các nhà nghiên cứu khác nhau, sử dụng các giả định khác nhau vẫn có thể nhận được kết quả so sánh định lượng

trong khi thống kê bayes

  • tuyên bố để đưa ra dự đoán "tốt hơn" (nghĩa là mất mát dự kiến ​​thấp hơn), bởi vì nó có thể sử dụng kiến ​​thức trước đó (trong số các lý do khác)
  • cần ít lựa chọn "ad hoc" hơn, thay thế chúng bằng các lựa chọn trước / mô hình mà (ít nhất là về nguyên tắc) có cách giải thích trong thế giới thực.

Do đó, tôi đã dự đoán rằng số liệu thống kê bayes sẽ rất phổ biến ở SPC: Nếu tôi là chủ sở hữu nhà máy cố gắng kiểm soát chất lượng quy trình của mình, tôi chủ yếu quan tâm đến tổn thất dự kiến; Nếu tôi có thể giảm điều đó, bởi vì tôi có kiến ​​thức trước / tốt hơn so với đối thủ cạnh tranh, thậm chí còn tốt hơn.

Nhưng thực tế tất cả mọi thứ tôi đã đọc về SPC dường như là thường xuyên chắc chắn (nghĩa là không có phân phối trước, ước tính điểm của tất cả các tham số, nhiều lựa chọn đặc biệt về kích thước mẫu, giá trị p, v.v.)

Tại sao vậy? Tôi có thể thấy tại sao số liệu thống kê thường xuyên là lựa chọn tốt hơn trong những năm 1960, khi SPC được thực hiện bằng bút và giấy. Nhưng tại sao không ai thử các phương pháp khác nhau kể từ đó?


2
Tôi nghĩ rằng thống kê Bayes là máy ảnh SLP kỹ thuật số của tôi trong khi thường xuyên là máy ảnh iPhone. Thỉnh thoảng tôi đã mua cả hai nhưng tôi sử dụng DSLR ít hơn 5% ảnh trong khi điện thoại nghỉ 95%. Bởi vì nó dễ dàng, tiện dụng và bỏ túi và nhiều thời gian cung cấp theo chất lượng (dựa trên các kỹ năng DSLR của tôi). Cũng giống như việc kết hợp các linh mục và chuỗi chạy trong cỏ khô, tôi cần tìm sự cân bằng tối ưu về thời gian mở khẩu độ, độ dài và các thông số khác. Iphone kết thúc phổ biến.
Ram Sharma

@RamSharma bạn nên đăng nó như một câu trả lời! Tôi thích nó tốt hơn so với tương tự dao đầu bếp của tôi.
Shadowtalker

Câu trả lời:


18

CẢNH BÁO Tôi đã viết câu trả lời này từ lâu với rất ít ý tưởng về những gì tôi đang nói. Tôi không thể xóa nó vì nó đã được chấp nhận, nhưng tôi không thể đứng sau hầu hết các nội dung.


Đây là một câu trả lời rất dài và tôi hy vọng nó sẽ hữu ích theo một cách nào đó. SPC không phải là lĩnh vực của tôi, nhưng tôi nghĩ những nhận xét này đủ chung để họ áp dụng ở đây.

Tôi cho rằng lợi thế được trích dẫn nhiều nhất - khả năng kết hợp niềm tin trước đây - là một lợi thế yếu của các lĩnh vực áp dụng / thực nghiệm. Đó là bởi vì bạn cần định lượng trước. Ngay cả khi tôi có thể nói "tốt, cấp z chắc chắn là không thể tin được", tôi không thể nói với bạn điều gì sẽ xảy ra dưới z. Trừ khi các tác giả bắt đầu xuất bản dữ liệu thô của họ theo nhóm, những dự đoán tốt nhất của tôi cho các linh mục là những khoảnh khắc có điều kiện được lấy từ tác phẩm trước đó có thể hoặc không được trang bị trong những điều kiện tương tự như những gì bạn phải đối mặt.

Về cơ bản, các kỹ thuật Bayes (ít nhất là ở cấp độ khái niệm) là tuyệt vời khi bạn có một giả định / ý tưởng / mô hình mạnh mẽ và muốn đưa nó vào dữ liệu, sau đó xem bạn biến thành sai hay không sai. Nhưng thường thì bạn không muốn xem liệu bạn có đúng về một mô hình cụ thể cho quy trình kinh doanh của bạn hay không; nhiều khả năng bạn không cómô hình, và đang tìm kiếm để xem những gì quá trình của bạn sẽ làm. Bạn không muốn đưa ra kết luận của mình, bạn muốn dữ liệu của mình đưa ra kết luận. Nếu bạn có đủ dữ liệu, đó là điều sẽ xảy ra dù sao đi nữa, nhưng trong trường hợp đó tại sao phải bận tâm với điều đó? Có lẽ đó là sự hoài nghi và sợ rủi ro quá mức, nhưng tôi chưa bao giờ nghe nói về một doanh nhân lạc quan cũng thành công. Không có cách nào để định lượng sự không chắc chắn của bạn về niềm tin của chính bạn, và bạn thà không có nguy cơ quá tự tin vào những điều sai trái. Vì vậy, bạn đặt một ưu tiên không chính xác và lợi thế biến mất.

Điều này rất thú vị trong trường hợp SPC bởi vì không giống như trong tiếp thị kỹ thuật số, quy trình kinh doanh của bạn không tồn tại mãi trong tình trạng thay đổi không thể đoán trước. Ấn tượng của tôi là các quy trình kinh doanh có xu hướng thay đổi có chủ ý và tăng dần. Đó là, bạn có một thời gian dài để xây dựng các linh mục tốt, an toàn. Nhưng nhớ lại rằng các linh mục là tất cả về tuyên truyền sự không chắc chắn. Về mặt chủ quan, chủ nghĩa Bayes có lợi thế là nó truyền bá một cách khách quan sự không chắc chắn qua các quá trình tạo dữ liệu được lồng ghép sâu sắc. Điều đó, với tôi, thực sự là những gì thống kê Bayes tốt cho. Và nếu bạn đang tìm kiếm độ tin cậy của quá trình của bạn vượt ra ngoài ngưỡng "tầm quan trọng" 1 trong 20, có vẻ như bạn sẽ muốn tính đến sự không chắc chắn nhất có thể.

Vậy các mô hình Bayes ở đâu? Trước hết, họ khó thực hiện. Nói một cách thẳng thắn, tôi có thể dạy OLS cho một kỹ sư cơ khí trong 15 phút và để anh ta điều chỉnh hồi quy và kiểm tra t trong Matlab trong một lần khác 5. Để sử dụng Bayes, trước tiên tôi cần quyết định loại mô hình nào tôi phù hợp, và sau đó xem liệu có một thư viện làm sẵn cho nó bằng ngôn ngữ mà ai đó ở công ty tôi biết không. Nếu không, tôi phải sử dụng BUGS hoặc Stan. Và sau đó tôi phải chạy mô phỏng để có được câu trả lời cơ bản và mất khoảng 15 phút trên máy i7 8 nhân. Quá nhiều cho việc tạo mẫu nhanh. Và thứ hai, vào thời điểm bạn nhận được câu trả lời, bạn đã dành hai giờ để viết mã và chờ đợi, chỉ để có được kết quả giống như bạn có thể có với các hiệu ứng ngẫu nhiên thường xuyên với các lỗi tiêu chuẩn gộp. Có lẽ đây là tất cả tự phụ và sai lầm và tôi không hiểu SPC chút nào.

Tôi ví chủ nghĩa Bayes với một con dao đầu bếp chất lượng rất cao, một stockpot và một chiếc chảo xào ; thường xuyên giống như một nhà bếp đầy đủ các công cụ As-Seen-On-TV như máy thái chuối và nồi mì ống có lỗ trên nắp để thoát nước dễ dàng . Nếu bạn là một đầu bếp thực hành có nhiều kinh nghiệm trong bếp - thực sự, trong nhà bếp của bạn có kiến ​​thức thực sự, sạch sẽ và có tổ chức và bạn biết mọi thứ nằm ở đâu - bạn có thể làm những điều tuyệt vời với lựa chọn nhỏ của mình công cụ thanh lịch, chất lượng cao. Hoặc, bạn có thể sử dụng một loạt các công cụ ad-hoc * nhỏ khác nhau, không yêu cầu kỹ năng sử dụng, để tạo ra một bữa ăn đơn giản, thực sự không đến một nửa và có một vài hương vị cơ bản có thể hiểu được. Bạn vừa về nhà từ các mỏ dữ liệu và bạn đang khao khát kết quả; bạn nấu món gì

* Bayes chỉ là ad-hoc, nhưng ít minh bạch như vậy. Bao nhiêu rượu đi trong coq au vin của bạn? Không có ý tưởng, bạn nhãn cầu nó bởi vì bạn là một pro. Hoặc, bạn không thể phân biệt sự khác biệt giữa Pinot Grigio và Pinot Noir nhưng công thức đầu tiên trên Epicquil cho biết sử dụng 2 cốc màu đỏ để đó là điều bạn sẽ làm. Cái nào nhiều "ad-hoc?"


1
+1, câu trả lời tuyệt vời. Tôi tò mò: Bạn có thể thêm một đoạn về kích thước mẫu nhỏ / thích ứng không? Trong SPC, cỡ mẫu 3-5 dường như là phổ biến. Và nếu phần mềm SPC có thể báo cho kỹ thuật viên sau 2 mẫu xem có thực sự cần thêm 3 mẫu nữa hay không, đó sẽ là một tính năng tuyệt vời . Với mô hình bayes, điều đó gần như không có trí tuệ: Xác định chi phí cho các phép đo, dương tính giả và -negative, sau đó ước tính chi phí dự kiến ​​của việc thực hiện phép đo khác so với dừng. Trong thống kê thường xuyên, bạn sẽ phải đối phó với các hiệu ứng quy tắc dừng kỳ lạ (Bạn có thể dạy chúng cho ME trong 15 phút không?)
nikie

1
Đối với kích thước mẫu, vấn đề, và tôi đã đề cập đến vấn đề này nếu tôi biết các mẫu đó nhỏ đến mức, với rất ít quan sát, ước tính của bạn sẽ rất nhạy cảm với lựa chọn trước của bạn. Bạn không thể lấy máu từ một hòn đá, vì vậy đó là một sự đánh đổi: hoặc bạn quá phù hợp với một người ước lượng thường xuyên, nhưng làm như vậy với một vài giả định, hoặc bạn kết hợp kiến ​​thức của riêng bạn (hoặc thiếu nó) vào một điều mơ hồ trước đó và về cơ bản phù hợp với cả dữ liệu bạn có trước mặt "dữ liệu" bạn có trong đầu. Bạn được phép có một bộ đồng phục trước trong đầu.
Shadowtalker

1
Về cơ bản, Bayes đặt thêm gánh nặng cho nhà phân tích để sử dụng bộ não của cô ngay từ đầu. Cá nhân tôi nghĩ rằng không thích ý tưởng thiết lập các linh mục là một dấu hiệu cho thấy bạn a) quá lười biếng, hoặc b) không thực sự hiểu cách thức thống kê hoạt động (cần một người để biết một, v.v.). Tôi nói rằng thật khó để định lượng các linh mục trong câu trả lời của tôi; Tôi thực sự không đồng ý với điều đó trong thực tế. Một điều bạn luôn có thể làm là vẽ một đường cong hình chuông trên một trang và tự hỏi mình "tôi có mong đợi dữ liệu của mình trông như thế không?" Nếu không, bắt đầu điều chỉnh đường cong. Và nếu bạn không thể quyết định vị trí gắn chế độ, hãy sử dụng một siêu nhân.
Shadowtalker

2
Một câu hỏi (không có nghĩa là bực bội): bạn có biết có một tài liệu về (định lượng) gạ gẫm niềm tin trước đó, phải không? Bao gồm niềm tin được công bố, phỏng vấn niềm tin chuyên gia và không chuyên gia, và niềm tin tự. Lý do tôi hỏi, là tôi đã nghe khiếu nại này trước đây, nhưng các tác giả của những khiếu nại như vậy nghĩ rằng sự phản đối của họ là kết thúc cuộc thảo luận, thay vì bắt đầu một cuộc điều tra.
Alexis

1
@CliffAB Thú vị về câu lạc bộ Tôi chưa đọc sâu về văn học đó (Bernardo, Kaas, Garthwaite ... từ vài thập kỷ trước) nhưng đó là khoa học đầy giá trị đối với bạn: những niềm tin khác nhau cho biết liệu người ta thích phương pháp thường xuyên hay phương pháp Bayes. ;)
Alexis

5

Theo ý kiến ​​khiêm tốn của tôi, số liệu thống kê Bayes bị một số nhược điểm mâu thuẫn với việc sử dụng rộng rãi (trong SPC nhưng trong các lĩnh vực nghiên cứu khác):

  1. Thật khó để có được ước tính so với đối tác thường xuyên của nó (phần rộng nhất của các lớp về thống kê áp dụng cách tiếp cận thường xuyên. Nhân tiện, sẽ rất thú vị khi điều tra xem đây là nguyên nhân hay ảnh hưởng của sự phổ biến hạn chế của thống kê Bayes ).

  2. Rất thường các thống kê Bayes áp đặt các lựa chọn về các cách xử lý khác nhau cho cùng một vấn đề (ví dụ: cách nào là tốt nhất trước đây?), Không chỉ nhấp và xem (dù sao, cách tiếp cận này cũng không nên được khuyến khích theo khuôn khổ thường xuyên).

  3. Thống kê Bayes có một số chủ đề khó quản lý bởi các nhà thống kê rất ít kinh nghiệm (ví dụ, các linh mục không phù hợp );

  4. Nó đòi hỏi các phân tích độ nhạy (thường được tránh trong khuôn khổ thường xuyên) và các ngoại lệ được thực hiện cho một số chủ đề, chẳng hạn như phân tích dữ liệu bị thiếu.

  5. Nó chỉ có một phần mềm (đáng khen ngợi, có thể tải xuống miễn phí) có sẵn để tính toán.

  6. Phải mất nhiều thời gian hơn để trở thành một nhà nghiên cứu tự trị với Bayesian hơn là với các công cụ thường xuyên.


6
Câu trả lời hay nhưng tôi không đồng ý với điểm 5: Tôi có thể nghĩ ra nhiều phần mềm (miễn phí) khác nhau để phân tích Bayes: WinBUGS, OpenBUGS, JAGS, Stan, PyMC ... và tôi chắc chắn có nhiều hơn nữa. Điều tôi muốn nói là tất cả các phần mềm này đều có đường cong học tập dốc và đòi hỏi một lượng kiến ​​thức thống kê và lập trình kha khá.
COOLSerdash

COOLSerdash là đúng và tôi hoan nghênh cả làm rõ và bình luận. Sự thiếu toàn diện của tôi trong việc liệt kê các phần mềm phân tích Bayes có lẽ chỉ do sự quen thuộc (lỏng lẻo) của tôi với WinBugs.
Carlo Lazzaro

@CarloLazzaro Tôi đồng ý với quan điểm của COOLSerdash về số 5, cũng như: Kể từ phiên bản 14, gói số liệu thống kê chính được cấp phép riêng tư Stata hiện kết hợp các mô hình Bayesian và ước tính trong gói vanilla. Tôi nghĩ rằng tính khả dụng tính toán Bayes sẽ chỉ phát triển. Nhưng những điểm khác của bạn rất quan trọng và sẽ giúp thông báo chương trình nghị sự cho những người đề xuất Bayes.
Alexis

@Alexis: là một người dùng Stata Tôi hài lòng với hương vị Bayes khá gần đây của nó. Như một suy nghĩ tổng quát hơn, tôi sẽ bảo đảm việc học cả hai cách tiếp cận thường xuyên và Bayes trong các lớp thống kê tại trường đại học (có lẽ các nhà nghiên cứu có khả năng bắt đầu càu nhàu !!).
Carlo Lazzaro

3

Một lý do là số liệu thống kê Bayes đã bị đóng băng khỏi dòng chính cho đến khoảng năm 1990. Khi tôi đang nghiên cứu thống kê vào những năm 1970, nó gần như là dị giáo (không phải ở khắp mọi nơi, nhưng trong hầu hết các chương trình sau đại học). Nó không giúp được rằng hầu hết các vấn đề thú vị là không thể khắc phục được. Do đó, gần như tất cả những người đang giảng dạy thống kê ngày nay (và xem xét các bài báo cho các tạp chí và thiết kế chương trình giảng dạy) đều được đào tạo như một người thường xuyên. Mọi thứ bắt đầu thay đổi vào khoảng năm 1990 với việc phổ biến các phương pháp Markov Chain Monte Carlo (MCMC) đang dần tìm đường vào các gói như SAS và Stata. Cá nhân tôi nghĩ rằng chúng sẽ phổ biến hơn nhiều trong 10 năm nữa mặc dù trong các ứng dụng chuyên biệt (SPC) chúng có thể không có nhiều lợi thế.

Một nhóm đang đùa giỡn làm cho phân tích Bayes có sẵn rộng rãi hơn là nhóm phát triển gói STAN (mc-stan.org).


Chào mừng đến với trang web của chúng tôi! Chỉ cần lưu ý rằng đó là "Stata" chứ không phải "STATA" - Tôi đã sử dụng sai mục đích của người dùng Stata khi tôi tự viết hoa! (Tôi nghĩ nó giống như SAS, SPSS, v.v., nhưng dường như không ...)
Silverfish
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.