ý nghĩa của việc tích hợp số là quá đắt?


12

Tôi đang đọc về suy luận Bayes và tôi đã bắt gặp cụm từ "tích hợp số của khả năng cận biên là quá đắt"

Tôi không có nền tảng về toán học và tôi đã tự hỏi chính xác thì đắt ở đây nghĩa là gì? Có phải chỉ là về sức mạnh tính toán hoặc có một cái gì đó nhiều hơn.


6
Điều đó có nghĩa là nó tốn quá nhiều sức mạnh tính toán, có thể là về thời gian của CPU (vì tất cả các tài nguyên tính toán đều chủ yếu là bộ nhớ hoặc CPU).
Sycorax nói phục hồi Monica

3
Trên thực tế, đôi khi băng thông truyền thông có thể trở thành một vấn đề (ví dụ giữa bộ đệm / RAM / đĩa một cách an toàn hoặc giữa các nút tính toán song song).
GeoMatt22

Điều đó có nghĩa là phải mất quá nhiều thời gian, đối với một máy tính, chúng tôi cho một mạng máy tính, để thực hiện tính toán.
Jack Maddington

2
Và nếu khả năng cận biên là cần thiết trong một số vòng lặp, thì cái được tính là quá đắt sẽ ít hơn nhiều. Ví dụ. một thói quen tích hợp 1 giây nghe có vẻ nhanh, nhưng nó có thể "quá đắt" nếu bạn cần thực hiện 1 triệu lần ...
Matthew Gunn

Đắt tiền về nỗ lực tính toán, vì nó tốn nhiều công sức hơn để tính toán nó hơn mức bạn có thể chi trả, vì nó tốn quá nhiều thời gian hoặc cần quá nhiều bộ xử lý để làm trong một thời gian hợp lý.
dùng253751

Câu trả lời:


16

Trong bối cảnh các vấn đề tính toán, bao gồm các phương pháp số cho suy luận Bayes, cụm từ "quá đắt" thường có thể đề cập đến hai vấn đề

  1. một đặc biệt vấn đề là quá "lớn" để tính toán cho một "đặc biệt ngân sách "
  2. một cách tiếp cận chung quy mô xấu, tức là có độ phức tạp tính toán cao

Trong cả hai trường hợp, tài nguyên tính toán bao gồm "ngân sách" có thể bao gồm những thứ như chu kỳ CPU ( độ phức tạp thời gian ), bộ nhớ ( độ phức tạp không gian ) hoặc băng thông truyền thông ( trong hoặc giữa các nút tính toán). Trong trường hợp thứ hai, "quá đắt" có nghĩa là khó hiểu .

Trong bối cảnh tính toán Bayes, trích dẫn có khả năng đề cập đến các vấn đề với lề ngoài một số lượng lớn các biến .

Ví dụ, bản tóm tắt của bài báo gần đây này bắt đầu

Sự tích hợp bị ảnh hưởng bởi lời nguyền của chiều và nhanh chóng trở nên khó hiểu khi tính chiều hướng của vấn đề tăng lên.

và tiếp tục nói

Chúng tôi đề xuất một thuật toán ngẫu nhiên mà ... lần lượt có thể được sử dụng để tính toán biên hoặc lựa chọn mô hình.

(Để so sánh, chương sách gần đây này thảo luận về các phương pháp được coi là "không quá đắt".)


4
Đây là một câu trả lời tuyệt vời. Tuy nhiên, tôi sẽ chỉ nói thêm rằng "đắt" có thể ngày càng được thực hiện theo đúng nghĩa đen. - người ta có thể tăng sức mạnh tính toán và lưu trữ đáng kể (lên mức siêu máy tính, miễn là có nhu cầu), rất dễ dàng trong những ngày này (và khá rẻ) ... nhưng đối với các vấn đề lớn, nó vẫn sẽ quá đắt - - theo nghĩa đen nó sẽ tiêu tốn nhiều tiền hơn so với số tiền bạn có sẵn.
Glen_b -Reinstate Monica

1
@Glen_b đó là một điểm tốt! Tôi tưởng tượng ý nghĩa này ít phổ biến hơn trong các tài liệu đã xuất bản ... nhưng phổ biến hơn trong các đề xuất (và đánh giá của họ!)
GeoMatt22

@ GeoMatt22 Đó thực sự là một cách khác để nói cùng một ý nghĩa, nếu bạn nghĩ về nó.
dùng253751

@ GeoMatt22 Cảm ơn bạn! Bây giờ tôi hoàn toàn hiểu ý nghĩa đắt đỏ trong bối cảnh Bayes.
Discretetimeisnice

10

Tôi sẽ cho bạn một ví dụ về trường hợp riêng biệt để cho thấy tại sao tích hợp / tổng lại rất tốn kém.

100P(X1,X2,,X100)2100

P(X1)

P(X1)=X2X3X100P(X1,X2,,X100)

99299

Trong tài liệu mô hình đồ họa xác suất , cách tính phân phối biên như vậy được gọi là phương pháp "vũ phu" để thực hiện "suy luận". Theo tên, chúng ta có thể biết nó là đắt tiền. Và mọi người sử dụng nhiều cách khác để thực hiện suy luận, ví dụ, có được sự phân phối biên hiệu quả. "Những cách khác" bao gồm suy luận gần đúng , v.v.


3
Có lẽ bạn cũng có thể nhận xét về lý do tại sao phương pháp Bayes hữu ích ở đây, như câu hỏi được đặt ra trong bối cảnh này.
Tim

5

Thông thường, khi thực hiện suy luận Bayes, rất dễ gặp phải sự tích hợp nặng nề đối với các biến phiền toái chẳng hạn. Một ví dụ khác có thể là lấy mẫu số như trong trường hợp này từ hàm khả năng, nghĩa là thực hiện lấy mẫu ngẫu nhiên từ một phân phối nhất định. Khi số lượng tham số mô hình tăng lên, việc lấy mẫu này trở nên cực kỳ nặng nề và các phương pháp tính toán khác nhau đã được phát triển để tăng tốc thủ tục và cho phép thực hiện rất nhanh, tất nhiên giữ được độ chính xác cao. Những công cụ này chẳng hạn như MC, MCMC, Metropolis ecc. Hãy xem phân tích dữ liệu Bayes của Gelman et. al nó sẽ cung cấp cho bạn một giới thiệu rộng rãi! chúc may mắn


3
Câu trả lời này dường như không giải quyết được câu hỏi chính của OP xung quanh ý nghĩa của "đắt đỏ" trong bối cảnh này. Hoặc ít nhất là không rõ ràng lắm.
Shufflepants

Giải thích ngắn gọn là giới thiệu cho người đọc về ý nghĩa của nhu cầu tính toán khi thực hiện phân tích cụ thể trong thống kê Bayes, vì nó tuyên bố không phải là một nhà toán học. Dù sao, hy vọng điều đó đã rõ ràng với ai đó
Lcol
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.