Làm thế nào để ước tính độ chính xác của tích phân?


11

Một tình huống cực kỳ phổ biến trong đồ họa máy tính là màu của một số pixel bằng với tích phân của một số chức năng có giá trị thực. Thường thì hàm quá phức tạp để giải quyết một cách phân tích, vì vậy chúng ta còn lại với xấp xỉ bằng số. Nhưng hàm cũng thường rất tốn kém để tính toán, vì vậy chúng tôi bị hạn chế rất nhiều về số lượng mẫu chúng tôi có thể tính toán. (Ví dụ: bạn không thể quyết định lấy một triệu mẫu và để lại ở đây.)

Nói chung, những gì bạn muốn làm là đánh giá hàm tại các điểm được chọn ngẫu nhiên cho đến khi tích phân ước tính trở nên "đủ chính xác". Điều này đưa tôi đến câu hỏi thực tế của tôi: Làm thế nào để bạn ước tính "độ chính xác" của tích phân?


Cụ thể hơn, chúng ta có , được thực hiện bởi một số thuật toán máy tính phức tạp, chậm. Chúng tôi muốn ước tínhf:RR

k=abf(x) dx

Chúng ta có thể tính cho bất kỳ nào chúng ta muốn, nhưng nó đắt tiền. Vì vậy, chúng tôi muốn chọn một vài giá trị một cách ngẫu nhiên và dừng lại khi ước tính cho trở nên chính xác chấp nhận được. Để làm điều này, tất nhiên, chúng ta cần biết ước tính hiện tại thực sự chính xác đến mức nào.f(x)xxk

Tôi thậm chí không chắc công cụ thống kê nào sẽ phù hợp với loại vấn đề này. Nhưng đối với tôi, nếu chúng ta hoàn toàn không biết về , thì vấn đề là không thể giải quyết được. Ví dụ: nếu bạn tính một nghìn lần và nó luôn bằng 0, tích phân ước tính của bạn sẽ bằng không. Nhưng, không biết gì về , vẫn có thể ở mọi nơi ngoại trừ các điểm bạn đã lấy mẫu, vì vậy ước tính của bạn là sai lầm khủng khiếp!ff(x)ff(x)=1,000,000

Có lẽ, sau đó, câu hỏi của tôi nên bắt đầu với "chúng ta cần biết gì về để có thể ước tính độ chính xác của tích phânf ?" Ví dụ, chúng ta thường biết rằng không thể nào là âm, điều này dường như là một thực tế có liên quan cao ...f


Chỉnh sửa: OK, vì vậy điều này dường như đã tạo ra nhiều phản hồi, điều này là tốt. Thay vì trả lời riêng từng người trong số họ, tôi sẽ cố gắng điền vào một số nền tảng bổ sung ở đây.

Khi tôi nói chúng ta biết "không có gì" về , ý tôi là chúng ta có thể tính được , nhưng chúng ta không biết gì thêm về nó. Tôi mong đợi (và các ý kiến ​​dường như đồng ý) rằng có nhiều kiến ​​thức hơn cho phép chúng tôi sử dụng các thuật toán tốt hơn. Có vẻ như việc biết giới hạn trên và / hoặc đạo hàm đầu tiên của sẽ hữu ích.ffff

Trong hầu hết các vấn đề tôi nghĩ đến, thay đổi tùy thuộc vào hình dạng cảnh và vị trí trong cảnh đang xem xét. Đó không phải là một số đại số tốt đẹp, gọn gàng mà bạn có thể phân tích giải quyết. Thông thường đại diện cho cường độ ánh sáng. Rõ ràng cường độ ánh sáng không bao giờ có thể âm, nhưng không có giới hạn về giá trị dương của nó có thể lớn đến mức nào. Và cuối cùng, các cạnh đối tượng thường dẫn đến sự gián đoạn đột ngột trong và thông thường bạn không thể dự đoán những vị trí này ở đâu.fff

Nói tóm lại, rất tệ, vì vậy, cuộc gọi đầu tiên của tôi là hỏi chúng ta có thể làm gì với nó mà không có thêm thông tin nào. Có vẻ như không có ít nhất một số giới hạn trên và dưới, câu trả lời là "không phải là địa ngục của nhiều" ... Vì vậy, có vẻ như tôi cần bắt đầu đưa ra một số giả định để thực hiện bất kỳ bước tiến nào ở đây.f

Ngoài ra, với số lần "Monte Carlo" xuất hiện, tôi đoán đó có phải là thuật ngữ kỹ thuật cho loại tích hợp này không?


Khi bạn nói "nếu chúng ta hoàn toàn không biết gì về ", bạn có ý gì chính xác? Chúng ta có thể tính , phải không? ff
Macro

2
Thông thường, khi bạn tích hợp qua một chức năng đã biết, bạn có thể làm tốt hơn nhiều so với tích hợp Monte Carlo. Monte Carlo hội tụ đến giá trị thực với tỷ lệ , trong đó là số điểm đánh giá. Các thuật toán khác, ví dụ, dựa trên phương pháp bậc hai, sẽ hội tụ với tốc độ hoặc thậm chí nhanh hơn (ví dụ, đối với một hàm định kỳ trong khu vực tích hợp), giả sử mức độ mượt mà của hàm. Vẫn còn những người khác, dựa trên các chuỗi bán ngẫu nhiên (ví dụ: chuỗi Sobol), sẽ hội tụ ở tốc độ trung gian, ví dụ: cho tích hợp -chiều. 1/NN1/N(lnN)n/Nn
jbowman

1
Điều này có câu trả lời rõ ràng nhưng không được trả lời. Câu trả lời cho câu hỏi thứ hai là "không có gì": yêu cầu duy nhất là có thể đo lường được, điều này tiềm ẩn trong việc yêu cầu tích phân của nó. Nhưng sau đó, điều duy nhất bạn có thể làm để lấy mẫu ngẫu nhiên. Với các giả định bổ sung, người ta có thể làm tốt hơn nhiều trong việc ước tính tích phân và đánh giá độ chính xác. Vì vậy, một câu hỏi tốt hơn là "những cải thiện nào trong ước tính độ chính xác có thể đạt được với giả định nào." Nhưng điều này là quá rộng. Do đó, vui lòng cho chúng tôi biết loại chức năng bạn hiện đang xử lý. f
whuber

1
@Macro Quy trình đó không được chấp nhận vì đó là điều tồi tệ nhất bạn có thể làm. Như jbowman chỉ ra, các giả định rất nhẹ về có thể dẫn đến các ước tính tốt hơn nhiều. BTW, thật vô nghĩa khi quy định rằng là "hữu hạn". Nếu đó là một hàm được xác định rõ, tất cả các giá trị của nó là số thực và hữu hạn fortiori . Nếu bạn có nghĩa là "bị ràng buộc", điều đó không có ích gì trừ khi bạn biết trước giới hạn. ff
whuber

1
Các chức năng "Hầu hết" không liên tục ở bất cứ đâu! Trên thực tế, tôi không thấy CLT có thể áp dụng chung như thế nào. có thể là CDF nghịch đảo của bất kỳ phân phối nào, ví dụ, trong trường hợp đó, các bản vẽ Monte-Carlo của bạn được lấy mẫu từ phân phối đó - mà CLT không cần phải áp dụng ngay cả khi chính tích phân (nghĩa là trung bình) tồn tại. Tôi nghĩ rằng OP sẽ hiệu quả hơn nhiều khi thu hẹp câu hỏi và người trả lời làm theo đề xuất của jbowman. f
whuber

Câu trả lời:


2

Để đơn giản, giả sử f (x)> = 0 với mọi x trong [a, b] và chúng ta biết M sao cho f (x) <M với mọi x trong [a, b]. Tích phân I của f trên [a, b] có thể được đặt trong hình chữ nhật có chiều rộng ba và chiều cao M. Tích phân của f là tỷ lệ của hình chữ nhật nằm dưới hàm f nhân với M (ba). Bây giờ nếu bạn chọn các điểm trong hình chữ nhật một cách ngẫu nhiên và tính điểm đó là một thành công nếu nó rơi xuống dưới đường cong và là một thất bại nếu không bạn đã thiết lập một thử nghiệm Bernoulli. Phần mẫu của các điểm bên trong là tỷ lệ nhị thức và do đó có p và phương sai p (1-p) / n có nghĩa là n là số điểm được lấy. Do đó, bạn có thể xây dựng khoảng tin cậy cho p và vì I = p M (ba) khoảng tin cậy cho I cũng vì ước tính I ^ = p ^ M (ba), Var (I ^) = M (ba)22p (1-p) / n. Vì vậy, để sử dụng số liệu thống kê để xác định n nhỏ nhất mà tích phân đủ chính xác, bạn có thể chỉ định giới hạn S trên phương sai của I ^. Lưu ý p (1-p) / n <= 1 / (4n) với mọi 0 <= p <= 1. Vì vậy, đặt S = M (ba) / (4n) hoặc n = số nguyên nhỏ nhất> M (ba) / (4S).2222


3
Điều này sẽ làm việc dưới các giả định bạn đưa ra trong câu đầu tiên nhưng dựa trên mô tả vấn đề có vẻ như không chắc rằng bạn có thể, một tiên nghiệm , ràng buộc các giá trị chức năng giữa và . Dường như tất cả những gì bạn đưa ra là khả năng tính toán và không có gì khác. 0Mf
Macro

1
@Macro Không biết gì về f Tôi không thấy người ta có thể nói gì về độ chính xác thống kê của ước tính tích phân dựa trên việc đánh giá nó tại một tập hợp điểm hữu hạn cố định. Giả định của tôi là khá tối thiểu. Nếu f bị giới hạn trong khoảng [a, b] thì nên có một số M đủ lớn để nó có thể được sử dụng làm giới hạn trên của f.
Michael R. Chernick

Tôi chắc chắn đồng ý với câu đầu tiên của bạn, bắt đầu giải quyết câu hỏi thứ hai của OP. Nhưng, phương pháp bạn đã mô tả yêu cầu bạn, một người tiên phong , biết , đó không phải là một giả định đặc biệt tối thiểu. M
Macro

2
Đó là một giả định. Tôi đã sử dụng thuật ngữ bắt chước để nói rằng tôi đang đưa ra càng ít giả định càng tốt để đạt được câu trả lời dứt khoát.
Michael R. Chernick

Thật là một ý tưởng khéo léo ... Bạn nói đúng, nó không hoạt động mà không có giới hạn đối với , nhưng có vẻ như bạn không thể làm gì nhiều nếu không có thông tin đó. f
Toán học,

8

Đây là một câu hỏi không tầm thường liên quan đến các vấn đề như tổng biến thể của và các phần mở rộng đa biến hợp lý của nó. Nhà thống kê nghệ thuật Stanford Owen đã làm việc về điều này bằng cách sử dụng các kỹ thuật bán ngẫu nhiên Monte Carlo . Monte Carlo thông thường cho phép ước tính trực tiếp độ chính xác của tích phân, nhưng mỗi đánh giá riêng lẻ không chính xác. Quasi-Monte Carlo tạo ra các ước tính chính xác hơn, nhưng đó là một kỹ thuật hoàn toàn xác định và do đó không cho phép ước tính phương sai của kết quả của bạn. Anh ấy đã chỉ ra cách kết hợp hai cách tiếp cận và bài báo của anh ấy rất sáng suốt, vì vậy tôi sẽ không thử sao chép nó ở đây.f

Một bài đọc bổ sung cho điều này tất nhiên sẽ là chuyên khảo của Niederreiter (1992) .


3
(+1) Josef Dick cũng có một số kết quả liên quan khá thú vị gần đây.
Đức hồng y
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.