Chọn linh mục dựa trên lỗi đo lường


9

Làm thế nào để bạn tính toán thích hợp trước nếu bạn có lỗi đo lường của một công cụ? Đoạn này trích từ cuốn sách "Thống kê dữ liệu tạm thời" của Cressie:

Thông thường có một số thông tin trước có sẵn về phương sai lỗi đo lường, cho phép một mô hình tham số khá thông tin được chỉ định. Ví dụ: nếu chúng tôi giả sử các lỗi đo lường độc lập có điều kiện là iid , thì chúng tôi nên chỉ định một thông tin trước cho . Giả sử chúng ta đang quan tâm đến nhiệt độ không khí xung quanh, và chúng tôi thấy rằng thông số kỹ thuật của nhà sản xuất nhạc cụ của chỉ ra một “lỗi” của . Giả sử rằng lỗi này, lỗi này tương ứng với 2 độ lệch chuẩn (một giả định cần được kiểm tra!), Sau đó chúng tôi có thể chỉ định để có giá trị trung bình trước làσ 2 ε ± 0,1 ° C σ 2 ε ( 0.1 / 2 ) 2 = 0.0025Gau(0,σϵ2)σϵ2±0,1°Cσε2(0,1/2)2= =0,0025. Do đặc điểm kỹ thuật của nhà sản xuất nhạc cụ, chúng tôi sẽ giả sử một phân phối có đỉnh được xác định rõ ràng và khá hẹp ở mức 0,0025 (ví dụ: gamma nghịch đảo). Trong thực tế, chúng tôi chỉ có thể sửa chữa tại 0,0025; tuy nhiên, lỗi mô hình dữ liệu cũng có thể có các thành phần không chắc chắn khác (Phần 7.1). Để tránh các vấn đề có thể nhận dạng có thể xảy ra với lỗi mô hình quá trình, điều rất quan trọng là các nhà lập mô hình phải giảm độ không chắc chắn theo như Khoa học cho phép, bao gồm cả các nghiên cứu phụ được thiết kế để có dữ liệu sao chép.

Có ai biết thủ tục chung để đạt được các giá trị của một ưu tiên như được mô tả ở trên không (mặc dù đoạn này chỉ đề cập đến việc lấy trung bình trước)?

Câu trả lời:


6

Hai phương pháp tiêu chuẩn

  1. Tham khảo "thông số kỹ thuật của nhà sản xuất dụng cụ", như được nêu trong báo giá. Đây thường là một dự phòng thô được sử dụng khi không có thông tin nào khác, bởi vì (a) những gì nhà sản xuất nhạc cụ thực sự có nghĩa là "chính xác" và "chính xác" thường không xác định và (b) cách công cụ phản hồi khi mới một phòng thí nghiệm thử nghiệm có khả năng tốt hơn nhiều so với nó được thực hiện khi được sử dụng trong lĩnh vực này.

  2. Thu thập các mẫu nhân rộng. Trong lấy mẫu môi trường, có khoảng nửa tá cấp độ mà các mẫu được sao chép thường xuyên (và nhiều cấp độ khác có thể được sao chép), với mỗi cấp được sử dụng để kiểm soát nguồn biến thể có thể gán được. Những nguồn này có thể bao gồm:

    • Danh tính của người lấy mẫu.
    • Các thủ tục sơ bộ, chẳng hạn như giếng khoan, được thực hiện trước khi lấy mẫu.
    • Sự thay đổi trong quá trình lấy mẫu vật lý.
    • Tính không đồng nhất trong chính thể tích mẫu.
    • Những thay đổi có thể xảy ra khi bảo quản và vận chuyển mẫu đến phòng thí nghiệm.
    • Biến thể trong các quy trình thí nghiệm sơ bộ, chẳng hạn như đồng nhất hóa một mẫu vật lý hoặc tiêu hóa nó để phân tích.
    • Việc xác định các nhà phân tích phòng thí nghiệm.
    • Sự khác biệt giữa các phòng thí nghiệm.
    • Sự khác biệt giữa các dụng cụ khác biệt vật lý, chẳng hạn như hai sắc ký khí.
    • Trôi trong hiệu chuẩn dụng cụ theo thời gian.
    • Biến đổi trong ngày. (Điều này có thể là tự nhiên và có hệ thống nhưng có thể xuất hiện ngẫu nhiên khi thời gian lấy mẫu là tùy ý.)

Một đánh giá định lượng đầy đủ của các thành phần biến thiên chỉ có thể thu được bằng cách thay đổi một cách có hệ thống từng yếu tố này theo một thiết kế thí nghiệm phù hợp.

Thông thường chỉ có các nguồn được cho là đóng góp nhiều biến động nhất được nghiên cứu. Chẳng hạn, nhiều nghiên cứu sẽ phân chia một cách có hệ thống một phần mẫu nhất định sau khi chúng được lấy và gửi chúng đến hai phòng thí nghiệm khác nhau. Một nghiên cứu về sự khác biệt giữa các kết quả của những lần phân tách đó có thể định lượng sự đóng góp của chúng đối với sự thay đổi của phép đo. Nếu có đủ các phân chia như vậy, phân phối đầy đủ của biến thiên đo lường có thể được ước tính như trước trong một mô hình không gian thời gian Bayes phân cấp. Bởi vì nhiều mô hình giả định phân phối Gaussian (cho mỗi phép tính), việc có được một Gaussian trước đó cuối cùng đi xuống để ước tính giá trị trung bình và phương sai của sự khác biệt giữa các lần phân tách. Trong các nghiên cứu phức tạp hơn, nhằm xác định nhiều hơn một thành phần của phương sai,

Một trong những lợi ích của việc suy nghĩ về những vấn đề này là chúng giúp bạn xác định các cách để giảm hoặc thậm chí loại bỏ một số thành phần lỗi này (mà không cần phải định lượng chúng), từ đó tiến gần hơn đến lý tưởng "giảm bớt sự không chắc chắn" của Cressie & Wikle nhiều như khoa học cho phép. "

Đối với một ví dụ làm việc mở rộng (trong lấy mẫu đất), xem

Van Ee, Blume và Starks, Cơ sở lý luận cho việc đánh giá lỗi trong lấy mẫu đất. EPA Hoa Kỳ, tháng 5 năm 1990: EPA / 600 / 4-90 / 013.


2
Vấn đề ở đây, Robert, là đôi khi ai đó sẽ báo cáo độ lệch chuẩn cho ước tính; lần khác, họ sẽ báo cáo hai lần (chia hai lần) hoặc khoảng tin cậy hai phía; và đôi khi thậm chí một cái gì đó khác; do đó, không có quy tắc nhất định để chuyển đổi các tuyên bố về độ chính xác và độ chính xác thành các mục sư: bạn phải tham khảo các chú thích và các chi tiết kỹ thuật khác để tìm ra chính xác những gì các con số đại diện. Lỗi tiêu chuẩn của một ước tính, là một hàm của kích thước của mẫu được sử dụng, không liên quan đến mục đích này BTW.
whuber

1
Hiểu rồi. Hãy để tôi thay đổi trọng tâm cho trường hợp thứ hai của bạn. Nếu tôi lặp lại một thử nghiệm một vài lần và thu được các phép đo và , làm thế nào tôi có thể sử dụng thông tin này để thông báo giá trị trung bình và phương sai cho phân phối trước? Bạn đã đề xuất một cái gì đó như cho một số phân chia, phải không? Do đó, tôi có nghĩa là sai số đo và độ lệch chuẩn mẫu . Như vậy đã đủ để đưa nó vào một chưa? m 2 m 1 - m 2 m ε σ ε N ( m ε , σ 2 ε )m1m2m1m2mϵσϵN(mε,σε2)
Robert Smith

1
Bạn không thể đánh giá độ chính xác bằng các phần tách: vì điều đó, bạn cần đo các mẫu của các giá trị đã biết. (Phòng thí nghiệm gaibản sao gai được sử dụng cho việc này.) Điều đó sẽ xác định giá trị trung bình. Thông thường, điều này được xử lý khi hiệu chỉnh quá trình đo, do đó giá trị trung bình được lấy bằng không. Phương sai được ước tính với các công thức ANOVA thông thường. Bạn có thể sử dụng điều đó để chỉ định trước về thành phần tương ứng của hệ thống đo lường.
whuber

2
Không phải như vậy: Tài liệu tham khảo tôi đưa ra là hướng dẫn EPA của Hoa Kỳ đã có từ một phần tư thế kỷ và rất nhiều hướng dẫn gần đây được xây dựng dựa trên ý tưởng của nó. Tôi đã từng sử dụng phương pháp này trong một vụ kiện ở tòa án liên bang để đánh giá ảnh hưởng của lỗi đo lường đối với các đường đồng mức được vẽ (dựa trên công cụ dự báo địa lý) để phân định một ô nhiễm: sai số đo lớn hơn nồng độ được sử dụng để ràng buộc vết loang! (Nói cách khác, sự không chắc chắn trong phân định
vết loang

1
Thực sự tốt đẹp. Nhân tiện, tôi muốn nói rằng các linh mục thường được thiết lập mà không cần quan tâm nhiều. Tôi đã thấy điều này nổi bật hơn trong mô hình Bayes và học máy có lẽ bởi vì một phỏng đoán thường đủ để tạo ra kết quả tốt.
Robert Smith
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.