Kiểm tra tỷ lệ và phân loại nhị phân


10

Tôi có một máy nguyên mẫu sản xuất các bộ phận.

Trong thử nghiệm đầu tiên, máy tạo ra các bộ phận và bộ phân loại nhị phân cho tôi biết rằng các bộ phận bị lỗi ( , thường là và ) và các bộ phận là tốt.N1d1d1<N1d1/N1<0.01N1104N1d1

Sau đó, một kỹ thuật viên thực hiện một số thay đổi trong máy để giảm số lượng các bộ phận bị lỗi.

Trong thử nghiệm thứ hai và tiếp theo, máy được sửa đổi tạo ra các phần và cùng một bộ phân loại nhị phân (chưa được xử lý) cho tôi biết rằng các phần bị lỗi, dù sao thì khá giống với .N2d2d2/N2d1/N1

Kỹ thuật viên muốn biết liệu những thay đổi của anh ấy có hiệu quả không.

Giả sử rằng các phân loại là hoàn hảo (độ nhạy của nó là 100% và độ đặc hiệu của nó là 100%), tôi có thể thực hiện kiểm tra tỷ lệ (với R, tôi chỉ cần gõ prop.test(c(d1,d2),c(N1,N2))).

Nhưng bộ phân loại không hoàn hảo, vậy làm cách nào tôi có thể tính đến độ nhạy và độ đặc hiệu, cả hai chưa biết, của bộ phân loại để trả lời đúng cho kỹ thuật viên?


Bạn có thể xác nhận tỷ lệ chính xác của phân loại?
Michelle

@Michelle Tôi biết không có lỗi và nhưng tôi không biết có bao nhiêu phần bị lỗi được phân loại sai là tốt. d1d2
Alessandro Jacopson

Xin chào lần nữa. Bạn có thể làm một mẫu ngẫu nhiên của các phần tốt từ N1 và N2, để ước tính tỷ lệ dương tính giả không?
Michelle

1
Với thông tin này, bạn có thể sử dụng phương pháp này để so sánh các thay đổi không? onlinel Library.wiley.com/doi/10.1002/sim.906/abab cũng xem tại đây ncbi.nlm.nih.gov/pubmed/18224558 và ý tưởng khác ở đây, toàn văn: stat.colostate.edu/~bradb/ con pdf
Michelle

2
(+1) đây là một câu hỏi tuyệt vời!
steffen

Câu trả lời:


4

Vì vậy, tôi nhận được điều này từ các nguyên tắc đầu tiên, và do đó không chắc chắn nó là chính xác. Đây là suy nghĩ của tôi:

EDIT: Điều này không hoàn toàn đúng trước đây. Tôi đã cập nhật nó.

  1. Hãy để biểu thị sự khác biệt dự kiến ​​giữa số lượng dương thực sự và đầu ra số theo phân loại nhị phân mà chúng ta sẽ gọi là . Bạn có thể đo lường điều này bằng cách chạy trình phân loại của mình trên một tập hợp với các nhãn đã biết. Trừ số lượng dương thực tế khỏi số lượng dương được tạo bởi bộ phân loại, sau đó chia cho để lấy .αd1d1^Nα

  2. Vì vậy, ước tính điểm cho tỷ lệ thực tế của các bộ phận bị lỗi được đưa ra bởi: . Đó là, số lượng các bộ phận bị lỗi được quan sát, ít hơn số lượng dương tính giả dự kiến, cộng với số lượng âm tính giả dự kiến.d1N1^=d1+αN1N1

  3. Tương tự,d2N2^=d2+αN2N2

  4. Vì vậy, bây giờ hãy làm một bài kiểm tra chống đỡ. Trong thử nghiệm chống đỡ tiêu chuẩn, trước tiên chúng tôi tính tỷ lệ gộp được sử dụng làm giá trị null: . Vì vậy, ở đây, chúng tôi đưa vào ước tính điểm của chúng tôi về và để nhận:p=p1N1+p2N2N1+N2d1N1^d2N2^p=d1+d2+α(N1+N2)N1+N2

  5. Và sau đó, lỗi tiêu chuẩn chỉ là thông thường:p(1p)(1N1+1N2)

  6. Và thống kê kiểm tra là như nhau:z=d1N1d2N2se

Một số suy nghĩ về giải thích:

  • Mô hình có thể tạo ra các giá trị tưởng tượng cho lỗi tiêu chuẩn. Điều này sẽ xảy ra khi , đây sẽ là trường hợp khi số lỗi chúng tôi mong đợi các bộ phân loại tạo ra vượt quá số lượng chúng tôi quan sát được. Ví dụ: giả sử rằng chúng tôi hy vọng bộ phân loại của chúng tôi tạo ra trung bình 5 dương ngay cả khi được cung cấp một mẫu không chứa dương. Nếu chúng ta quan sát 4 điểm tích cực, thì dường như không có tín hiệu: Kết quả của chúng tôi không thể phân biệt được với tiếng ồn do bộ phân loại tạo ra. Trong trường hợp này, chúng tôi không nên bác bỏ giả thuyết khống, tôi nghĩ vậy.p<0

  • Một cách khác để suy nghĩ về điều này là, nếu số lượng bộ phận bị lỗi nằm trong phạm vi lỗi của bộ phân loại thì tất nhiên chúng ta không thể biết liệu có sự khác biệt hay không: chúng ta thậm chí không thể biết liệu có bộ phận nào bị lỗi hay không!

Kết hợp các lỗi trong ước tính của :α

  • Tôi đã nghĩ về điều này nhiều hơn nữa và tôi nghĩ có một số cách bạn có thể làm điều này, nhưng về cơ bản bạn muốn có được ước tính về phân phối của . Lý tưởng nhất là bạn sẽ thực hiện việc mua này lặp lại quy trình của mình để có được ước tính trên một mẫu đại diện của các tập dữ liệu mà bạn dự định sử dụng phương pháp này. Nếu điều này là không thể, bạn có thể bootstrap trên một tập dữ liệu duy nhất bằng cách lấy mẫu từ nó, mặc dù điều này không lý tưởng trừ khi datset duy nhất của bạn là đại diện cho tất cả các bộ bạn quan tâm.αα

Giả sử rằng chúng ta muốn tính khoảng tin cậy với độ tin cậy là .h

  • Tính toán thực nghiệm khoảng tin cậy so với bằng cách sử dụng phân phối bootstrapping. Cắm từng điểm cuối vào quy trình ở trên, sử dụng nó làm ước tính điểm (rất bảo thủ hoặc rất tự do) cho và tìm khoảng tin cậy để ước tính tỷ lệ chênh lệch bằng cách sử dụng thử nghiệm prop . Giả sử rằng chúng ta nhận được các khoảng ( và là các khoảng cho các giá trị thấp hơn và cao hơn của . Sau đó, khoảng (chứa cả hai khoảng trước đó) phải là (1-h) * 100% CI cho sự khác biệt về tỷ lệ ... Tôi nghĩ ...h2ααh2lowl,lowr)(highl,highr)α(highl,lowr)

Lưu ý: Trong phần trên tôi giả sử kiểm tra 1 mặt. Bạn chia h cho 2 để giải thích cho thực tế rằng bạn đang kiểm tra hai giả thuyết độc lập ( nằm trong khoảng thời gian bạn nghĩ và thống kê kiểm tra là một sự khác biệt đáng kể). Nếu bạn muốn làm một bài kiểm tra hai đuôi, thay vào đó chia cho 4.α


+1, cảm ơn bạn. Trong 6 bạn đã viết "tĩnh", ý bạn là "thống kê"?
Alessandro Jacopson

Trong điểm đầu tiên của bạn, bạn xem xét đưa ra một lỗi tiêu chuẩn tưởng tượng. Điều gì về (cũng có thể gây ra lỗi tiêu chuẩn tưởng tượng)? Có thể lấy không? p<00<p<10<p<1
Alessandro Jacopson

Trong điểm bullett thứ hai của bạn, bạn đã viết về "phương sai", ý bạn là gì? Sự hiểu biết của tôi là như sau: giả sử tôi lấy một mẫu có kích thước từ những mẫu tốt của thử nghiệm đầu tiên và tìm thấy 7 phần bị lỗi, sau đó nếu tôi giả sử Tôi sẽ bỏ qua mọi phương sai trong . Mặt khác, tôi có thể có được khoảng tin cậy cho (ví dụ với R ) và sau đó kết hợp nó trong mô hình. Tôi có đúng không 0.01(N1d1)100β=7100ββprop.test(7,100)
Alessandro Jacopson

@uvts_cvs Đúng, đó phải là "thống kê". Tôi sẽ sửa nó trong giây lát. Ngoài ra còn có một lỗi đánh máy trong lỗi tính toán, thay vào đó là p * (1-p). P phải luôn là <1, ngoại trừ có thể nếu trình phân loại của bạn thực sự xấu và d lớn. Đối với bình luận thứ ba của bạn, yeah, đó là ý tưởng. Tôi chỉ không chắc chắn làm thế nào để kết hợp ước tính đó vào mô hình. Có lẽ ai khác ở đây biết?
John Doucette

Cảm ơn vì đã chấp nhận, nhưng từ tối qua tôi đã nghĩ thêm về nó (câu hỏi rất hay!), Và có một số ý tưởng về cách kết hợp phương sai trong. Ngoài ra, tôi nhận ra rằng mô hình này không hoàn toàn đúng. Cần nhân với số lượng mẫu âm và với số mẫu mẫu dương . Tôi sẽ làm việc thông qua và cập nhật điều này sau. αβ
John Doucette
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.