Tính toán đường cong ROC cho dữ liệu


9

Vì vậy, tôi có 16 thử nghiệm trong đó tôi đang cố gắng xác thực một người từ một đặc điểm sinh trắc học bằng cách sử dụng Hamming Khoảng cách. Ngưỡng của tôi được đặt thành 3,5. Dữ liệu của tôi ở bên dưới và chỉ có bản dùng thử 1 là Tích cực thực sự:

Trial   Hamming Distance
1   0.34
2   0.37
3   0.34
4   0.29
5   0.55
6   0.47
7   0.47
8   0.32
9   0.39
10  0.45
11  0.42
12  0.37
13  0.66
14  0.39
15  0.44
16  0.39

Điểm khó hiểu của tôi là tôi thực sự không chắc chắn về cách tạo đường cong ROC (FPR so với TPR HOẶC FAR so với FRR) từ dữ liệu này. Nó không thực sự quan trọng cái nào, nhưng tôi thực sự bối rối về cách tính toán nó. Bất kỳ trợ giúp sẽ được đánh giá cao.

mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 

Tại đây stats.stackexchange.com/a/105577/49130 bạn có thể tìm thấy một số thông tin bổ sung về cách vẽ đường cong ROC
Alexey Grigorev

Câu trả lời:


7

Tôi đề xuất đồ thị ROC: Ghi chú và cân nhắc thực tế cho các nhà nghiên cứu Reas của Tom Fawcett, thực sự là một bài đọc tuyệt vời. Theo như tôi hiểu câu hỏi của bạn, bạn sẽ tìm thấy mọi thứ bạn cần trong bài viết này.

Chỉnh sửa: Lấy cảm hứng từ Adam Tôi cũng muốn giới thiệu gói R yêu thích của mình cho tác vụ này: ROCR .


Bạn có biết bất kỳ gói Matlab tốt nào có thể hoàn thành công việc không?
rohanbk

@rohanbk Xin lỗi, không. Đó là một thời gian dài kể từ khi tôi đã sử dụng MATLAB.
steffen

@steffen liên kết bị hỏng.
Alleo

@Alleo cảm ơn bạn đã thông báo, liên kết hiện đang trỏ đến citeseer (nơi có sẵn pdf) ... điều này sẽ kéo dài hơn.
steffen

4

Tại sao bạn muốn tạo một đường cong ROC? Bạn có muốn vẽ biểu đồ đường cong cho các biến phụ thuộc của mình không, hoặc bạn đang muốn sử dụng nó làm thống kê kiểm tra để đánh giá độ chính xác của các dự đoán xác suất của bạn (trong trường hợp bạn đang tìm kiếm AUC [khu vực dưới đường cong] ).

Nếu bạn quen thuộc với R, gói xác minh trong R có hai hàm mà bạn sẽ thấy hữu ích: roc.plot (), cho phép bạn vẽ đường cong ROC của bạn và roc.area () sẽ cho phép bạn tính toán AUC.


Bạn có biết bất kỳ gói Matlab tốt nào có thể hoàn thành công việc không?
rohanbk
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.