Thế nào là từ chối trong hội nghị trực tuyến và làm thế nào nó có thể được sử dụng để tăng độ chính xác của một mô hình?


10

Ai có thể giải thích chi tiết:

  1. Từ chối suy luận có nghĩa là gì?
  2. Làm thế nào nó có thể được sử dụng để tăng độ chính xác của mô hình của tôi?

Tôi có ý tưởng từ chối suy luận trong ứng dụng thẻ tín dụng nhưng phải vật lộn với suy nghĩ sử dụng nó để tăng độ chính xác cho mô hình của tôi.

Câu trả lời:


23

Trong xây dựng mô hình tín dụng, từ chối suy luận là quá trình suy luận hiệu suất của các tài khoản tín dụng đã bị từ chối trong quy trình đăng ký.

Khi xây dựng mô hình rủi ro tín dụng ứng dụng, chúng tôi muốn xây dựng mô hình có khả năng áp dụng " xuyên suốt ", nghĩa là chúng tôi nhập tất cả dữ liệu ứng dụng vào mô hình rủi ro tín dụng và mô hình đưa ra xếp hạng rủi ro hoặc xác suất mặc định Vấn đề khi sử dụng hồi quy để xây dựng mô hình từ dữ liệu trong quá khứ là chúng tôi chỉ biết hiệu suất của tài khoản cho các ứng dụng được chấp nhận trong quá khứ. Tuy nhiên, chúng tôi không biết hiệu suất của việc từ chối, vì sau khi áp dụng, chúng tôi đã gửi chúng ra khỏi cửa. Điều này có thể dẫn đến sai lệch lựa chọn trong mô hình của chúng tôi, bởi vì nếu chúng tôi chỉ sử dụng "chấp nhận" trong mô hình của mình, mô hình có thể không hoạt động tốt trên dân số "qua cửa".

Có nhiều cách để đối phó với suy luận từ chối, tất cả đều gây tranh cãi. Tôi sẽ đề cập đến hai cái đơn giản ở đây.

  • "Xác định từ chối quá khứ là xấu"
  • Bưu kiện

"Xác định các từ chối trong quá khứ là xấu" chỉ đơn giản là lấy tất cả dữ liệu ứng dụng bị từ chối và thay vì loại bỏ nó khi xây dựng mô hình, gán tất cả chúng là xấu. Phương pháp này thiên vị rất nhiều mô hình đối với chính sách chấp nhận / từ chối trong quá khứ.

"Parceling" phức tạp hơn một chút. Nó bao gồm

  1. Xây dựng mô hình hồi quy với quá khứ "chấp nhận"
  2. Áp dụng mô hình cho các từ chối trong quá khứ để gán xếp hạng rủi ro cho chúng
  3. Sử dụng xác suất mặc định dự kiến ​​cho mỗi xếp hạng rủi ro, chỉ định các ứng dụng bị từ chối là tốt hoặc xấu. Ví dụ: nếu xếp hạng rủi ro có xác suất mặc định là 10% và có 100 ứng dụng bị từ chối rơi vào xếp hạng rủi ro này, hãy gán 10 từ chối cho "xấu" và 90 từ chối thành "tốt".
  4. Xây dựng lại mô hình hồi quy bằng các ứng dụng được chấp nhận và giờ đây hiệu năng được suy ra của các ứng dụng bị từ chối

Có nhiều cách khác nhau để thực hiện các bài tập tốt hay xấu trong bước 3 và quy trình này cũng có thể được áp dụng lặp đi lặp lại.

Như đã nêu trước đó, việc sử dụng từ chối suy luận đang gây tranh cãi và thật khó để đưa ra câu trả lời thẳng thắn về cách sử dụng nó để tăng độ chính xác của các mô hình. Tôi sẽ chỉ trích dẫn một số người khác về vấn đề này.

Jonathan Crook và John Banasik, Liệu bác bỏ suy luận có thực sự cải thiện hiệu suất của các mô hình chấm điểm ứng dụng?

Đầu tiên, ngay cả khi một tỷ lệ rất lớn người nộp đơn bị từ chối, phạm vi cải thiện mô hình chỉ được tham số hóa trên những người được chấp nhận có vẻ khiêm tốn. Trong đó tỷ lệ loại bỏ không quá lớn, phạm vi đó dường như rất nhỏ.

David Hand, "Suy luận trực tiếp trong hoạt động tín dụng", xuất hiện trong Sổ tay chấm điểm tín dụng, 2001

Một số phương pháp đã được đề xuất và được sử dụng và, trong khi một số trong số đó rõ ràng là kém và không bao giờ nên được đề xuất, không có phương pháp tốt nhất duy nhất nào về khả năng áp dụng trừ khi có thêm thông tin. Đó là, giải pháp tốt nhất là có được nhiều thông tin hơn (có lẽ bằng cách cấp các khoản vay cho một số từ chối tiềm năng) về những người nộp đơn rơi vào khu vực từ chối.


1
+1 để biết tổng quan sâu rộng. Bây giờ tôi cũng biết từ chối suy luận là gì :)
mpiktas

1
cảm ơn. nhưng làm thế nào để bạn chỉ định trong bước 3? Tôi đã đọc rằng sử dụng 1 hoặc 0, bạn có thể sử dụng xác suất cho mỗi dòng. Vì vậy, bạn sẽ có cùng một người với 10% và 90%. Làm thế nào điều này có thể làm việc với một sáng tạo mô hình logistic mới?
GabyLP

1

@GabyLP trong các bình luận trước. Dựa trên kinh nghiệm của tôi, bạn có thể chia các khách hàng đó thành hai phần và gán trọng số cho cả hai phần tách theo xác suất. Ví dụ: nếu một khách hàng bị từ chối có 10% PD, bạn có thể tạo hai khách hàng trong số này. Đầu tiên có biến mục tiêu 1 và trọng số 0,1 và thứ hai có biến mục tiêu 0 và trọng số 0,9.

Toàn bộ mẫu khách hàng được chấp nhận sẽ có trọng số == 1.

Trong khi điều này hoạt động với hồi quy logistic, nó không hoạt động với các mô hình dựa trên cây.


Bạn có một nguồn cho tuyên bố của bạn?
T. màu be

Nếu câu hỏi là về nó không hoạt động trên các mô hình dựa trên cây thì câu trả lời của tôi là - kinh nghiệm cá nhân. Tôi đã cố gắng thực hiện phương pháp này nhưng không thành công.
MiksL
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.