Thứ hạng quan trọng thay đổi hữu ích cho là gì?


25

Tôi đã trở thành một phần của một kẻ hư vô khi nói đến thứ hạng quan trọng khác nhau (trong bối cảnh của các mô hình đa biến các loại).

Thông thường trong quá trình làm việc, tôi được yêu cầu hỗ trợ một nhóm khác tạo ra một thứ hạng quan trọng khác nhau hoặc tạo ra một thứ hạng quan trọng khác nhau từ công việc của tôi. Đáp lại những yêu cầu này, tôi hỏi những câu hỏi sau

Bạn muốn thứ hạng quan trọng thay đổi này để làm gì? Bạn hy vọng học được gì từ nó? Loại quyết định nào bạn muốn thực hiện bằng cách sử dụng nó?

Các câu trả lời tôi nhận được hầu như luôn thuộc một trong hai loại

  • Tôi muốn biết tầm quan trọng của các biến khác nhau trong mô hình của tôi trong việc dự đoán đáp ứng.
  • Tôi muốn sử dụng nó để lựa chọn tính năng, bằng cách loại bỏ các biến quan trọng thấp.

Phản hồi đầu tiên là tautological (tôi muốn một thứ hạng quan trọng thay đổi bởi vì tôi muốn một thứ hạng quan trọng thay đổi). Tôi phải cho rằng những thứ hạng này đáp ứng nhu cầu tâm lý khi tiêu thụ đầu ra của một mô hình đa biến. Tôi có một thời gian khó hiểu điều này, vì xếp hạng các biến "tầm quan trọng" riêng lẻ dường như hoàn toàn từ chối bản chất đa chiều của mô hình trong câu hỏi.

Phản hồi thứ hai về cơ bản giảm xuống một phiên bản không chính thức của lựa chọn ngược , các tội thống kê được ghi lại rõ ràng trong các phần khác của CrossValidated.

Tôi cũng đấu tranh với bản chất không xác định của bảng xếp hạng quan trọng. Dường như có rất ít sự đồng ý về khái niệm cơ bản mà bảng xếp hạng nên được đo lường, mang lại cho họ một hương vị rất đặc biệt. Có nhiều cách để gán điểm quan trọng hoặc xếp hạng, và chúng thường bị nhược điểm và cảnh báo:

  • Chúng có thể phụ thuộc nhiều vào thuật toán, như trong bảng xếp hạng quan trọng trong các khu rừng và gbms ngẫu nhiên.
  • Họ có thể có phương sai rất cao, thay đổi mạnh mẽ với nhiễu loạn dữ liệu cơ bản.
  • Họ có thể chịu đựng rất nhiều từ mối tương quan trong các yếu tố dự đoán đầu vào.

Vì vậy, với tất cả những gì đã nói, câu hỏi của tôi là, một số cách sử dụng có giá trị thống kê của bảng xếp hạng tầm quan trọng thay đổi, hoặc, một lý lẽ thuyết phục (cho một nhà thống kê hoặc giáo dân) cho sự vô ích của mong muốn đó là gì? Tôi quan tâm đến cả lập luận lý thuyết chung và nghiên cứu trường hợp, cái nào sẽ hiệu quả hơn trong việc đưa ra quan điểm.


1
Sử dụng tầm quan trọng thay đổi (từ một số thủ tục hợp lý) để lọc ra các yếu tố dự đoán yếu dường như không phải là một ý tưởng tồi. Bạn có thể làm rõ lý do tại sao bạn nghĩ rằng điều này là xấu?
DSaxton

3
Tôi cho rằng nói chung tôi nghĩ rằng nhiều quy trình thống kê không bị chi phối bởi các yếu tố dự đoán "quan trọng", bởi sự tích lũy của nhiều hiệu ứng nhỏ. Ví dụ, sức mạnh của hồi quy sườn có thể được giải thích bằng cách thừa nhận rõ ràng cấu trúc này. Nói một cách khác, lý do chúng ta nên tin là gì, một tiên nghiệm, trong khái niệm "dự đoán yếu", và tại sao chúng ta nên lọc chúng ra? Và tại sao chúng ta nên sử dụng một thủ tục không chính thức như vậy để làm như vậy khi glmnetcó sẵn?
Matthew Drury

2
Trong bất kỳ lĩnh vực nào mà chúng tôi không phải là chuyên gia, chúng tôi muốn biết điều gì quan trọng cần lo lắng! Nhiều cuốn sách kinh doanh và quản lý dường như là về việc giải thích dài dòng rằng bạn xác định các vấn đề quan trọng và tập trung vào chúng (vâng thực sự). Tôi nghi ngờ rằng việc truyền thông sai ở đây thường bắt đầu với những người không thống kê giả sử rằng có một cách để định lượng tầm quan trọng và đó là công việc của người thống kê để biết cách làm điều đó và không lo lắng cho họ về việc khó khăn như thế nào. Tôi không biết làm thế nào để ít chung chung hơn, nhưng một số cuộc thảo luận ở đây dường như bỏ lỡ những điểm chính trong câu hỏi của bạn.
Nick Cox

Câu trả lời:


8

Tôi đã lập luận rằng tầm quan trọng của biến là một khái niệm trơn , vì câu hỏi này đặt ra. Loại phản hồi đầu tiên mà bạn nhận được cho câu hỏi của mình và hy vọng không thực tế của những người sẽ giải thích kết quả quan trọng khác nhau về mặt nhân quả, như @DexGroves lưu ý, cần ít chi tiết.

Tuy nhiên, để công bằng cho những người sẽ sử dụng lựa chọn lạc hậu, tuy nhiên, ngay cả Frank Harrell cũng cho phép nó là một phần của chiến lược mô hình hóa. Từ trang 97 của Chiến lược mô hình hồi quy của mình , ấn bản thứ 2 (một tuyên bố tương tự nằm ở trang 131 của ghi chú khóa học liên quan ):

  1. Không giới hạn lựa chọn biến bước lùi xuống nếu phân tích quan trọng hơn độ chính xác.

Tuy nhiên, việc sử dụng tiềm năng hạn chế này của lựa chọn lạc hậu là bước 13, bước cuối cùng trước mô hình cuối cùng (bước 14). Nó đến tốt sau những bước đầu tiên quan trọng:

  1. Lắp ráp càng nhiều dữ liệu thích hợp chính xác càng tốt, với các bản phân phối rộng cho các giá trị dự đoán ...
  2. Xây dựng các giả thuyết tốt dẫn đến đặc điểm kỹ thuật của các dự đoán ứng viên có liên quan và các tương tác có thể ...

Theo kinh nghiệm của tôi, mọi người thường muốn bỏ qua bước 2 và để một số quy trình tự động thay thế ứng dụng thông minh về kiến ​​thức vấn đề. Điều này có thể dẫn đến một số sự nhấn mạnh được đặt vào tầm quan trọng khác nhau.

Mô hình đầy đủ của bước 14 của Mitchell được theo sau bởi 5 bước xác nhận và điều chỉnh tiếp theo, với bước cuối cùng:

  1. Phát triển đơn giản hóa cho mô hình đầy đủ bằng cách xấp xỉ nó với bất kỳ mức độ chính xác mong muốn nào.

Như các câu trả lời khác đã lưu ý, có những vấn đề về khả năng hành động, chi phí và sự đơn giản đi vào ứng dụng thực tế của kết quả mô hình hóa. Ví dụ, nếu tôi phát triển một dấu ấn sinh học ung thư mới giúp cải thiện tiên lượng nhưng chi phí 100.000 đô la cho mỗi xét nghiệm, có thể khó thuyết phục các công ty bảo hiểm hoặc chính phủ trả tiền cho xét nghiệm trừ khi nó hữu ích một cách ngoạn mục. Vì vậy, không phải vô lý khi ai đó muốn tập trung vào các biến "quan trọng nhất" hoặc đơn giản hóa một mô hình chính xác thành một mô hình ít chính xác hơn nhưng dễ thực hiện hơn hoặc ít tốn kém hơn.

Nhưng lựa chọn biến và đơn giản hóa mô hình này nên dành cho một mục đích cụ thể và tôi nghĩ đó là nơi khó khăn phát sinh. Vấn đề tương tự như việc đánh giá các sơ đồ phân loại chỉ dựa trên phần trăm các trường hợp được phân loại chính xác. Giống như các lỗi phân loại khác nhau có thể có chi phí khác nhau, các sơ đồ đơn giản hóa mô hình khác nhau có thể có các chi phí khác nhau cân bằng với lợi ích hy vọng của chúng.

Vì vậy, tôi nghĩ rằng vấn đề cần tập trung làm nhà phân tích là khả năng ước tính và minh họa các chi phí và lợi ích này một cách đáng tin cậy với các quy trình mô hình thống kê, thay vì lo lắng quá nhiều về một khái niệm trừu tượng về tính hợp lệ thống kê mỗi se. Ví dụ, các trang 157-8 của các ghi chú lớp của Mitchell được liên kết ở trên có một ví dụ về việc sử dụng bootstrap để hiển thị các giá trị mơ hồ của các dự đoán xếp hạng trong các ô vuông nhỏ nhất; kết quả tương tự có thể được tìm thấy cho các bộ biến được chọn bởi LASSO.

Nếu loại biến thiên trong lựa chọn biến đó không cản trở một ứng dụng thực tế cụ thể của mô hình đó là OK. Công việc là ước tính mức độ và loại rắc rối mà việc đơn giản hóa sẽ dẫn đến.


2
Đây là một câu trả lời tuyệt vời @EdM và khá phù hợp với các ý kiến ​​tôi đã phát triển về vấn đề này. Tôi đặc biệt thích hai điểm của bạn rằng 1) các yếu tố dự đoán không được chấp nhận (vì lý do đạo đức, quy định hoặc kinh doanh) nên được sàng lọc trước khi mô hình hóa, 2) đơn giản hóa mô hình cuối cùng nên dành cho mục đích xác định cụ thể, apriori. Đây thực chất là những điểm tôi thường cố gắng thư giãn với các câu hỏi cho các đối tác kinh doanh của mình.
Matthew Drury

Pr(β0)

Nói như vậy, tôi vẫn tự hỏi liệu có một số khái niệm cơ bản mà các bảng xếp hạng quan trọng đang cố gắng nắm bắt, nếu tất cả chúng chỉ là các cuộc tấn công đột xuất vào một vấn đề thống kê không rõ ràng.
Matthew Drury

1
@MatthewDrury, Frank Harrell cung cấp một cách nguyên tắc để đánh giá "tầm quan trọng của biến", dựa trên tỷ lệ khả năng đăng nhập được giải thích bởi mỗi biến. Đó không phải là những gì các cá nhân kém tinh vi có thể có nghĩa của cụm từ. Giống như bạn, tôi đã sử dụng tỷ lệ số lần LASSO chọn cho từng yếu tố dự đoán, trong số nhiều mẫu bootstrap, là cách tốt nhất tôi có thể nghĩ ra để minh họa cho sự mơ hồ của lựa chọn biến. Điều đó chủ yếu đẩy tôi ra khỏi LASSO và hướng tới hồi quy sườn cho các vấn đề quy mô vừa phải.
EdM

8

Đây hoàn toàn là giai thoại, nhưng tôi thấy tầm quan trọng của biến có ích trong việc xác định sai lầm hoặc điểm yếu trong GBM.

Tầm quan trọng thay đổi cung cấp cho bạn một loại tổng quan mặt cắt ngang lớn của mô hình mà khó có thể có được bằng cách khác. Các biến cao hơn trong danh sách đang thấy nhiều hoạt động hơn (liệu chúng có quan trọng hơn hay không là một câu hỏi khác). Thường thì một người dự đoán hành xử kém (ví dụ như một cái gì đó hướng tới tương lai, hoặc một yếu tố có tính chính xác cao) sẽ bắn lên đầu.

Nếu có sự bất đồng lớn giữa tầm quan trọng của biến trực giác và tầm quan trọng của biến GBM, thường sẽ có một số kiến ​​thức có giá trị hoặc có thể tìm thấy một sai lầm.

Tôi sẽ thêm một câu trả lời thứ ba cho "tại sao bạn hỏi tôi về điều này?" câu hỏi, đó là "bởi vì tôi muốn hiểu những gì nguyên nhân dẫn đến phản ứng của tôi". Eep.


4

Thứ hạng quan trọng thay đổi có vai trò nhất định trong thế giới kinh doanh ứng dụng bất cứ khi nào có nhu cầu ưu tiên số lượng lớn đầu vào tiềm năng cho một quy trình, bất kỳ quy trình nào. Thông tin này cung cấp hướng về chiến lược tập trung để tấn công một vấn đề, làm việc từ hầu hết đến quan trọng nhất, ví dụ, giảm chi phí xử lý, cho rằng các biến có thể sử dụng được và không cố định hoặc các yếu tố cấu trúc miễn dịch với thao tác. Vào cuối ngày, điều này sẽ dẫn đến một thử nghiệm A / B của một số loại.

Tuy nhiên, theo quan điểm của bạn, Matt và như với bất kỳ bảng xếp hạng thứ tự nào, các sắc thái nhỏ hoặc sự khác biệt giữa các biến có thể mơ hồ hoặc bị che khuất, làm tăng tính hữu dụng của chúng.


Tôi hoàn toàn đồng ý với sự hữu ích của xếp hạng biến trong nhiều trường hợp kinh doanh. Nhưng ở đây mối quan tâm của 'các thuật toán khác nhau đưa ra các thứ hạng khác nhau' vẫn chưa được giải quyết. Bạn có bất cứ đề nghị để giải quyết điều đó? Ngoài ra hãy xem câu hỏi của tôi ở đây stats.stackexchange.com/q/251248/71287 và các ý kiến ​​dưới đây.
Aliweb

3
@aliweb Vấn đề khác biệt không có một giải pháp đơn nhất, cố định, đơn nhất. Điểm này là tinh tế như sự phân biệt giữa hệ thống phân cấp và dị nguyên nơi các bảng xếp hạng toàn cầu được tiết lộ, trên thực tế, hoàn toàn cục bộ và nhất thời. Các đánh giá tốt nhất về các tài liệu về tầm quan trọng của biến tương đối có lẽ thuộc về Ulrike Groemping có bài viết khá toàn diện về các số liệu khác nhau hiện có. Ngoài ra, mô-đun và phương pháp R của cô ấy - RELAMPO - là một cách tiếp cận nghiêm ngặt để ước tính tầm quan trọng tương đối như tồn tại.
Mike Hunter

3

Tôi hoàn toàn đồng ý với bạn trong quan điểm lý thuyết. Nhưng theo quan điểm thực tế, tầm quan trọng của biến là rất hữu ích.

Hãy lấy một ví dụ trong đó một công ty bảo hiểm muốn giảm số lượng câu hỏi trong bảng câu hỏi định lượng rủi ro của khách hàng của họ. Bảng câu hỏi càng phức tạp thì khách hàng càng ít mua sản phẩm của họ. Vì lý do đó, họ muốn giảm các câu hỏi ít hữu ích hơn khi duy trì mức độ định lượng rủi ro. Giải pháp thường là sử dụng tầm quan trọng khác nhau để xác định câu hỏi nào sẽ bị xóa khỏi bảng câu hỏi (và có "ít nhiều" cùng một dự đoán về hồ sơ rủi ro của khách hàng tiềm năng).


Tôi hoàn toàn đồng ý với sự hữu ích của xếp hạng biến trong nhiều trường hợp kinh doanh. Nhưng ở đây mối quan tâm của 'các thuật toán khác nhau đưa ra các thứ hạng khác nhau' vẫn chưa được giải quyết. Bạn có bất cứ đề nghị để giải quyết điều đó? Ngoài ra hãy xem câu hỏi của tôi ở đây stats.stackexchange.com/q/251248/71287 và các ý kiến ​​dưới đây.
Aliweb

@aliweb: Tôi nghĩ Matthew đã cung cấp cho bạn một câu trả lời xuất sắc cho câu hỏi của bạn.
Metariat
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.