Ý tưởng cho mô hình tính điểm tiềm năng


8

Tôi phải suy nghĩ về một mô hình để xác định khách hàng tiềm năng (công ty) có cơ hội chuyển đổi thành khách hàng cao và tôi đang tìm kiếm lời khuyên về loại mô hình nào có thể được sử dụng.

Các cơ sở dữ liệu tôi sẽ phải là, như xa như tôi biết (tôi không có họ chưa), các list of current clients(nói cách khác, converted prospects) và các tính năng của họ ( size, revenue, age, location, công cụ như thế), và một list of prospects(mà tôi phải điểm ) và các tính năng của chúng. Tuy nhiên, tôi không nghĩ rằng tôi sẽ có một danh sách các công ty từng là khách hàng tiềm năng nhưng việc chuyển đổi thành khách hàng đã thất bại (nếu tôi có, tôi nghĩ rằng tôi có thể đã chọn một khu rừng ngẫu nhiên. Tất nhiên tôi vẫn có thể sử dụng một khu rừng ngẫu nhiên, nhưng tôi cảm thấy sẽ là một ý tưởng tồi khi điều hành một khu rừng ngẫu nhiên trên sự kết hợp của hai cơ sở dữ liệu của tôi và đối xử với khách hàng cũng như khách hàng convertedtiềm năng như non-converted...)

Vì vậy, tôi cần tìm, trong danh sách khách hàng tiềm năng, những người trông giống như các khách hàng đã có sẵn. Tôi có thể sử dụng loại mô hình nào để làm điều đó?

(Tôi cũng đang suy nghĩ về những điều như "đánh giá giá trị của khách hàng và áp dụng điều này cho các khách hàng tiềm năng tương tự" và "đánh giá cơ hội mà mỗi khách hàng tiềm năng sẽ rời khỏi doanh nghiệp" để tiếp tục tinh chỉnh giá trị ghi điểm của tôi, nhưng nó nằm ngoài phạm vi câu hỏi của tôi).

Cảm ơn

Câu trả lời:


7

Tôi đã phải đối mặt với kịch bản gần như chính xác một năm rưỡi trước - về cơ bản những gì bạn có là một biến thể của vấn đề phân loại một lớp (OCC), cụ thể là học PU (học từ dữ liệu Tích cực và Không ghi nhãn). Bạn có bộ dữ liệu tích cực ( khách hàng ) đã biết và được gắn nhãn của khách hàng tiềm năng ( một số trong đó giống như khách hàng và một số không giống khách hàng ). Nhiệm vụ của bạn là xác định khách hàng giống như khách hàng tiềm năng nhất và nhắm mục tiêu đến họ ... điều này dựa trên giả định rằng khách hàng tiềm năng trông giống khách hàng nhấtnhiều khả năng chuyển đổi hơn so với khách hàng tiềm năng trông giống khách hàng hơn .

Cách tiếp cận chúng tôi giải quyết khi sử dụng một thủ tục gọi là kỹ thuật Spy . Ý tưởng cơ bản là bạn lấy một mẫu từ lớp tích cực đã biết của bạn và tiêm chúng vào bộ không ghi nhãn của bạn. Sau đó, bạn huấn luyện một trình phân loại trên dữ liệu kết hợp này và sau đó chạy lại tập hợp không ghi nhãn thông qua trình phân loại được đào tạo gán cho mỗi trường hợp xác suất trở thành một thành viên lớp tích cực. Trực giác là các dương tính được tiêm ( được gọi là gián điệp) nên hành xử tương tự như các trường hợp tích cực (như được phản ánh bởi xác suất sau của họ). Bằng cách đặt ngưỡng, điều này cho phép bạn trích xuất các trường hợp tiêu cực đáng tin cậy từ tập hợp không ghi nhãn. Bây giờ, có cả dữ liệu được dán nhãn tích cực và tiêu cực và bạn có thể xây dựng một trình phân loại bằng bất kỳ thuật toán phân loại tiêu chuẩn nào bạn chọn. Về bản chất, với kỹ thuật gián điệp, bạn khởi động dữ liệu của mình để cung cấp cho bạn các trường hợp tiêu cực cần thiết để đào tạo phù hợp.

kỹ thuật gián điệp

Để bắt đầu, bạn nên tìm hiểu công việc của Li và Liu, người có nhiều bài viết tìm hiểu về chủ đề OCC và PU-learning.

Giấy tờ học tập OCC và PU


Câu trả lời tuyệt vời, cảm ơn. (Chỉ một nhận xét: không có gì lạ với câu cuối của đoạn đầu tiên của bạn phải không?)
François M.

cảm ơn vì đã chỉnh sửa - bạn cũng có thể xem xét các giải pháp đóng gói sẵn ... ví dụ: một lớp SVM, ví dụ: cran.r-project.org/web/packages/e1071/vignettes/svmdoc.pdf
Brandon Loudermilk
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.