Có thể hiểu mô hình pareto / nbd về mặt khái niệm?


12

Tôi đang học cách sử dụng gói BTYD sử dụng mô hình Pareto / NBD để dự đoán khi nào sẽ có một khách hàng sẽ quay trở lại. Tuy nhiên, tất cả các tài liệu về mô hình này chứa đầy toán học và dường như không có một lời giải thích đơn giản / khái niệm nào về hoạt động của mô hình này. Có thể hiểu mô hình Pareto / NBD cho người không học toán không? Tôi đã trải qua bài báo nổi tiếng này của Fader . Mô hình Pareto / NBD đưa ra các giả định sau:

Tôi. Trong khi hoạt động, số lượng giao dịch được thực hiện bởi một khách hàng trong một khoảng thời gian dài t được phân phối Poisson với tỷ lệ giao dịch.

ii. Sự không đồng nhất về tỷ lệ giao dịch giữa các khách hàng tuân theo phân phối gamma với tham số hình dạng r và tham số tỷ lệ α.

iii. Mỗi khách hàng có một vòng đời dài không quan sát được. Điểm này tại đó khách hàng không hoạt động được phân phối theo cấp số nhân với tỷ lệ bỏ học.

iv) Sự không đồng nhất về tỷ lệ bỏ học giữa các khách hàng tuân theo phân phối gamma với tham số hình dạng s và tham số tỷ lệ.

v. Tỷ lệ giao dịch và tỷ lệ bỏ học có thể thay đổi độc lập giữa các khách hàng. "

Tôi không hiểu lý do (trực giác đằng sau) các giả định (ii), (iii) và (iv). Tại sao chỉ có những phân phối này, tại sao không phải là những người khác?

Ngoài ra các giả định mô hình BG / NBD là:

i.) Trong khi hoạt động, số lượng giao dịch được thực hiện bởi một khách hàng tuân theo quy trình Poisson với tỷ lệ giao dịch. Điều này tương đương với giả định rằng thời gian giữa các giao dịch được phân phối theo cấp số nhân với tỷ lệ giao dịch

ii) Tính không đồng nhất trong tuân theo phân phối gamma

iii) Sau bất kỳ giao dịch nào, một khách hàng trở nên không hoạt động với xác suất p. Do đó, điểm mà tại đó, khách hàng của bạn bỏ rơi ra được phân phối trên các giao dịch theo phân phối hình học (đã thay đổi) với pmf

iv) Tính không đồng nhất trong p tuân theo phân phối beta

Tính hợp lý (trực quan) của các giả định (ii), (iii) và (iv) cũng không rõ ràng.

Tôi sẽ biết ơn bất kỳ sự giúp đỡ. Cảm ơn.


Bạn có thể thêm một số tài liệu tham khảo cho văn học mà bạn thấy khó khăn?
kjetil b halvorsen

Tôi đã xây dựng nơi mà mọi thứ không rõ ràng. Tôi biết không dễ để mang lại trực giác để chơi nhưng nếu nó có thể, nó sẽ giúp ích rất nhiều. Cảm ơn.
dùng3282777

Câu trả lời:


13

Hãy tưởng tượng bạn là người quản lý mới được bổ nhiệm của một cửa hàng hoa. Bạn đã có một hồ sơ về khách hàng năm ngoái - tần suất họ mua sắm và thời gian kể từ lần truy cập cuối cùng của họ. Bạn muốn biết khách hàng được liệt kê có thể mang lại bao nhiêu doanh nghiệp trong năm nay. Có một vài điều cần xem xét:

[giả định (ii)] Khách hàng có thói quen mua sắm khác nhau.

λλ

Phân phối cần phải có một vài tham số (bạn không nhất thiết phải có nhiều dữ liệu), phải khá linh hoạt (có lẽ bạn không phải là một chuyên gia kinh doanh đọc được suy nghĩ và không biết tất cả về thói quen mua sắm) và để thực hiện các giá trị trong các số thực dương. Phân phối Gamma đánh dấu vào tất cả các ô đó, và được nghiên cứu kỹ lưỡng và tương đối dễ làm việc. Nó thường được sử dụng làm ưu tiên cho các tham số tích cực trong các cài đặt khác nhau.

[giả định (iii)] Bạn có thể đã mất một số khách hàng trong danh sách.

Nếu Andrea đã mua hoa khoảng một tháng một lần mỗi tháng trong năm ngoái, thì đó là một vụ cá cược khá an toàn mà cô ấy sẽ trở lại trong năm nay. Nếu Ben thường mua hoa hàng tuần, nhưng anh ta đã không có mặt trong nhiều tháng, thì có lẽ anh ta đã tìm thấy một cửa hàng hoa khác. Khi lập kế hoạch kinh doanh trong tương lai, bạn có thể muốn tin tưởng vào Andrea nhưng không phải là Ben.

Khách hàng sẽ không cho bạn biết khi nào họ chuyển đến, đó là nơi mà giả định trọn đời không quan sát được của cả hai mô hình. Hãy tưởng tượng một khách hàng thứ ba, Cary. Các mô hình Pareto / NBD và BG / NBD cung cấp cho bạn hai cách khác nhau để suy nghĩ về việc Cary rời khỏi cửa hàng mãi mãi.

Đối với trường hợp Pareto / NBD, hãy tưởng tượng rằng tại bất kỳ thời điểm nào, có một cơ hội nhỏ rằng Cary có thể đi qua một cửa hàng tốt hơn của bạn. Rủi ro vô hạn liên tục này mang đến cho bạn vòng đời theo cấp số nhân - và càng lâu kể từ lần ghé thăm cuối cùng của Cary, anh ta càng được tiếp xúc với các cửa hàng hoa khác (có khả năng tốt hơn).

Trường hợp BG / NBD có nhiều hơn một chút. Mỗi khi Cary đến cửa hàng của bạn, anh ấy cam kết mua một vài bông hoa. Trong khi duyệt, anh ta sẽ xem xét các thay đổi về giá cả, chất lượng và sự đa dạng kể từ lần truy cập trước và điều đó cuối cùng sẽ khiến anh ta quyết định có quay lại lần sau hay tìm cửa hàng khác. Vì vậy, thay vì liên tục gặp rủi ro, Cary có một số xác suất chỉ quyết định rời đi sau mỗi lần mua.

[giả định (iv)] Không phải tất cả khách hàng đều cam kết như nhau đối với cửa hàng của bạn.

Một số khách hàng là nhà quản lý, và chỉ có cái chết - hoặc tăng giá mạnh - sẽ buộc họ rời đi. Những người khác có thể muốn khám phá, và vui vẻ rời khỏi bạn vì lợi ích của cửa hàng hoa hipster mới trên đường phố. Thay vì tỷ lệ bỏ học duy nhất cho tất cả khách hàng, sẽ có ý nghĩa hơn khi phân phối tỷ lệ bỏ học (hoặc xác suất trong trường hợp BG / NBD).

μ(0;1)

Tôi hi vọng cái này giúp được. Hãy nhìn vào bài báo gốc (Schmittlein et al., 1987) nếu bạn chưa có - họ trải qua một số trực giác ở đó.


Cảm ơn cho công việc khó khăn và giải thích rõ ràng. Lý do sử dụng phân phối Gamma là vì nó tương đối dễ làm việc và thường được sử dụng làm ưu tiên cho các tham số tích cực trong các cài đặt khác nhau. Mặc dù hình dạng của hầu hết phân phối gamma (với các giá trị tham số khác nhau) rất dễ hiểu, nhưng để phù hợp với 'Sự không đồng nhất về tỷ lệ giao dịch giữa các khách hàng' với phân phối gamma gần như giảm theo cấp số nhân (đối với k = 1, theta = 2 như trong biểu đồ Wikipedia [ ở đây] vi.wikipedia.org/wiki/Gamma_distribution ) hơi khó hiểu. Chúng ta có loại trừ hành vi đó không?
dùng3282777

1
Ước tính của bạn cho các tham số Gamma sẽ phụ thuộc vào dữ liệu bạn đang làm việc. Toàn bộ vấn đề là phân phối Gamma có thể có các hình dạng khác nhau đáng kể chỉ dựa trên hai tham số và bạn có thể để dữ liệu tự nói lên mà không áp đặt các giả định quá nghiêm ngặt (ít nhiều).
Lyuba B.
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.