Tôi đã hỏi câu hỏi này trên trang web stackexchange của mHRathics và được đề nghị hỏi ở đây.
Tôi đang làm việc trong một dự án sở thích và sẽ cần một số trợ giúp với vấn đề sau.
Một chút bối cảnh
Giả sử có một bộ sưu tập các mặt hàng với một mô tả về các tính năng và giá cả. Hãy tưởng tượng một danh sách các xe và giá cả. Tất cả các xe ô tô đều có một danh sách các tính năng, ví dụ như kích thước động cơ, màu sắc, sức ngựa, mô hình, năm, v.v ... Đối với mỗi sản phẩm, một cái gì đó như thế này:
Ford:
V8, green, manual, 200hp, 2007, $200
V6, red, automatic, 140hp, 2010, $300
V6, blue, manual, 140hp, 2005, $100
...
Đi xa hơn nữa, danh sách những chiếc xe có giá được công bố với một khoảng thời gian có nghĩa là chúng ta có quyền truy cập vào dữ liệu giá lịch sử. Có thể không phải luôn luôn bao gồm chính xác những chiếc xe giống nhau.
Vấn đề
Tôi muốn hiểu làm thế nào để mô hình giá cho bất kỳ chiếc xe nào dựa trên thông tin cơ sở này, quan trọng nhất là những chiếc xe không có trong danh sách ban đầu.
Ford, v6, red, automatic, 130hp, 2009
Đối với chiếc xe trên, nó gần giống như một chiếc trong danh sách, chỉ khác một chút về sức ngựa và năm. Để định giá cái này, cái gì là cần thiết?
Những gì tôi đang tìm kiếm là một cái gì đó thiết thực và đơn giản, nhưng tôi cũng muốn nghe về những cách tiếp cận phức tạp hơn làm thế nào để mô hình hóa một cái gì đó như thế này.
Những gì tôi đã thử
Đây là những gì tôi đã thử nghiệm cho đến nay:
1) sử dụng dữ liệu lịch sử để tra cứu xe X. Nếu không tìm thấy, không có giá. Điều này tất nhiên là rất hạn chế và người ta chỉ có thể sử dụng điều này kết hợp với sự phân rã thời gian để thay đổi giá cho những chiếc xe đã biết theo thời gian.
2) sử dụng sơ đồ tính năng cân bằng ô tô cùng với một mẫu xe có giá. Về cơ bản là có một mức giá cơ bản và các tính năng chỉ thay đổi điều đó với một số yếu tố. Dựa trên điều này, bất kỳ giá xe nào cũng được tính.
Điều thứ nhất được chứng minh là không đủ và lần thứ hai chứng tỏ không phải lúc nào cũng đúng và tôi có thể không có cách tiếp cận tốt nhất để sử dụng trọng số. Điều này cũng có vẻ hơi nặng nề trong việc duy trì trọng lượng, vì vậy đó là lý do tại sao tôi nghĩ có thể có một số cách để sử dụng dữ liệu lịch sử làm thống kê theo một cách nào đó để có được trọng lượng hoặc để có được thứ khác. Tôi chỉ không biết bắt đầu từ đâu.
Các khía cạnh quan trọng khác
- tích hợp vào một số dự án phần mềm tôi có. Hoặc bằng cách sử dụng các thư viện hiện có hoặc tự viết thuật toán.
- tính toán nhanh khi dữ liệu lịch sử mới xuất hiện.
Bất kỳ đề xuất làm thế nào một vấn đề như thế này có thể được tiếp cận? Tất cả các ý tưởng đều được chào đón nhiều hơn.
Cảm ơn rất nhiều trước và mong được đọc những gợi ý của bạn!