Thuật toán dự đoán nào có thể được sử dụng để dự đoán một số cho các số khác?


7

Tôi hiện đang tìm kiếm một thuật toán học có giám sát có thể được sử dụng để dự đoán đầu ra được cung cấp một tập huấn luyện đủ lớn.

Đây là một ví dụ đơn giản. Giả sử tập dữ liệu huấn luyện là {[A=1, B=330, C=1358.238902], result=234.244378}và tập dữ liệu kiểm tra{[A=893, B=34, C=293], result=?}

Ý định của tôi là dự đoán ?bằng cách sử dụng các giá trị đầu vào và kết quả được đưa ra trong tập dữ liệu huấn luyện.

Thuật toán nào sẽ có hiệu quả cho vấn đề này với phạm vi rộng của các giá trị đầu vào / đầu ra của tôi? Điều này sẽ yêu cầu một số loại thuật toán hồi quy?


1
1. Bạn cần thêm dữ liệu đào tạo, lý tưởng hơn 10000. 2 Từ kinh nghiệm của tôi, xgboost cho thấy kết quả tốt cho loại dữ liệu đó
Stepan Novikov

1
@StepanNovikov cảm ơn bạn đã giới thiệu - Tôi đã có một bộ đào tạo khá lớn rồi (khoảng 4000+). Tôi cũng sẽ kiểm tra xgboost. Cảm ơn
Cryptonaut

@DukeZhou Tôi nghĩ thuật toán phân loại văn bản..có thể hoạt động trong kịch bản đó.
quintumnia

Câu trả lời:


2

Không thể giải quyết cho đến khi bạn xác định phép đo lỗi (ví dụ | R-R '| hoặc (R-R') ^ 2) và cách lỗi này thay đổi khi A, B và C thay đổi.

Ví dụ cực đoan: R là ngẫu nhiên (không liên quan đến các giá trị A, B, C) nhưng tĩnh. Cho một số giá trị cho A, B, C, bạn chỉ có thể trả lời giá trị của R (A, B, C) nếu A, B, C nằm trong tập huấn luyện. R (A, B, C) không xác định nếu A, B, C không có trong tập huấn luyện.

Hơn nữa, các cải tiến có thể được thực hiện nếu R có một số thuộc tính, ví dụ, nếu có thể nói rằng R (A, B, C) = R (B, A, C) hoặc R (A1, B2, C2) = R (A2, B2, C2) nếu A1 + B1 + C1 = A2 + B2 + C2.


-1

Không nhìn thấy nhiều dữ liệu, thật khó để nói chắc chắn. Nhìn bề ngoài, điều này trông giống như một vấn đề kiểu hồi quy. Như bạn đã đề cập, có rất nhiều sự lây lan trên các giá trị đầu vào, nhưng điều đó không nhất thiết có nghĩa là một cái gì đó như hồi quy tuyến tính sẽ không hoạt động. Hãy thử nó và xem loại hệ số tương quan bạn nhận được. Nếu nó thực sự thấp, có lẽ bạn cần một cách tiếp cận khác, HOẶC dữ liệu thực sự có thể không có bất kỳ (hoặc nhiều) khả năng dự đoán nào trong kịch bản này.

Ngoài hồi quy tuyến tính, bạn có thể thấy rằng có một mối quan hệ toán học phức tạp hơn giữa đầu vào và đầu ra, có thể được xác định bằng hồi quy tượng trưng . Một khả năng khác, nếu có một mối quan hệ phi tuyến tính phức tạp trong trò chơi, đó là một cách tiếp cận mạng thần kinh nhân tạo có thể hoạt động tốt.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.