Sẽ là khôn ngoan khi xem xét không chỉ mối tương quan của sự tham gia tài nguyên với chi phí, mà còn là lợi tức của chi phí tham gia tài nguyên. Thách thức điển hình là những lợi nhuận đó hầu như luôn được tích lũy hoặc bị trì hoãn. Một trường hợp tích lũy là khi tài nguyên là sự điều chỉnh hoặc cải tiến liên tục của một quá trình mà sự vắng mặt của nó làm chậm việc tạo ra doanh thu. Một trường hợp chậm trễ là khi tài nguyên nghiên cứu phải chịu chi phí mà không ảnh hưởng đến doanh thu trong một khoảng thời gian nhưng việc tạo doanh thu bắt đầu nếu nghiên cứu mang lại kết quả sản xuất có thể là một yếu tố đáng kể trên tổng chi phí của kết quả được giao.
Lý do dữ liệu chi phí tự nó có thể dẫn đến việc học tập không đúng mạng là bởi vì một mạng được đào tạo để giảm, ví dụ, chi phí tiếp thị sẽ bằng không. Điều đó thường sẽ gây ra xu hướng giảm doanh số cho đến khi doanh nghiệp gấp. Không bao gồm lợi nhuận trong thông tin đào tạo, không có học tập hữu ích có thể xảy ra.
Một MLP cơ bản (perceptionron nhiều lớp) sẽ không tìm hiểu các đặc điểm tạm thời của dữ liệu, các khía cạnh tích lũy và trì hoãn. Bạn sẽ cần một mạng lưới nhà nước. Loại mạng thành công nhất quán cho loại học tập này khi viết bài này là loại mạng LSTM (bộ nhớ ngắn hạn) hoặc một trong các biến thể phái sinh của nó. Dữ liệu doanh thu và số dư phải được sử dụng cùng với dữ liệu chi phí để đào tạo mạng để dự đoán kết quả kinh doanh cho bất kỳ chuỗi tham gia tài nguyên được đề xuất nào (kế hoạch ngân sách chi tiết đầy đủ).
Hàm mất mát phải cân bằng hợp lý thời hạn với các mục tiêu tài chính trung và dài hạn. Tiền mặt khả dụng tiêu cực sẽ tạo ra sự gia tăng rõ rệt trong chức năng mất mát để tránh những rủi ro cơ bản đối với danh tiếng và chi phí tín dụng được học.
Những cột nào trong dữ liệu của bạn có mối tương quan mạnh với lợi tức đầu tư rất khó xác định trước. Bạn có thể loại trừ ngay các cột phù hợp với bất kỳ một trong các tiêu chí sau.
- Luôn trống
- Các hằng số khác, các hằng số có cùng giá trị cho mỗi hàng
- Những cái luôn có thể được bắt nguồn từ các cột khác
Dữ liệu có thể được giảm theo những cách khác
- Mô tả đầy đủ dữ liệu bằng cách mô tả xu hướng theo những cách đơn giản
- Sử dụng các chỉ mục để chỉ định các chuỗi dài với độ chính xác 100% bằng cách gán cho mỗi chuỗi một số
- Nén
- Mặt khác, giảm sự dư thừa trong dữ liệu
RBM (máy Boltzmann bị hạn chế) có thể trích xuất các tính năng từ dữ liệu và PCA có thể chiếu sáng các cột nội dung thông tin thấp, nhưng tầm quan trọng của các cột về mối tương quan với doanh thu sẽ không được xác định bằng các thiết bị này ở dạng cơ bản.