Tôi có dữ liệu về một loạt các cược thắng và thua trong hơn 5 vòng đặt cược với sự tiêu hao sau mỗi vòng. Tôi đang sử dụng cây quyết định như sau để hiển thị dữ liệu.
Các nút về phía ngọn cây là những nút đang thắng cược và những nút ở phía dưới gốc cây đang có những ván cược thua. Tôi muốn xem xét (a) sự tiêu hao tại mỗi nút (b) thay đổi kích thước đặt cược trung bình tại mỗi nút. Tôi đang xem xét tốc độ tiêu hao tại mỗi nút từ nút trước đó và tỷ lệ sống sót (sử dụng lượng người dự kiến ở mỗi nút nếu xác suất là 50%). Ví dụ: nếu xác suất là 50% tại mỗi nút, trong số 1000 bắt đầu, khoảng 500 người nên ở mỗi nút thứ hai, W và L. Giả thuyết là (a) tỷ lệ tiêu hao cao hơn sau khi mất cược (b) có nghĩa là kích thước đặt cược giảm sau khi thua và tăng sau khi thắng.
Tôi chỉ muốn làm điều này trong một thiết lập đơn giản rất đơn giản đầu tiên. Làm cách nào tôi có thể thực hiện kiểm tra t để hiển thị sự thay đổi kích thước đặt cược trung bình từ nút WW sang nút WWW có ý nghĩa thống kê nếu 50 người đã bỏ cuộc? Tôi không chắc đây là cách tiếp cận đúng: mỗi lần đặt cược tiếp theo là độc lập, nhưng mọi người sẽ bỏ cuộc sau khi thua, do đó mẫu không khớp. Nếu đó chỉ là một trường hợp của cùng một lớp tham gia một loạt các bài kiểm tra lần lượt mà không có ai bỏ học, tôi sẽ hiểu cách thực hiện bài kiểm tra t phù hợp, nhưng tôi nghĩ rằng điều này hơi khác một chút.
Tôi có thể làm cái này như thế nào? Ngoài ra, nếu kết quả bị sai lệch bởi một số ít khách hàng, làm thế nào tôi có thể đưa ra 5% hàng đầu và 5% dưới cùng? Chỉ cần loại bỏ các khách hàng có kích thước cổ phần tích lũy cao nhất từ đặt cược 1 - 3?
Tôi có dữ liệu mà hình được tạo ra, vì vậy tôi có lỗi trung bình, std, std, v.v. tại mỗi nút.