Tôi có một bộ dữ liệu xem xét các đơn xin nhập cư và chấp nhận thị thực (cấp thị thực). Tỷ lệ được tính cho "chấp nhận" và "từ chối" các đơn xin thị thực.
Tuy nhiên, bộ dữ liệu cũng có các giá trị cho các trường hợp đã bị đóng. Thông thường, đây là khi người nhập cư ngừng hiển thị các cuộc hẹn, di cư ở nơi khác hoặc chết. Bởi vì những con số này không được sử dụng khi tỷ lệ được tính toán, tỷ lệ thường hiển thị là thiếu (vì các trường hợp không được chấp nhận cũng không bị từ chối).
Điều đó đang được nói, nếu các trường hợp duy nhất trong năm đó là "nếu không đóng cửa", liệu có bao giờ được bỏ những quan sát này? Một phần của vấn đề mà tôi gặp phải là những năm ngẫu nhiên trong bộ dữ liệu sẽ bị loại bỏ, bởi vì các quyết định duy nhất cho năm đó đã bị đóng.
Các trường hợp đóng cửa khác rất tùy tiện, và như tôi đã đề cập, rất có thể là những trường hợp người nhập cư di cư ở nơi khác, và có lẽ chỉ sử dụng quốc gia đầu tiên làm nơi quá cảnh tạm thời. Dữ liệu không nói cụ thể lý do tại sao những người nhập cư rời đi, tại sao họ bị đóng cửa, v.v. Tôi không thực sự chắc chắn làm thế nào để đối phó với những giá trị còn thiếu này. Tôi không tin rằng các phương pháp cắt bỏ tiêu chuẩn sẽ hoạt động ở đây, do tính toán tỷ lệ (nhưng tôi có thể sai).