Tôi đang cố gắng để hiểu một số giấy tờ của Mark van der Laan. Ông là một nhà thống kê lý thuyết tại Berkeley, nghiên cứu về các vấn đề chồng chéo đáng kể với học máy. Một vấn đề đối với tôi (bên cạnh toán học sâu) là anh ta thường kết thúc việc mô tả các phương pháp học máy quen thuộc bằng cách sử dụng một thuật ngữ hoàn toàn khác. Một trong những khái niệm chính của ông là "Kỳ vọng tối đa khả năng nhắm mục tiêu".
TMLE được sử dụng để phân tích dữ liệu quan sát bị kiểm duyệt từ một thử nghiệm không được kiểm soát theo cách cho phép ước tính hiệu ứng ngay cả khi có các yếu tố gây nhiễu. Tôi hoàn toàn nghi ngờ rằng nhiều khái niệm tương tự tồn tại dưới các tên khác trong các lĩnh vực khác, nhưng tôi chưa hiểu rõ về nó đủ để khớp trực tiếp với bất kỳ thứ gì.
Một nỗ lực để thu hẹp khoảng cách với "Phân tích dữ liệu tính toán" ở đây:
Và một giới thiệu cho các nhà thống kê là ở đây:
Mục tiêu suy luận nguyên nhân dựa trên khả năng tối đa được nhắm mục tiêu: Phần I
Từ thứ hai:
Trong bài viết này, chúng tôi phát triển một công cụ ước tính khả năng tối đa được nhắm mục tiêu cụ thể về tác động nhân quả của các can thiệp nhiều điểm thời gian. Điều này liên quan đến việc sử dụng siêu học dựa trên tổn thất để có được ước tính ban đầu về các yếu tố chưa biết của công thức tính G, và sau đó, áp dụng hàm dao động tối ưu cụ thể theo tham số mục tiêu (mô hình tham số tối thiểu thuận lợi nhất) cho từng yếu tố ước tính, ước tính (các) tham số biến động với ước tính khả năng tối đa và lặp lại bước cập nhật này của yếu tố ban đầu cho đến khi hội tụ. Bước cập nhật khả năng tối đa được nhắm mục tiêu lặp lại này làm cho công cụ ước tính kết quả của hiệu ứng nhân quả tăng gấp đôi theo nghĩa là nó phù hợp nếu công cụ ước tính ban đầu phù hợp, hoặc ước lượng của hàm dao động tối ưu là phù hợp. Hàm dao động tối ưu được chỉ định chính xác nếu phân phối có điều kiện của các nút trong biểu đồ nhân quả mà người ta can thiệp được xác định chính xác.
Theo thuật ngữ của ông, "siêu học" là học tập với một sơ đồ trọng số không âm về mặt lý thuyết. Nhưng ý anh ta là gì khi "áp dụng hàm dao động tối ưu cụ thể cho tham số đích (mô hình con tham số tối thiểu thuận lợi nhất) cho từng yếu tố ước tính".
Hoặc chia nó thành ba câu hỏi riêng biệt, liệu TMLE có song song trong học máy không, "mô hình con tham số ít thuận lợi nhất" là gì và "hàm biến động" trong các lĩnh vực khác là gì?