Điều đầu tiên đầu tiên. Tất cả những gì tôi nói chỉ là sự hiểu biết của tôi. Do đó, như thường lệ, tôi có thể sai.
Henry đúng một phần. Nhưng Kinh tế lượng cũng là một họ phương pháp. Có nhiều phương pháp kinh tế lượng khác nhau có thể được áp dụng tùy thuộc vào câu hỏi nghiên cứu cũng như dữ liệu được cung cấp (mặt cắt ngang so với dữ liệu bảng điều khiển, v.v.).
Học máy theo cách hiểu của tôi là một tập hợp các phương pháp cho phép máy móc học các mẫu từ các quan sát trong quá khứ (thông thường theo cách thức hộp đen). Hồi quy là một công cụ tiêu chuẩn trong kinh tế lượng cũng như học máy vì nó cho phép tìm hiểu mối quan hệ giữa các biến và ngoại suy các mối quan hệ này trong tương lai.
Không phải tất cả các nhà kinh tế lượng đều quan tâm đến việc giải thích nguyên nhân các ước tính tham số (họ hiếm khi có thể yêu cầu giải thích nguyên nhân nếu dữ liệu quan sát (không thử nghiệm) được sử dụng). Thông thường, giống như trong trường hợp dữ liệu chuỗi thời gian, các nhà kinh tế lượng cũng chỉ quan tâm đến hiệu suất dự đoán.
Về cơ bản cả hai đều là những thứ rất giống nhau nhưng được phát triển trong các lĩnh vực con khác nhau (học máy được bắt nguồn từ khoa học máy tính). Cả hai đều là một tập hợp các phương pháp. Các nhà kinh tế lượng cũng ngày càng sử dụng các phương pháp học máy như cây quyết định và mạng lưới thần kinh.
Bạn đã chạm vào một điểm rất thú vị: Nhân quả. Về cơ bản, cả hai lĩnh vực đều muốn biết các mối quan hệ cơ bản thực sự nhưng như bạn đã đề cập, thông thường, hiệu suất dự đoán là KPI chính được sử dụng trong các tác vụ học máy. Đó là, có một lỗi tổng quát hóa thấp là mục tiêu chính. Tất nhiên, nếu bạn biết các mối quan hệ nhân quả thực sự, điều này sẽ có lỗi tổng quát hóa thấp nhất trong số tất cả các công thức có thể. Thực tế rất phức tạp và không có linh cảm miễn phí. Do đó, hầu hết thời gian chúng ta chỉ có một phần kiến thức về hệ thống cơ bản và đôi khi thậm chí không thể đo lường được những ảnh hưởng quan trọng nhất. Nhưng chúng ta có thể sử dụng các biến proxy tương quan với các biến cơ bản thực sự mà chúng ta muốn đo.
Câu chuyện dài và rất hời hợt: Cả hai lĩnh vực đều liên quan trong khi các nhà kinh tế lượng chủ yếu quan tâm đến việc tìm kiếm các mối quan hệ nhân quả thực sự (nghĩa là kiểm tra một số giả thuyết) trong khi học máy bắt nguồn từ khoa học máy tính và chủ yếu quan tâm đến việc xây dựng các hệ thống thấp lỗi tổng quát hóa.
PS: Nói chung, chỉ nên sử dụng toàn bộ dữ liệu trong toán kinh tế lượng. Các nhà kinh tế lượng đang nhận thức rõ hơn rằng các mối quan hệ được tìm thấy trong mẫu không nhất thiết phải khái quát hóa cho dữ liệu mới. Do đó, việc nhân rộng các nghiên cứu kinh tế lượng là và luôn luôn rất quan trọng.
Hy vọng điều này sẽ giúp trong bất kỳ cách nào.