Sự khác biệt giữa Kinh tế lượng và Máy học là gì?


8

Theo hiểu biết của tôi, kinh tế lượng ước tính mối tương quan một phần ( ceteris paribus ) với mục đích chủ yếu là ước tính quan hệ nhân quả . Đối với điều đó, nó thường sử dụng toàn bộ dữ liệu có sẵn. Kinh tế lượng có thể là tham số và không tham số.

Trong khi đó, học máy không quan tâm đến quan hệ nhân quả, mà là "phù hợp" với mục đích chủ yếu là đưa ra dự đoán . Vì thế, nó thường phân chia tập dữ liệu giữa tập huấn luyện và tập dự đoán. Học máy cũng có thể là tham số và không tham số.


Đây là những gì tôi có thể làm cho cốt lõi của hai ngành này, nhưng tôi chắc chắn có nhiều hơn nữa cho nó. Tôi chủ yếu quan tâm đến sự khác biệt của họ. Bất cứ ai có thể cung cấp một hướng dẫn tốt về điều này xin vui lòng?


8
Tôi đoán rằng kinh tế lượng là một môn học hoặc môn học trong khi học máy là một phương pháp. Bạn có thể sử dụng học máy trong toán kinh tế lượng, cũng như trong các môn học khác và bạn có thể sử dụng các phương pháp khác trong toán kinh tế lượng
Henry

4
Ragnar Frisch đã viết trong số đầu tiên của Kinh tế lượng rằng kinh tế lượng học nói về: "lý thuyết kinh tế liên quan đến thống kê và toán học". Do đó, các mô hình kinh tế lượng thường xuất phát từ lý thuyết kinh tế hoặc lý thuyết toán học / trò chơi trước khi chúng được trang bị cho dữ liệu. Thống kê và học máy, tuy nhiên, dựa trên dữ liệu và không dựa trên lý thuyết. Theo tôi, đây là sự khác biệt quan trọng nhất. Và trong kinh tế lượng, cũng có các mô hình dự đoán (trái ngược với mô hình giải thích) hoặc mô hình linh hoạt (cần đào tạo / xác nhận). Nhưng chúng chỉ là một phần của các phương pháp được sử dụng.
Achim Zeileis

1
sự khác biệt giữa một quả chuối và trái cây là gì? kinh tế lượng là một lĩnh vực của học máy ...
Antoine

3
@Antoine Tôi thà lập luận rằng Machine Learning là một trường con của Kinh tế lượng ...
rbm

4
@Antoine bạn không thể nghiêm túc. Tôi chưa bao giờ thấy vấn đề kiểm tra thống kê trong một cuốn sách tự dán nhãn "học máy"
tomka

Câu trả lời:


4

Điều đầu tiên đầu tiên. Tất cả những gì tôi nói chỉ là sự hiểu biết của tôi. Do đó, như thường lệ, tôi có thể sai.

Henry đúng một phần. Nhưng Kinh tế lượng cũng là một họ phương pháp. Có nhiều phương pháp kinh tế lượng khác nhau có thể được áp dụng tùy thuộc vào câu hỏi nghiên cứu cũng như dữ liệu được cung cấp (mặt cắt ngang so với dữ liệu bảng điều khiển, v.v.).

Học máy theo cách hiểu của tôi là một tập hợp các phương pháp cho phép máy móc học các mẫu từ các quan sát trong quá khứ (thông thường theo cách thức hộp đen). Hồi quy là một công cụ tiêu chuẩn trong kinh tế lượng cũng như học máy vì nó cho phép tìm hiểu mối quan hệ giữa các biến và ngoại suy các mối quan hệ này trong tương lai.

Không phải tất cả các nhà kinh tế lượng đều quan tâm đến việc giải thích nguyên nhân các ước tính tham số (họ hiếm khi có thể yêu cầu giải thích nguyên nhân nếu dữ liệu quan sát (không thử nghiệm) được sử dụng). Thông thường, giống như trong trường hợp dữ liệu chuỗi thời gian, các nhà kinh tế lượng cũng chỉ quan tâm đến hiệu suất dự đoán.

Về cơ bản cả hai đều là những thứ rất giống nhau nhưng được phát triển trong các lĩnh vực con khác nhau (học máy được bắt nguồn từ khoa học máy tính). Cả hai đều là một tập hợp các phương pháp. Các nhà kinh tế lượng cũng ngày càng sử dụng các phương pháp học máy như cây quyết định và mạng lưới thần kinh.

Bạn đã chạm vào một điểm rất thú vị: Nhân quả. Về cơ bản, cả hai lĩnh vực đều muốn biết các mối quan hệ cơ bản thực sự nhưng như bạn đã đề cập, thông thường, hiệu suất dự đoán là KPI chính được sử dụng trong các tác vụ học máy. Đó là, có một lỗi tổng quát hóa thấp là mục tiêu chính. Tất nhiên, nếu bạn biết các mối quan hệ nhân quả thực sự, điều này sẽ có lỗi tổng quát hóa thấp nhất trong số tất cả các công thức có thể. Thực tế rất phức tạp và không có linh cảm miễn phí. Do đó, hầu hết thời gian chúng ta chỉ có một phần kiến ​​thức về hệ thống cơ bản và đôi khi thậm chí không thể đo lường được những ảnh hưởng quan trọng nhất. Nhưng chúng ta có thể sử dụng các biến proxy tương quan với các biến cơ bản thực sự mà chúng ta muốn đo.

Câu chuyện dài và rất hời hợt: Cả hai lĩnh vực đều liên quan trong khi các nhà kinh tế lượng chủ yếu quan tâm đến việc tìm kiếm các mối quan hệ nhân quả thực sự (nghĩa là kiểm tra một số giả thuyết) trong khi học máy bắt nguồn từ khoa học máy tính và chủ yếu quan tâm đến việc xây dựng các hệ thống thấp lỗi tổng quát hóa.

PS: Nói chung, chỉ nên sử dụng toàn bộ dữ liệu trong toán kinh tế lượng. Các nhà kinh tế lượng đang nhận thức rõ hơn rằng các mối quan hệ được tìm thấy trong mẫu không nhất thiết phải khái quát hóa cho dữ liệu mới. Do đó, việc nhân rộng các nghiên cứu kinh tế lượng là và luôn luôn rất quan trọng.

Hy vọng điều này sẽ giúp trong bất kỳ cách nào.


Achim's nhận xét rằng ML rất ít (nếu không phải tất cả) được thúc đẩy bởi lý thuyết, đó không phải là những gì bạn nói. Bạn có thể mở rộng về điều này? Đó có lẽ là một yếu tố cốt lõi của phân tích.
luchonacho

@luchonacho điều này được giải quyết trong ghi chú của tôi về câu trả lời này
tomka

@luchonacho tomka đã làm một điểm rất tốt ở đó. Tuy nhiên, tôi muốn nhấn mạnh một thực tế (và tomka cũng đã đề cập đến vấn đề này) rằng cả hai lĩnh vực nên và quan tâm đến quan hệ nhân quả. Trong thuật ngữ học tập maschine: Biết các mối quan hệ nhân quả thực sự sẽ dẫn đến một mô hình có độ lệch cũng như phương sai thấp nhất. Một bước thực sự quan trọng trong bất kỳ ứng dụng học tập maschine nào là bước kỹ thuật tính năng và điều này nên được dẫn dắt bởi lý thuyết bất kể bạn đến từ lĩnh vực nào.
JustMe

điều nhỏ cần thêm (mà bạn đã chạm vào trong đoạn trước ps): sự khác biệt trong mối quan tâm về vị trí của thiên vị. Trong ML, mối quan tâm cho sự thiên vị trong mô hình (ví dụ: rmse); trong kinh tế lượng, mối quan tâm cho sự thiên vị trong tham số quan tâm và tiềm năng cho các biến thiên bị bỏ qua. Nói chung, tất nhiên.
paqmo

2

Một số lưu ý ngoài @JustMe:

Đầu tiên, có rất nhiều sự kiêu ngạo ở cả hai mặt của Kinh tế lượng và Học máy. Thảo luận về cái nào trong hai cái có thể là một môn học phụ trong đó là vô ích. Trong thực tế, cả hai đều là các ngành con chồng chéo mạnh mẽ của lĩnh vực thống kê (được mô tả tốt nhất là toán học ứng dụng). Cả hai đều có trọng tâm và sở thích riêng, ví dụ Kinh tế lượng tập trung vào các giả thuyết ước tính và kiểm tra, thường trong các mẫu nhỏ hơn, trong khi ML tập trung vào xấp xỉ chức năng tốt nhất, thường trong các mẫu rất lớn. Cách thứ nhất tập trung vào các phương pháp tham số đưa ra các giả định phân phối, lần thứ hai thường xuyên hơn (nhưng không phải là độc quyền) đối với các phương pháp không phân phối không tham số. Và như thế.

Thứ hai, nếu mục tiêu là dự đoán thì không cần phải hiểu nguyên nhân, miễn là các mẫu ngẫu nhiên từ cùng một quần thể có sẵn. Tuy nhiên, hiểu nhân quả là mối quan tâm chính nếu chúng ta muốn hiểu một hệ thống (tức là phát triển / kiểm tra lý thuyết) hoặc thay đổi nó (tức là hành động dựa trên lý thuyết bằng một can thiệp). Loại mục tiêu nghiên cứu này phổ biến hơn nhiều trong toán kinh tế lượng (và các lĩnh vực khác như thống kê sinh học) so với học máy.

Tuy nhiên, có những nhà nghiên cứu về máy học cũng quan tâm đến quan hệ nhân quả. Sự khác biệt chính giữa các trường ở đây là, một lần nữa, các nhà kinh tế lượng có giả thuyết về các can thiệp và cố gắng ước tính tác động của chúng (ví dụ từ dữ liệu quan sát hoặc dữ liệu thực nghiệm sử dụng các kỹ thuật từ lý thuyết suy luận nguyên nhân như mô hình trọng số, kết hợp hoặc lựa chọn) trong khi học máy sẽ thay vì cố gắng tìm hiểu các mối quan hệ nhân quả từ dữ liệu (ví dụ: sử dụng thuật toán tìm kiếm trong các biểu đồ nhân quả theo chu kỳ có hướng) và trọng tâm ít được đặt vào một can thiệp duy nhất.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.