Sự khác biệt chính về triết học, phương pháp và thuật ngữ giữa kinh tế lượng và các lĩnh vực thống kê khác là gì?


70

Kinh tế lượng có sự trùng lặp đáng kể với các số liệu thống kê truyền thống, nhưng thường sử dụng biệt ngữ riêng về nhiều chủ đề khác nhau ("nhận dạng", "ngoại sinh", v.v.). Tôi đã từng nghe một giáo sư thống kê ứng dụng trong một nhận xét lĩnh vực khác rằng thường thì thuật ngữ là khác nhau nhưng các khái niệm là như nhau. Tuy nhiên, nó cũng có phương pháp riêng và sự phân biệt triết học (bài tiểu luận nổi tiếng của Heckman xuất hiện trong tâm trí).

Sự khác biệt thuật ngữ nào tồn tại giữa kinh tế lượng và thống kê chính thống, và các lĩnh vực phân kỳ để trở nên khác biệt trong nhiều hơn chỉ là thuật ngữ?

Câu trả lời:


96

Có một số khác biệt về thuật ngữ trong đó cùng một thứ được gọi là các tên khác nhau trong các ngành khác nhau:

  1. Dữ liệu theo chiều dọc trong thống kê sinh học là các quan sát lặp đi lặp lại của cùng một cá nhân = dữ liệu bảng trong kinh tế lượng.
  2. Mô hình cho biến phụ thuộc nhị phân trong đó xác suất 1 được mô hình là được gọi là mô hình logit trong kinh tế lượng và mô hình logistic trong thống kê sinh học. Các nhà sinh học có xu hướng làm việc với hồi quy logistic về tỷ lệ chênh lệch, vì s của họ thường là nhị phân, vì vậy tỷ lệ chênh lệch biểu thị tần số tương đối của kết quả quan tâm của hai nhóm trong dân số. Đây là một cách giải thích phổ biến đến mức bạn sẽ thường thấy một biến liên tục được chuyển thành hai loại (huyết áp thấp so với huyết áp cao) để làm cho việc giải thích này dễ dàng hơn.x1/(1+exp[xβ])x
  3. "Phương trình ước lượng" của các nhà thống kê là "điều kiện thời điểm" của nhà kinh tế lượng. Các nhà thống kê ' -estimate là những người ước tính cực trị của nhà kinh tế lượng.M

Có những khác biệt về thuật ngữ trong đó cùng một thuật ngữ được sử dụng để chỉ những điều khác nhau trong các ngành khác nhau:

  1. Các hiệu ứng cố định là viết tắt của trong phương trình hồi quy cho các nhà thống kê ANOVA và cho một công cụ ước tính "bên trong" cho các nhà kinh tế lượng.xβ
  2. Suy luận mạnh mẽ có nghĩa là các lỗi tiêu chuẩn đã được sửa chữa không đồng nhất đối với các nhà kinh tế (với các phần mở rộng cho các lỗi tiêu chuẩn gộp và / hoặc các lỗi tiêu chuẩn được sửa lỗi tự động) và các phương pháp mạnh mẽ vượt xa các nhà thống kê.
  3. Dường như các nhà kinh tế có một ý tưởng nực cười rằng các mẫu phân tầng là những mẫu trong đó xác suất lựa chọn khác nhau giữa các quan sát. Chúng nên được gọi là mẫu xác suất không bằng nhau. Các mẫu được phân tầng là những mẫu trong đó dân số được chia thành các nhóm được xác định trước theo các đặc điểm được biết trước khi lấy mẫu diễn ra.
  4. "Khai thác dữ liệu" của nhà kinh tế lượng (ít nhất là trong tài liệu của thập niên 1980) từng có nghĩa là nhiều thử nghiệm và cạm bẫy liên quan đến nó đã được giải thích tuyệt vời trong cuốn sách của Mitchell . Các thủ tục khai thác dữ liệu của các nhà khoa học máy tính (và các nhà thống kê) là các phương pháp không tham số để tìm các mẫu trong dữ liệu, còn được gọi là học thống kê .

Tôi xem những đóng góp độc đáo của kinh tế lượng

  1. Các cách để đối phó với tính nội sinh và mô hình hồi quy được chỉ định kém, nhận ra, như mpiktas đã giải thích trong một câu trả lời khác , rằng (i) các biến giải thích có thể tự ngẫu nhiên (và do đó tương quan với lỗi hồi quy tạo ra sai lệch trong ước tính tham số), (ii) các mô hình có thể bị các biến bị bỏ qua (sau đó trở thành một phần của thuật ngữ lỗi), (iii) có thể có sự không đồng nhất không quan sát được về cách các tác nhân kinh tế phản ứng với các kích thích, do đó làm phức tạp các mô hình hồi quy tiêu chuẩn. Angrist & Pischke là một đánh giá tuyệt vời về những vấn đề này và các nhà thống kê sẽ học được rất nhiều về cách thực hiện phân tích hồi quy từ nó. Ít nhất, các nhà thống kê nên tìm hiểu và hiểu hồi quy biến công cụ.
  2. Tổng quát hơn, các nhà kinh tế muốn đưa ra càng ít giả định về mô hình của họ, để đảm bảo rằng những phát hiện của họ không xoay quanh một điều gì đó vô lý như tính quy luật đa biến. Đó là lý do tại sao GMM rất phổ biến với các nhà kinh tế, và không bao giờ bị cuốn theo số liệu thống kê (mặc dù nó được mô tả là tối thiểu vào cuối những năm 1960). Đó là lý do tại sao việc áp dụng khả năng theo kinh nghiệm tăng theo cấp số nhân trong kinh tế lượng, nhưng chỉ có một chút theo sau trong thống kê. Đó là lý do tại sao các nhà kinh tế thực hiện hồi quy của họ với các lỗi tiêu chuẩn "mạnh" và các nhà thống kê, với các lỗi tiêu chuẩn OLS .s 2 ( X X ) - 1χ2s2(XX)1
  3. Có rất nhiều công việc trong miền thời gian với các quy trình cách đều đặn - đó là cách thu thập dữ liệu kinh tế vĩ mô. Những đóng góp độc đáo bao gồm các quy trình tích hợp và hợp nhất và các phương pháp không đồng nhất có điều kiện tự phát ((G) ARCH). Nói chung là một người vi mô, tôi ít quen thuộc với những điều này.

Nhìn chung, các nhà kinh tế có xu hướng tìm kiếm sự giải thích mạnh mẽ các hệ số trong mô hình của họ. Các nhà thống kê sẽ lấy mô hình logistic như một cách để xác định kết quả khả quan, thường là một thiết bị dự đoán đơn giản, và cũng có thể lưu ý cách giải thích GLM với các thuộc tính gia đình theo cấp số nhân mà nó sở hữu, cũng như các kết nối với phân tích phân biệt. Các nhà kinh tế sẽ nghĩ về việc giải thích tiện ích của mô hình logit và lo ngại rằng chỉ có được xác định trong mô hình này và sự không đồng nhất có thể loại bỏ nó. (Các nhà thống kê sẽ tự hỏi những gìσβ/σσ Tất nhiên, các nhà kinh tế đang nói đến.) Tất nhiên, một tiện ích tuyến tính trong đầu vào của nó là một điều rất buồn cười từ quan điểm của Kinh tế học vi mô 101, mặc dù một số khái quát cho các chức năng bán lõm có thể được thực hiện trong Mas-Collel.

Những gì các nhà kinh tế thường có xu hướng bỏ lỡ, nhưng, IMHO, sẽ được hưởng lợi, là các khía cạnh của phân tích đa biến (bao gồm các mô hình biến tiềm ẩn như một cách để xử lý các lỗi đo lường và nhiều proxy ... các nhà thống kê cũng không biết đến các mô hình này) , chẩn đoán hồi quy (tất cả các khoảng cách của Cook, của MallowsCp, DFBETA, v.v.), phân tích dữ liệu bị thiếu (nhận dạng một phần của Manski chắc chắn rất lạ mắt, nhưng phân tích MCAR / MAR / NMAR chính thống và nhiều thuật ngữ là hữu ích hơn) và thống kê khảo sát. Rất nhiều đóng góp khác từ các số liệu thống kê chính đã được giải trí bằng kinh tế lượng và được áp dụng như một phương pháp tiêu chuẩn, hoặc được thông qua như một cách thức ngắn hạn: Các mô hình ARMA của thập niên 1960 có thể được biết đến nhiều hơn trong kinh tế lượng so với thống kê, như một số chương trình sau đại học trong thống kê có thể không cung cấp một khóa học chuỗi thời gian những ngày này; ước tính co ngót / hồi quy sườn của những năm 1970 đã đến và đi; bootstrap của những năm 1980 là một phản ứng đau đầu gối cho bất kỳ tình huống phức tạp nào, mặc dù các nhà kinh tế cần phải nhận thức rõ hơn về những hạn chế của bootstrap; khả năng thực nghiệm của những năm 1990 đã chứng kiến ​​sự phát triển phương pháp luận nhiều hơn từ các nhà kinh tế lượng lý thuyết hơn là từ các nhà thống kê lý thuyết; Các phương pháp tính toán Bayes của những năm 2000 đang được giải trí trong toán kinh tế lượng, nhưng cảm giác của tôi là quá tham số, quá nặng dựa trên mô hình, để tương thích với mô hình mạnh mẽ mà tôi đã đề cập trước đó. Cho dù các nhà kinh tế sẽ tìm thấy bất kỳ việc sử dụng học tập thống kê / tin sinh học hoặc công cụ thời gian cực kỳ nóng trong thống kê hiện đại là một cuộc gọi mở.


14
+1 Đây là một ví dụ tuyệt vời về những câu trả lời tuyệt vời có thể xuất hiện khi một câu hỏi được mở ra cho một cộng đồng đa dạng .
whuber

1
@whuber, cảm ơn vì nhận xét. Sự phân chia kỷ luật khiến tôi phát điên.
StasK

@StasK Câu trả lời tuyệt vời. Một điểm nhanh chóng, mặc dù. "Nhìn chung, các nhà kinh tế có xu hướng tìm kiếm sự giải thích mạnh mẽ các hệ số trong mô hình của họ." Nói một cách chính xác, điều này hơi sai vì trong phân tích VAR (rất phổ biến do đó câu lệnh của bạn không nên nói theo nghĩa "tổng thể"), điểm trung tâm là trong việc diễn giải các hàm đáp ứng xung thay vì diễn giải các hệ số của mô hình (thường , chúng quá phức tạp để cố gắng diễn giải).
Graeme Walsh

@GraemeWalsh - Tôi thấy, như tôi đã nói, tôi không làm việc theo chuỗi vĩ mô / thời gian. Cảm ơn đã chỉ ra điều này.
StasK

20

Tốt nhất là giải thích về mặt hồi quy tuyến tính, vì nó là công cụ chính của kinh tế lượng. Trong hồi quy tuyến tính, chúng ta có một mô hình:

Y=Xβ+ε

Sự khác biệt chính giữa các trường thống kê và kinh tế lượng khác là được coi là cố định trong các trường khác và được coi là biến ngẫu nhiên trong kinh tế lượng. Sự chăm sóc thêm mà bạn phải sử dụng để điều chỉnh sự khác biệt này tạo ra các thuật ngữ khác nhau và các phương pháp khác nhau. Nói chung, bạn có thể nói rằng tất cả các phương thức được sử dụng trong toán kinh tế lượng là các phương thức giống như trong các trường thống kê khác với sự điều chỉnh cho tính ngẫu nhiên của các biến giải thích. Ngoại lệ đáng chú ý là GMM , công cụ kinh tế lượng duy nhất.X

Một cách khác để xem xét sự khác biệt là dữ liệu trong các trường thống kê khác có thể được coi là một mẫu iid. Trong kinh tế lượng, dữ liệu trong rất nhiều trường hợp là một mẫu từ quá trình ngẫu nhiên, trong đó iid chỉ là một trường hợp đặc biệt. Do đó một lần nữa biệt ngữ.

Biết những điều trên thường là đủ để dễ dàng chuyển từ các lĩnh vực thống kê khác sang kinh tế lượng. Vì thông thường mô hình được đưa ra, không khó để tìm ra cái gì là cái gì. Theo ý kiến ​​cá nhân của tôi, sự khác biệt biệt ngữ giữa học máy và thống kê cổ điển lớn hơn nhiều so với giữa kinh tế lượng và thống kê cổ điển.

Lưu ý rằng có những thuật ngữ có ý nghĩa phức tạp trong thống kê mà không có kinh tế lượng. Ví dụ điển hình là hiệu ứng cố định và ngẫu nhiên. Các bài viết trên Wikipedia về các thuật ngữ này là một mớ hỗn độn, trộn lẫn kinh tế lượng với thống kê.


5
"Ví dụ điển hình là các hiệu ứng cố định và ngẫu nhiên. Các bài viết trên Wikipedia về các thuật ngữ này là một mớ hỗn độn, trộn lẫn kinh tế lượng với thống kê." Thật vậy.
Michael Giám mục

8

Một sự khác biệt tinh tế là các nhà kinh tế đôi khi gán ý nghĩa cho các thuật ngữ lỗi trong các mô hình. Điều này đặc biệt đúng trong số các nhà kinh tế "cấu trúc", những người tin rằng bạn có thể ước tính các tham số cấu trúc đại diện cho sự không đồng nhất về lợi ích hoặc cá nhân.

Một ví dụ lớp học về điều này là probit. Trong khi các nhà thống kê thường không biết về nguyên nhân gây ra thuật ngữ lỗi, các nhà kinh tế thường xem các thuật ngữ lỗi trong hồi quy là đại diện cho tính không đồng nhất của các ưu tiên. Đối với trường hợp probit, bạn có thể mô hình hóa quyết định tham gia lực lượng lao động của phụ nữ. Điều này sẽ được xác định bởi nhiều biến số, nhưng thuật ngữ lỗi sẽ thể hiện mức độ không quan sát được mà sở thích cá nhân cho công việc có thể khác nhau.


4
Mặc dù các nhà thống kê có thể không biết về nguyên nhân gây ra thuật ngữ lỗi, điều đó không có nghĩa là họ không quan tâm đến nó. Những gì bạn mô tả là sự không đồng nhất của thuật ngữ lỗi, có nghĩa là các giả định thông thường về các điều khoản lỗi không được đáp ứng. Không có thống kê sẽ bỏ qua điều đó.
mpiktas

2
Thật thú vị, trong trường hợp này, không có vấn đề với hình thức của thuật ngữ lỗi. Các nhà thống kê và các nhà kinh tế cũng sẽ đứng dậy và lo lắng về sự không đồng nhất hoặc bất kỳ điều khoản lỗi không iid nào khác. Tuy nhiên, ngay cả khi thuật ngữ lỗi là N (0,1) như trong một probit, các nhà kinh tế có thể đưa ra một giải thích kinh tế.
d_a_c321

5
Điều đó áp dụng cho mô hình nói chung. Giải thích mô hình theo cách đặc biệt của riêng bạn không bị giới hạn bởi các nhà kinh tế, theo như kinh nghiệm của tôi.
mpiktas

Tôi không đồng ý. Các nhà kinh tế rõ ràng có sự độc quyền trong việc giải thích thông minh các mô hình <chỉ đùa thôi!>. Điểm tốt mặc dù.
d_a_c321

8

Tất nhiên, bất kỳ tuyên bố rộng nào chắc chắn là quá rộng. Nhưng kinh nghiệm của tôi là kinh tế lượng quan tâm đến mối quan hệ nhân quả và thống kê đã trở nên quan tâm hơn đến dự đoán.

Về mặt kinh tế, bạn không thể tránh khỏi tài liệu "cuộc cách mạng uy tín" ( Chủ yếu là Kinh tế lượng vô hại , v.v.). Các nhà kinh tế tập trung vào tác động của một số điều trị đối với một số kết quả với một mắt hướng tới đánh giá và khuyến nghị chính sách.

Về mặt thống kê, bạn thấy sự gia tăng của khai thác dữ liệu / học máy với các ứng dụng cho phân tích trực tuyến và di truyền là những ví dụ đáng chú ý. Ở đây, các nhà nghiên cứu quan tâm nhiều hơn đến việc dự đoán hành vi hoặc các mối quan hệ, thay vì giải thích chính xác chúng; họ tìm kiếm các mẫu, hơn là nguyên nhân.

Tôi cũng sẽ đề cập rằng các nhà thống kê theo truyền thống quan tâm nhiều hơn đến thiết kế thí nghiệm, quay trở lại các thí nghiệm nông nghiệp trong những năm 1930.


7

Tôi nhận thấy rằng so với những gì tôi gọi là nhà kinh tế lượng khoa học thống kê chính thống dường như miễn cưỡng sử dụng biểu đồ, theo sơ đồ hoặc dựa trên dữ liệu. Phạm vi của hồi quy, tự nhiên thậm chí còn tập trung hơn trong kinh tế lượng hơn so với các nơi khác, là một trường hợp chính. Giới thiệu hiện đại về hồi quy của các nhà thống kê nhấn mạnh trong suốt giá trị của việc vẽ dữ liệu và vẽ kết quả hồi quy, bao gồm các sơ đồ chẩn đoán, trong khi việc điều trị trong các văn bản kinh tế lượng lại rõ ràng hơn. Các văn bản hàng đầu về kinh tế lượng không bao gồm nhiều biểu đồ và không phát huy giá trị của chúng một cách mạnh mẽ.

Thật khó để phân tích điều này mà không có nguy cơ dường như vô kỷ luật hoặc tệ hơn, nhưng tôi đoán ở một số kết hợp sau đây là đóng góp.

  1. Mong muốn sự nghiêm khắc. Các nhà kinh tế lượng có xu hướng nghi ngờ hoặc thù địch khi học từ dữ liệu và rất thích các quyết định dựa trên các bài kiểm tra chính thức (bất cứ khi nào chúng không xuất hiện trong một định lý). Điều này được liên kết với một ưu tiên cho các mô hình dựa trên "lý thuyết" (mặc dù điều này có thể có nghĩa là một người dự đoán đã được đề cập trước đây trong một bài báo bởi một số nhà kinh tế không nói về dữ liệu).

  2. Thực hành xuất bản. Giấy tờ cho các tạp chí kinh tế hoặc kinh tế lượng rất nặng với các bảng hệ số được cách điệu hóa cao, sai số chuẩn, thống kê t và giá trị P. Thêm biểu đồ thậm chí dường như không được nghĩ đến trong nhiều trường hợp và nếu được cung cấp có thể sẽ được đề xuất để cắt bởi người đánh giá. Những thực tiễn này đã được nhúng trong một thế hệ trở lên đến mức chúng trở nên tự động, với các quy ước cứng nhắc về mức độ quan trọng của sao, v.v.

  3. Đồ họa cho các mô hình phức tạp. Đồ thị khéo léo bị bỏ qua bất cứ khi nào có vẻ như không có đồ thị phù hợp với một mô hình phức tạp với nhiều yếu tố dự đoán, v.v. (điều này thực sự rất khó quyết định).

Đương nhiên, những gì tôi đang đề xuất là một sự khác biệt của phương tiện, và nó đã nhận ra nhiều thay đổi trong cả hai trường hợp.


4

Không giống như hầu hết các ngành định lượng khác, kinh tế học liên quan đến mọi thứ tại MARGIN. Đó là, tiện ích cận biên, tỷ lệ thay thế biên, v.v ... Theo thuật ngữ tính toán, kinh tế học liên quan đến "đầu tiên" (và các công cụ phái sinh bậc cao hơn).

Nhiều ngành thống kê xử lý các đại lượng không phái sinh như phương tiện và phương sai. Tất nhiên, bạn có thể đi vào khu vực phân phối xác suất cận biên và có điều kiện, nhưng một số ứng dụng này cũng đi vào kinh tế học (ví dụ: "giá trị mong đợi.")


2

Nó không phải là kinh tế lượng, nó là bối cảnh. Nếu chức năng khả năng của bạn không có một tối ưu duy nhất, nó sẽ liên quan đến cả một nhà thống kê và nhà kinh tế lượng. Bây giờ nếu bạn đề xuất một giả định xuất phát từ lý thuyết kinh tế và hạn chế tham số hóa để tham số được xác định, nó có thể được gọi là kinh tế lượng, nhưng giả định có thể đến từ bất kỳ lĩnh vực thực tế nào.

Ngoại sinh là một vấn đề triết học. Xem ví dụ: http://andrewgelman.com/2009/07/disputes_about/ để so sánh các quan điểm khác nhau, nơi các nhà kinh tế thường hiểu nó theo cách Rubin làm.

Vì vậy, trong ngắn hạn, hoặc áp dụng thuật ngữ mà giáo viên của bạn sử dụng, hoặc giữ một tâm trí cởi mở và đọc rộng rãi.


2

Các nhà kinh tế lượng hầu như chỉ quan tâm đến suy luận nguyên nhân, trong khi các nhà thống kê cũng sử dụng các mô hình để dự đoán kết quả. Do đó, các nhà kinh tế lượng tập trung nhiều hơn vào tính ngoại sinh (như những người khác đã đề cập). Các nhà kinh tế lượng hình thức giảm và nhà kinh tế lượng cấu trúc có được tại các diễn giải nguyên nhân này theo những cách khác nhau.

Các nhà kinh tế lượng hình thức giảm thường xử lý ngoại sinh bằng cách sử dụng các kỹ thuật biến công cụ (trong khi IV được sử dụng ít thường xuyên hơn bởi các nhà thống kê.)

Các nhà kinh tế lượng cấu trúc có được các giải thích nguyên nhân của các tham số bằng cách dựa vào một lượng lý thuyết hiếm thấy trong công việc của các nhà thống kê.


1
IV được sử dụng nhiều bởi những người không thống kê, và kinh tế lượng dạng rút gọn sử dụng nhiều kỹ thuật để suy luận nguyên nhân khác với chỉ IV (diff-in-diff, gián đoạn hồi quy, v.v.). Xem bài viết này của Imbens để biết sự hòa hợp của toán kinh tế lượng IV với các phát triển IV thống kê phi kinh tế học gần đây.
Ari B. Friedman

2

Là một nhà thống kê tôi nghĩ về điều này trong các điều khoản chung hơn. Chúng tôi có sinh trắc học và kinh tế lượng. Đây là cả hai lĩnh vực mà số liệu thống kê được sử dụng để giải quyết vấn đề. Với sinh trắc học, chúng tôi đang xử lý các vấn đề sinh học / y tế trong khi kinh tế lượng đối phó với kinh tế học. Nếu không, chúng sẽ giống nhau ngoại trừ các ngành khác nhau nhấn mạnh các kỹ thuật thống kê khác nhau. Trong phân tích sinh tồn sinh học và phân tích bảng dự phòng được sử dụng rất nhiều. Đối với chuỗi thời gian kinh tế lượng được sử dụng rất nhiều. Phân tích hồi quy là phổ biến cho cả hai. Nhìn thấy câu trả lời về sự khác biệt về thuật ngữ giữa kinh tế học và thống kê sinh học, có vẻ như câu hỏi thực tế chủ yếu là về thuật ngữ và tôi thực sự chỉ đề cập đến hai thuật ngữ còn lại. Các câu trả lời hay đến nỗi tôi không thể thêm bất cứ điều gì vào đó. Tôi đặc biệt thích câu trả lời của StasK. Nhưng là một nhà thống kê sinh học, tôi nghĩ rằng chúng ta sử dụng mô hình logit và mô hình logistic thay thế cho nhau. Chúng tôi thực hiện cuộc gọi log (p / [1-p]) chuyển đổi logit.


2
(+1) Bạn có thể thêm tâm lý học vào danh sách các ứng dụng cụ thể của miền về thống kê được áp dụng cho các vấn đề cụ thể của miền.
Andy W
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.