Tư vấn chung về người mẫu


9

Xây dựng một mô hình toán học cho một vấn đề là một trong những khía cạnh chủ quan nhất của thống kê, nhưng cũng là một trong những điều quan trọng nhất. Các tài liệu tham khảo tốt nhất liên quan đến chủ đề quan trọng nhưng thường bị bỏ qua này là gì? Và nhà thống kê nổi tiếng nào đã nói điều gì đó dọc theo dòng chữ: "Hãy để dữ liệu hướng dẫn mô hình?"

Câu trả lời:


8

Theo tôi, "Chiến lược mô hình hồi quy" của Frank Harrell là một tài liệu tham khảo tốt. Trong thực tế, nó có lẽ là cuốn sách thống kê yêu thích của tôi.

Tôi mới chỉ nghiên cứu chưa đến một nửa cuốn sách, nhưng đã có rất nhiều thứ hay ho từ đó, ví dụ, đại diện cho các yếu tố dự đoán là spline để tránh giả định tuyến tính, nhiều lần cho dữ liệu bị thiếu và xác thực mô hình bootstrap. Có lẽ điều tôi thích nhất về cuốn sách là chủ đề chung mà một mục tiêu quan trọng là có được kết quả sẽ sao chép trên dữ liệu mới, chứ không phải kết quả chỉ giữ trên dữ liệu hiện tại.

Các lợi ích bổ sung là các gói rms của Frank Harrell giúp dễ dàng thực hiện nhiều điều được mô tả trong cuốn sách và sẵn sàng trả lời các câu hỏi tại đây và trên R-help.


3
(+1) Sách giáo khoa đồng hành tốt là Mô hình dự đoán lâm sàng , bởi EW Steyerberg (đặc biệt dành cho những người quan tâm đến kết quả lâm sàng).
chl

@chl Cảm ơn bạn đã gợi ý. Tôi đã không nghe về cuốn sách đó, và sẽ rất thích thú khi xem nó.
đánh dấu vào

2
@ user152509 Theo tôi biết, phân phối một bản sao điện tử sẽ là bất hợp pháp. Nếu bạn không thể mua sách hoặc lấy nó từ thư viện, bạn có thể xem một số sách tại Google Sách và có một số tài nguyên liên quan trên trang web của Bộ thống kê sinh học Vanderbilt.
đánh dấu

6

Tuyên bố sau dường như theo tinh thần của phê bình Sims ((1980) Kinh tế học vĩ mô và hiện thực , Kinh tế lượng, tháng 1, trang 1-48.)

... ủng hộ việc sử dụng các mô hình VAR như một phương pháp không có lý thuyết để ước tính các mối quan hệ kinh tế, do đó là một giải pháp thay thế cho "các hạn chế nhận dạng đáng kinh ngạc" trong các mô hình cấu trúc [từ wiki]

Nhưng có lẽ S.Johansen (một trong những người tiên phong trong phân tích hợp nhất) có thể theo cùng một tinh thần. Từ những gì tôi được dạy, trình tự xây dựng mô hình giống như:

  1. Làm rõ mục đích chính của mô hình: dự báo, mối quan hệ cấu trúc (mô phỏng), mối quan hệ nhân quả, các yếu tố tiềm ẩn, v.v.
  2. Mô hình trừu tượng là thế giới thực có thể "quá thật" để bao quát hoàn toàn trong ứng dụng của bạn, nhưng nó mang lại cảm giác (hoặc hiểu) về những gì đang diễn ra
  3. Mô hình bằng lời nói mang lại một số lý thuyết hoặc chuyển sự hiểu biết của bạn thành các tuyên bố và giả thuyết sẽ được kiểm tra, các sự kiện thực nghiệm (đôi khi được gọi là cách điệu) được thu thập ở bước này
  4. Mô hình toán học chỉ bây giờ bạn có thể xây dựng lý thuyết của mình dưới dạng phương trình (hiệu số, vi phân), các mô hình như vậy thường mang tính xác định (mặc dù người ta có thể hợp nhất bước này với phương trình sau và xem xét phương trình vi phân ngẫu nhiên) do đó bạn cần. ..
  5. Mô hình kinh tế lượng (thống kê) thêm các phần ngẫu nhiên, lý thuyết và phương pháp thống kê ứng dụng và lý thuyết xác suất, kinh tế lượng vi mô và vĩ mô.

Hy vọng điều này là hữu ích.


1
Bất kỳ tài liệu tham khảo cho "Sim" hoặc "Johansen"? Cảm ơn!
charles.y.zheng

2

Tham chiếu đến "để dữ liệu hướng dẫn mô hình" có thể được quy cho George EP BoxGwilym M. Jenkins . Trong Chương 2 của sách giáo khoa cổ điển của họ, Phân tích chuỗi thời gian: Dự báo và kiểm soát (1976), người ta nói rằng:

Việc thu được các ước tính mẫu của hàm tự tương quan và phổ là các cách tiếp cận phi cấu trúc, tương tự như biểu diễn hàm phân phối theo kinh nghiệm bằng biểu đồ. Cả hai đều là cách để dữ liệu từ chuỗi ổn định 'tự nói lên' và cung cấp bước đầu tiên trong phân tích chuỗi thời gian, giống như biểu đồ có thể cung cấp bước đầu tiên trong phân tích dữ liệu phân phối, chỉ đường cho một số mô hình tham số mà phân tích tiếp theo sẽ được dựa trên.

Quy trình mô hình hóa này để cho dữ liệu thực hiện việc nói chuyện , như được ủng hộ bởi Box & Jenkins, rõ ràng được đề cập trong suốt tài liệu về mô hình ARIMA. Ví dụ, trong bối cảnh xác định các mô hình ARIMA dự kiến, Pankratz (1983) nói:

Lưu ý rằng chúng tôi không tiếp cận dữ liệu có sẵn với một ý tưởng cứng nhắc, định sẵn về mô hình mà chúng tôi sẽ sử dụng. Thay vào đó, chúng tôi để dữ liệu có sẵn `` nói chuyện với chúng tôi 'dưới dạng hàm tự tương quan ước tính và hàm tự tương quan một phần.

Vì vậy, có thể nói rằng ý tưởng '' để dữ liệu hướng dẫn mô hình '' là một tính năng phổ biến trong phân tích chuỗi thời gian.

Tuy nhiên, các khái niệm tương tự có thể được tìm thấy trong các lĩnh vực nghiên cứu (phụ) khác. Ví dụ, @Dmitrij Celov đã tham khảo chính xác bài báo phá vỡ con đường của Christopher Sims, Kinh tế học vĩ mô và thực tế (1980), đó là một phản ứng chống lại việc sử dụng các mô hình phương trình đồng thời quy mô lớn trong kinh tế vĩ mô.

Cách tiếp cận truyền thống trong kinh tế vĩ mô là sử dụng lý thuyết kinh tế như một hướng dẫn để xây dựng các mô hình kinh tế vĩ mô. Thông thường, các mô hình được tạo thành từ hàng trăm phương trình và các hạn chế, chẳng hạn như quyết định trước các dấu hiệu của một số hệ số, sẽ được áp dụng cho chúng. Sims (1980) đã phê phán việc sử dụng kiến thức tiên nghiệm này để xây dựng các mô hình kinh tế vĩ mô:

Thực tế là các mô hình kinh tế vĩ mô lớn rất năng động là một nguồn phong phú của các hạn chế 'tiên nghiệm' giả.

Như đã được đề cập bởi @Dmitrij Celov, cách tiếp cận thay thế được Sims (1980) đề xuất là chỉ định các phương trình tự phát vectơ - về cơ bản dựa trên các giá trị bị trễ của một biến và các giá trị bị trễ của các biến khác.

Mặc dù tôi là người hâm mộ khái niệm 'để cho dữ liệu tự nói lên' ' , tôi không chắc chắn liệu phương pháp này có thể được mở rộng hoàn toàn trong tất cả các lĩnh vực nghiên cứu hay không. Ví dụ, hãy xem xét thực hiện một nghiên cứu về kinh tế học lao động để cố gắng giải thích sự khác biệt giữa mức lương giữa nam và nữ trong một quốc gia nhất định. Chọn tập hợp các biến hồi quy trong một mô hình như vậy có thể sẽ được hướng dẫn bởi lý thuyết vốn nhân lực . Trong các bối cảnh khác, tập hợp các biến hồi quy có thể được chọn dựa trên những gì chúng ta quan tâm và ý nghĩa chung cho chúng ta biết. Verbeek (2008) nói:

Đó là một thực tiễn tốt để chọn tập hợp các biến có khả năng liên quan trên cơ sở các đối số kinh tế thay vì các biến số thống kê. Mặc dù đôi khi nó được đề xuất khác, các đối số thống kê không bao giờ là đối số chắc chắn.

Thực sự, tôi chỉ có thể làm trầy xước bề mặt ở đây vì đây là một chủ đề lớn, nhưng tài liệu tham khảo tốt nhất mà tôi đã bắt gặp trên mô hình là Granger (1991). Nếu nền tảng của bạn không phải là kinh tế, đừng để tiêu đề của cuốn sách làm bạn thất vọng. Hầu hết các cuộc thảo luận diễn ra trong bối cảnh mô hình hóa loạt kinh tế, nhưng tôi chắc rằng những người từ các lĩnh vực khác sẽ nhận được rất nhiều từ nó và thấy nó hữu ích.

Cuốn sách chứa các cuộc thảo luận tuyệt vời về các phương pháp mô hình hóa khác nhau, chẳng hạn như:

  • Cách tiếp cận từ tổng quát đến cụ thể (hay phương pháp LSE) được ủng hộ bởi David Hendry.
  • Cách tiếp cận cụ thể đến tổng quát.
  • Phương pháp luận của Edward Leamer (thường được liên kết với các thuật ngữ "phân tích độ nhạy (hoặc giới hạn cực đoan)" & "Bayesian" ).
  • Thật trùng hợp, cách tiếp cận của Christophers Sims cũng được đề cập.

Điều đáng chú ý là Granger (1991) thực sự là một bộ sưu tập giấy tờ, vì vậy thay vì cố gắng lấy một bản sao của cuốn sách, dĩ nhiên, bạn có thể tra cứu mục lục và thử tự mình tìm các bài báo. (Xem liên kết dưới đây.)

Hy vọng điều này đã được chứng minh là hữu ích!

Người giới thiệu:

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.