Ví dụ mô hình hồi quy nâng cao


22

Tôi đang tìm kiếm một nghiên cứu trường hợp hồi quy tuyến tính tiên tiến minh họa các bước cần thiết để mô hình hóa các mối quan hệ phi tuyến tính phức tạp, sử dụng GLM hoặc OLS. Thật khó để tìm thấy các tài nguyên vượt ra ngoài các ví dụ cơ bản của trường học: hầu hết các cuốn sách tôi đã đọc sẽ không đi xa hơn là chuyển đổi nhật ký của phản hồi kết hợp với BoxCox của một người dự đoán hoặc trường hợp tự nhiên trong trường hợp tốt nhất. Ngoài ra tất cả các ví dụ tôi đã thấy cho đến nay tiếp cận từng vấn đề chuyển đổi dữ liệu trong một mô hình riêng biệt, thường là trong một mô hình dự đoán duy nhất.

Tôi biết chuyển đổi BoxCox hoặc YeoJohnson là gì. Những gì tôi đang tìm kiếm là một nghiên cứu trường hợp thực tế chi tiết, trong đó phản ứng / mối quan hệ không rõ ràng. Ví dụ: phản hồi không hoàn toàn tích cực (vì vậy bạn không thể sử dụng nhật ký hoặc BoxCox), các dự đoán có mối quan hệ phi tuyến tính giữa chúng và chống lại phản hồi và các biến đổi dữ liệu có khả năng tối đa dường như không bao hàm tiêu chuẩn 0,33 hoặc 0,5 số mũ. Ngoài ra, phương sai còn lại được tìm thấy là không hằng (không bao giờ), do đó, phản ứng cũng phải được chuyển đổi và các lựa chọn sẽ phải được thực hiện giữa hồi quy gia đình GLM không chuẩn hoặc chuyển đổi đáp ứng. Các nhà nghiên cứu có thể sẽ đưa ra các lựa chọn để tránh làm quá dữ liệu.

CHỈNH SỬA

Cho đến nay tôi đã thu thập các tài nguyên sau:

  • Chiến lược mô hình hồi quy, F. Harrell
  • Chuỗi thời gian kinh tế học ứng dụng, W. Enders
  • Mô hình tuyến tính động với R, G. Petris
  • Phân tích hồi quy ứng dụng, D. Kleinbaum
  • Giới thiệu về học thống kê, G. James / D. Witten

Tôi chỉ đọc bản cuối cùng (ISLR) và đó là một văn bản rất tốt (5 năm sao trên đồng hồ của tôi), mặc dù hướng nhiều hơn về ML so với mô hình hồi quy nâng cao.

Ngoài ra còn có bài viết tốt này trên CV trình bày một trường hợp hồi quy đầy thách thức.


8
Tôi tin rằng cuốn sách Frank Harrells ( amazon.com/ trên ) có thể hữu ích.
Adam Robinsson

@AdamRobinsson Tôi thấy TOC đang chạm vào một số đối tượng có liên quan (mô hình đa biến, spline, multollinearity), nhưng những phương pháp đó được minh họa cùng nhau trong một ví dụ thực tế hay mỗi chủ đề được giải thích riêng? Bởi vì thông thường trong các ví dụ thực tế, tất cả các vấn đề xảy ra với bạn và không bao giờ rõ ràng làm thế nào để quản lý chúng tốt.
Robert Kubrick

1
Tôi chưa đọc toàn bộ cuốn sách, nhưng 150 trang đầu tiên hoàn toàn tuyệt vời (Tôi không phải là người tĩnh, chỉ là một người đam mê). Ví dụ được mở rộng và xây dựng trên. Cuốn sách được kèm theo gói RMS (chiến lược mô hình hồi quy) cho R. Tôi cũng đã xem cuốn sách cạnh tranh của David Kleinbaums (không may quên tiêu đề) nhưng nó chứa ít hơn nhiều về các chiến lược và ví dụ (và đắt gấp đôi).
Adam Robinsson

3
@RobertKubrick: "Hồi quy đa biến" có nghĩa là có nhiều hơn một phản hồi (xem wiki cho thẻ bạn đã thêm hoặc tại đây ). "Hồi quy bội" có nghĩa là có nhiều hơn một yếu tố dự đoán.
Scortchi - Tái lập Monica

3
Bạn có thể muốn xem Chuỗi thời gian kinh tế lượng ứng dụng của Enders. Phiên bản mới bao gồm các mô hình phi tuyến tính vào cuối cuốn sách. Gần như tất cả các dữ liệu đều có sẵn công khai trên trang web của St. Louis Fed (có thể truy cập thông qua quantmod trong R) để bạn có thể theo dõi các ví dụ thực tế. Mô hình tuyến tính động với R cũng có một vài ví dụ với dữ liệu thực khá tốt.
Eric Brady

Câu trả lời:


10

Chiến lược mô hình hồi quy và ISLR, đã được đề cập bởi những người khác, là hai gợi ý rất tốt. Tôi có một vài người khác mà bạn có thể muốn xem xét.

Mô hình dự đoán ứng dụng của Kuhn và Johnson chứa một số nghiên cứu điển hình tốt và thực tế.

-

Các mô hình phụ gia tổng quát: Giới thiệu với R của Simon Wood là một cách xử lý tốt các mô hình phụ gia tổng quát và cách bạn phù hợp với chúng bằng cách sử dụng mgcvgói của mình cho R. Nó chứa một số ví dụ thực tế không cần thiết. Việc sử dụng các mô hình GAM là một giải pháp thay thế để tìm ra phép chuyển đổi "chính xác" vì việc này được thực hiện theo cách thích ứng dữ liệu thông qua việc mở rộng spline và ước tính khả năng tối đa bị phạt. Tuy nhiên, vẫn còn những lựa chọn khác cần được thực hiện, ví dụ như lựa chọn chức năng liên kết.

Các mboost gói cho R cũng phù hợp với mô hình GAM nhưng sử dụng một cách tiếp cận khác nhau thông qua việc thúc đẩy. Tôi khuyên bạn nên hướng dẫn cho gói (một trong các họa tiết).

Tôi cũng sẽ đề cập đến Khám phá mô hình thực nghiệm và đánh giá lý thuyết của Hendry và Doornik, mặc dù tôi chưa đọc cuốn sách này. Nó đã được đề nghị cho tôi.


Áp dụng mô hình dự đoán ... như vậy. Tôi thích ISLR.
Robert Kubrick

5

Một trong những tài liệu khóa học tốt nhất mà bạn có thể tìm thấy về hồi quy nâng cao, nhiều, phức tạp (bao gồm cả phi tuyến) dựa trên cuốn sách Chiến lược mô hình hồi quy của Frank E. Harrell Jr.

Cuốn sách đang được thảo luận trong các ý kiến ​​nhưng không phải tài liệu này, mà bản thân nó là một tài nguyên tuyệt vời.


2

Tôi muốn giới thiệu cuốn sách Kinh tế lượng vô hại của Joshua D. Angrist và Jörn-Steffen Pischke

Đây là thế giới thực nhất, muối đến trái đất, văn bản tôi sở hữu và nó siêu rẻ, khoảng $ 26,00 mới. Cuốn sách được viết cho các nhà thống kê / nhà kinh tế tốt nghiệp vì vậy nó rất tiên tiến.

Bây giờ cuốn sách này không chính xác là những gì bạn yêu cầu theo nghĩa là nó không tập trung vào "các mối quan hệ phi tuyến tính phức tạp" nhiều như các nguyên tắc cơ bản cốt lõi như endoegeneity, giải thích và thiết kế hồi quy thông minh.

Nhưng tôi đang cung cấp cuốn sách này để cố gắng đưa ra quan điểm. Đó là, khi nói đến ứng dụng phân tích hồi quy trong thế giới thực, các vấn đề thách thức nhất thường không liên quan đến thực tế là các mô hình của chúng tôi không đủ phức tạp ... tin tôi rằng chúng tôi rất giỏi trong việc đánh trống rất phức tạp người mẫu! Thay vào đó, vấn đề lớn nhất là những thứ như

  1. Nội sinh
  2. không có tất cả dữ liệu chúng ta cần
  3. Phải có nhiều dữ liệu ... và tất cả chỉ là một mớ hỗn độn!
  4. Đối với nhiều người không thể giải thích chính xác các mô hình của họ (một vấn đề trở nên phổ biến hơn khi chúng ta làm cho các mô hình trở nên phức tạp hơn)

Một sự hiểu biết vững chắc về GMM, các bộ lọc phi tuyến tính và hồi quy phi tham số khá nhiều bao gồm tất cả các chủ đề bạn đã liệt kê và có thể được học khi bạn đi cùng. Tuy nhiên, với dữ liệu trong thế giới thực, các khung này có khả năng phức tạp không cần thiết, thường gây hại như vậy.

Tất cả thường là khả năng đơn giản khéo léo thay vì hoàn toàn khái quát và rất tinh vi, có lợi cho bạn nhất khi phân tích trong thế giới thực. Cuốn sách này sẽ giúp bạn với trước đây.


1

Bạn có thể tham khảo Giới thiệu về Học thống kê với R (ISLR), cuốn sách nói về splines và hồi quy đa thức một cách chi tiết với các trường hợp.


1

Tôi không chắc mục tiêu của câu hỏi của bạn là gì. Tôi có thể đề xuất văn bản Phân tích Kinh tế lượng của Greene . Nó có rất nhiều tài liệu tham khảo cho các giấy tờ bên trong. Khá nhiều ví dụ trong cuốn sách tham khảo một bài báo được xuất bản.

Để cung cấp cho bạn hương vị, hãy xem Ví dụ 7.6 "Hiệu ứng tương tác trong Mô hình Loglinear cho thu nhập" trên tr.195. Nó đề cập đến một bài báo và bộ dữ liệu: Regina T. Riphahn, Achim Wambach và Andreas Million, " Hiệu ứng ưu đãi trong nhu cầu chăm sóc sức khỏe: Ước tính dữ liệu đếm bảng Bivariate ", Tạp chí Kinh tế lượng ứng dụng, Tập. 18, số 4, 2003, trang 387-405.

Ví dụ là về việc sử dụng các mô hình loglinear và các hiệu ứng tương tác. Bạn có thể đọc toàn bộ bài viết, hoặc mô tả sách giáo khoa này. Đây không phải là một trường hợp sử dụng tạo nên. Đó là một nghiên cứu được công bố thực sự. Đây là cách mọi người thực sự sử dụng các phương pháp thống kê trong nghiên cứu kinh tế.

Như tôi đã viết, cuốn sách bị làm phiền với các trường hợp sử dụng như thế này về việc sử dụng các phương pháp thống kê nâng cao.


0

Bạn đã xem qua một số khóa học / cuốn sách Phân tích chuỗi thời gian tài chính mà Ruey Tsay (UChicago) viết chưa?

http://facemony.chicagobooth.edu/ruey.tsay/teaching/

Các lớp học của Ruey Tsays và sách giáo khoa cung cấp nhiều ví dụ trong thế giới thực về Tài chính về các hồi quy phức tạp thuộc loại được tạo ra để sử dụng trong thị trường tài chính. Chương 1 bắt đầu với các mô hình hồi quy đa yếu tố và mở rộng sang các mô hình chuỗi Thời gian tự phát theo mùa theo chương 5 hoặc 6.


2
Có tôi đã làm và không thích nó cả. Nó rất rộng về chiều rộng (mọi thứ từ mô hình biến động đến tần số cao đến ARIMA ...), chạm nhẹ vào từng đối tượng (không thể có quá nhiều chủ đề trong tay) và các nghiên cứu và thách thức R được giảm đến mức tối thiểu. Đó là một bản tóm tắt của các bài báo học thuật và lý thuyết / mô hình đã nêu bạn có thể tìm thấy ở một nơi khác. Đây chính xác là những gì tôi muốn nói bởi các trường hợp không bao giờ giải quyết sự phức tạp của nhiều thách thức trong một vấn đề thực tế, tiên tiến.
Robert Kubrick
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.