Các tiêu chí và ra quyết định cho phi tuyến tính trong các mô hình thống kê là gì?


10

Tôi hy vọng rằng câu hỏi chung sau đây có ý nghĩa. Xin lưu ý rằng vì mục đích của câu hỏi cụ thể này, tôi không quan tâm đến lý do lý thuyết (lĩnh vực chủ đề) để giới thiệu phi tuyến tính. Do đó, tôi sẽ xây dựng câu hỏi đầy đủ như sau:

Khung logic ( tiêu chí và, nếu có thể, quá trình ra quyết định ) để đưa phi tuyến tính vào các mô hình thống kê vì lý do gì, ngoài lý thuyết (miền chủ đề)? Như mọi khi, các tài nguyên và tài liệu tham khảo có liên quan cũng được chào đón.

Câu trả lời:


7

Quá trình xây dựng mô hình liên quan đến một người xây dựng mô hình đưa ra nhiều quyết định. Một trong những quyết định liên quan đến việc lựa chọn giữa các lớp mô hình khác nhau để khám phá. Có nhiều lớp mô hình có thể được xem xét; ví dụ: mô hình ARIMA, mô hình ARDL, mô hình không gian trạng thái lỗi nhiều nguồn, mô hình LSTAR, mô hình tối thiểu, để đặt tên nhưng một số ít. Tất nhiên, một số lớp học của các mô hình rộng hơn những người khác và nó không phải là chung cho thấy rằng một số lớp của mô hình là sub-lớp học của người khác.

Với bản chất của câu hỏi, chúng ta có thể tập trung chủ yếu vào chỉ hai lớp mô hình; mô hình tuyến tínhmô hình phi tuyến tính .

Với hình ảnh trên, tôi sẽ bắt đầu giải quyết câu hỏi OP khi nào nên áp dụng mô hình phi tuyến tính và nếu có một khung logic để thực hiện điều đó - từ góc độ thống kê và phương pháp luận.

Điều đầu tiên cần lưu ý là các mô hình tuyến tính là một lớp con nhỏ của các mô hình phi tuyến tính. Nói cách khác, mô hình tuyến tính là trường hợp đặc biệt của mô hình phi tuyến tính. Có một số trường hợp ngoại lệ cho tuyên bố đó, nhưng, với mục đích hiện tại, chúng tôi sẽ không mất nhiều bằng cách chấp nhận nó để đơn giản hóa các vấn đề.

Thông thường, một người xây dựng mô hình sẽ chọn một lớp các mô hình và tiến hành chọn một mô hình từ bên trong lớp cụ thể đó bằng cách sử dụng một số phương pháp. Một ví dụ đơn giản là khi người ta quyết định mô hình chuỗi thời gian dưới dạng quy trình ARIMA và sau đó tuân theo phương pháp Box-Jenkins để chọn một mô hình trong số các mô hình ARIMA. Làm việc theo kiểu này, với các phương pháp liên quan đến gia đình người mẫu, là một vấn đề cần thiết thực tế.

Hậu quả của việc quyết định xây dựng một mô hình phi tuyến tính là vấn đề lựa chọn mô hình trở nên lớn hơn nhiều (phải xem xét nhiều mô hình hơn và phải đối mặt với nhiều quyết định hơn) khi so sánh với việc lựa chọn trong số các mô hình tuyến tính nhỏ hơn, vì vậy có một thực tế vấn đề thực tế trong tầm tay. Hơn nữa, thậm chí có thể không có các phương pháp được phát triển đầy đủ (đã biết, được chấp nhận, được hiểu, dễ giao tiếp) để sử dụng để chọn từ một số họ của các mô hình phi tuyến tính. Hơn nữa, một nhược điểm khác của việc xây dựng các mô hình phi tuyến tính là các mô hình tuyến tính dễ sử dụng hơn và các đặc tính xác suất của chúng được biết đến nhiều hơn ( Teräsvirta, Tjøstheim và Granger (2010) ).

Điều đó nói rằng, OP yêu cầu các cơ sở thống kê để hướng dẫn quyết định thay vì thực tiễn hoặc lý thuyết miền, vì vậy tôi phải tiếp tục.

Trước khi dự tính làm thế nào để đối phó với việc chọn mô hình phi tuyến tính nào để làm việc, thay vào đó, người ta phải quyết định ban đầu nên làm việc với mô hình tuyến tính hay mô hình phi tuyến tính, thay vào đó. Một quyết định! Làm thế nào để đưa ra lựa chọn này?

Bằng cách kêu gọi Granger và Terasvirta (1993) , tôi chấp nhận lập luận sau đây, có hai điểm chính để trả lời cho hai câu hỏi sau.

Q: Khi nào thì hữu ích để xây dựng một mô hình phi tuyến tính? Nói tóm lại, có thể hữu ích khi xây dựng một mô hình phi tuyến tính khi lớp mô hình tuyến tính đã được xem xét và được coi là không đủ để mô tả mối quan hệ được kiểm tra. Quy trình mô hình hóa phi tuyến tính này (quy trình ra quyết định) có thể nói là đi từ đơn giản đến chung chung, theo nghĩa là nó đi từ tuyến tính sang phi tuyến tính.

Hỏi: Có căn cứ thống kê nào có thể được sử dụng để biện minh cho việc xây dựng mô hình phi tuyến tính không? Nếu một người quyết định xây dựng một mô hình phi tuyến tính dựa trên kết quả của các bài kiểm tra tuyến tính, tôi sẽ nói, vâng, có. Nếu thử nghiệm tuyến tính cho thấy rằng không có sự phi tuyến đáng kể trong mối quan hệ thì việc xây dựng mô hình phi tuyến sẽ không được khuyến nghị; thử nghiệm nên đi trước quyết định xây dựng.

Tôi sẽ bổ sung những điểm này bằng cách tham khảo trực tiếp đến Granger và Terasvirta (1993):

Trước khi xây dựng một mô hình phi tuyến, nên tìm hiểu xem thực sự mô hình tuyến tính có đặc trưng đầy đủ các mối quan hệ [kinh tế] được phân tích hay không. Nếu đây là trường hợp, sẽ có nhiều lý thuyết thống kê có sẵn để xây dựng một mô hình hợp lý hơn là nếu một mô hình phi tuyến là phù hợp. Hơn nữa, việc có được các dự báo tối ưu trong hơn một giai đoạn trước sẽ đơn giản hơn nhiều nếu mô hình là tuyến tính. Điều đó có thể xảy ra, ít nhất là khi chuỗi thời gian ngắn, điều tra viên ước tính thành công một mô hình phi tuyến mặc dù mối quan hệ thực sự giữa các biến là tuyến tính. Do đó, nguy cơ gây phức tạp không cần thiết cho việc xây dựng mô hình là có thật, nhưng có thể giảm bớt bằng cách kiểm tra tuyến tính.

Trong cuốn sách gần đây hơn, Teräsvirta, Tjøstheim và Granger (2010), cùng một loại lời khuyên được đưa ra, mà bây giờ tôi xin trích dẫn:

Từ quan điểm thực tế, [vì vậy] rất hữu ích để kiểm tra tuyến tính trước khi thử ước lượng mô hình phi tuyến phức tạp hơn. Trong nhiều trường hợp, kiểm tra thậm chí là cần thiết từ quan điểm thống kê. Một số mô hình phi tuyến phổ biến không được xác định theo tuyến tính. Nếu mô hình thực sự tạo ra dữ liệu là tuyến tính và mô hình phi tuyến mà người ta quan tâm đến việc lồng mô hình tuyến tính này, thì các tham số của mô hình phi tuyến có thể được ước tính một cách nhất quán. Do đó, kiểm tra tuyến tính phải đi trước bất kỳ mô hình và ước lượng phi tuyến.

Hãy để tôi kết thúc với một ví dụ.

Trong bối cảnh mô hình hóa các chu kỳ kinh doanh, một ví dụ thực tế về việc sử dụng các cơ sở thống kê để biện minh cho việc xây dựng một mô hình phi tuyến tính có thể như sau. Do các mô hình tự phát tuyến tính hoặc vectơ không thể tạo ra chuỗi thời gian theo chu kỳ không đối xứng, nên một phương pháp mô hình phi tuyến tính, có thể xử lý các bất đối xứng trong dữ liệu, rất đáng để xem xét. Một phiên bản mở rộng của ví dụ này về khả năng đảo ngược dữ liệu thể được tìm thấy trong Tong (1993) .

Xin lỗi nếu tôi tập trung quá nhiều vào các mô hình chuỗi thời gian. Tuy nhiên, tôi chắc chắn rằng một số ý tưởng cũng có thể áp dụng được trong các cài đặt khác.


2
Graeme, câu trả lời của bạn là tuyệt vời và, trong khi các câu trả lời khác cũng tuyệt vời, thì câu trả lời của bạn là gần nhất với những gì tôi đang tìm kiếm (một phiên bản mini, nếu bạn muốn). +1 và được chấp nhận. Tôi đánh giá rất cao nỗ lực của bạn trong việc chuẩn bị câu trả lời của bạn. Tôi chắc chắn tôi sẽ xem xét nó nhiều lần cũng như các tài liệu tham khảo. Tôi nghĩ rằng cuốn sách của Tiến sĩ Mitchell về các chiến lược hồi quy cũng chứa một số phần của khung mà tôi lý tưởng sẽ có. Nhân tiện, ý tưởng của tôi về một khung thống kê theo chủ đề được lấy cảm hứng từ cuốn sách tuyệt vời "Bản chất của suy nghĩ đa biến" của Lisa Harlow, mà tôi rất vui khi đọc.
Alexanderr Blekh 7/1/2015

12

Vấn đề bao quát là quyết định loại tuyến tính nào được dự kiến, nếu không thì cho phép các mối quan hệ là phi tuyến tính khi kích thước mẫu cho phép. Hầu hết các quá trình trong sinh học, khoa học xã hội và các lĩnh vực khác là phi tuyến. Các tình huống duy nhất mà tôi mong đợi các mối quan hệ tuyến tính là:

  1. Cơ học Newton
  2. Dự đoán từ đo được tại thời điểm sớm hơnYYY

Ví dụ sau bao gồm trường hợp một người có biến phụ thuộc cũng được đo tại đường cơ sở (thời gian 0).Y

Tôi hiếm khi thấy một mối quan hệ ở khắp mọi nơi tuyến tính trong một tập dữ liệu lớn.

Quyết định bao gồm các phi tuyến trong các mô hình hồi quy không xuất phát nhiều từ một nguyên tắc thống kê toàn cầu mà là từ cách thế giới hoạt động. Một ngoại lệ là khi một khung thống kê phụ tối ưu đã được chọn và các điều khoản phi tuyến hoặc tương tác phải được đưa ra chỉ để bù cho việc chọn sai khung. Các thuật ngữ tương tác đôi khi có thể cần thiết để bù các hiệu ứng chính (ví dụ, bằng cách giả sử tuyến tính). Nhiều hiệu ứng chính có thể cần thiết để bù đắp sự mất thông tin do việc mô hình hóa dưới các hiệu ứng chính khác.

Các nhà nghiên cứu đôi khi thống nhất về việc có bao gồm một biến nhất định trong khi họ đang bảo vệ một loạt các biến khác bằng cách buộc chúng phải hành động tuyến tính. Theo kinh nghiệm của tôi, giả định tuyến tính là một trong những vi phạm nhất trong tất cả các giả định có ý nghĩa mạnh mẽ.


2
+1 Tiến sĩ Harrell, cảm ơn bạn đã trả lời có giá trị. Tôi hiểu điểm của bạn. Tuy nhiên, tôi cũng tò mò về (và đó thực sự là bản chất của câu hỏi của tôi), khi nhà nghiên cứu hoặc nhà khoa học dữ liệu phải giới thiệu thêm các thành phần phi tuyến tính do lý thuyết thống kê hoặc các vấn đề khác nhau (bao gồm thống kê, dữ liệu, phương pháp, v.v. .), không phải lý thuyết miền chủ đề. Sẽ đánh giá cao sự hiểu biết của bạn về điều này.
Alexanderr Blekh

5
Độ tuyến tính phụ thuộc càng nhiều (hoặc nhiều hơn) vào dữ liệu so với quy trình. Hầu hết các quy trình trong hầu hết các trường là tuyến tính khi được kiểm tra trong phạm vi đủ hẹp (đó là lý do tại sao Giải tích rất hữu ích) và không tuyến tính trong phạm vi đủ rộng (bao gồm cả các quy trình cơ học). Mặc dù đúng là có ý kiến ​​cho rằng hầu hết mọi thứ có thể xuất hiện phi tuyến khi có sẵn cỡ mẫu đủ lớn, nhưng có lẽ cách thức thực tế hơn để đóng khung vấn đề sẽ là về cách quyết định khi nào hữu ích khi áp dụng mô hình tuyến tính.
whuber

2
@whuber: Cảm ơn bạn đã bình luận của bạn. Rất hữu ích. Bây giờ tôi hiểu rõ hơn về tuyến tính (không) từ hai quan điểm : lý thuyết (miền chủ đề)trung tâm dữ liệu . Tôi vẫn tò mò về các quan điểm thống kê và / hoặc phương pháp luận về việc giới thiệu phi tuyến tính bổ sung do các giả định thống kê , các vấn đề (ví dụ, sau EDA) hoặc các khía cạnh tương tự. Vì vậy, ngoài việc đóng khung đề xuất của bạn về vấn đề này, tôi cũng quan tâm đến khung ra quyết định khi nào hữu ích khi áp dụng mô hình phi tuyến tính .
Alexanderr Blekh

1
"Hầu hết các quy trình trong hầu hết các trường đều tuyến tính khi được kiểm tra trong phạm vi đủ hẹp (đó là lý do tại sao Giải tích rất hữu ích) và không tuyến tính trên một phạm vi đủ rộng" trong khi những người đã tham gia khóa học về tính toán thì cực kỳ rõ ràng. mở mắt sâu sắc cho tôi. Cảm ơn bác sĩ @whuber +1.
Mugen

3
@Aleksandr Blekh bạn đang tìm kiếm, giả sử, một bài kiểm tra thống kê hoặc một âm mưu còn lại sẽ cung cấp cho bạn một lý do thống kê (trái ngược với lý do đến từ lý thuyết cơ bản) để biện minh cho việc sử dụng mô hình phi tuyến tính?
Mugen

4

Khi xây dựng mô hình tôi luôn thử các bình phương của các biến cùng với các thành phần tuyến tính. Chẳng hạn, khi xây dựng mô hình hồi quy đơn giản tôi sẽ ném vào một thuật ngữ vuông Nếu có ý nghĩa có thể là một trường hợp cho một mô hình phi tuyến. Trực giác tất nhiên là bản mở rộng Taylor. Nếu bạn có hàm tuyến tính, chỉ đạo hàm đầu tiên phải là khác không. Đối với các hàm phi tuyến, các đạo hàm bậc cao hơn sẽ là khác không.y i = α + β x i + γ x 2 i + ε i γ

yi=α+βxi+εi
yi=α+βxi+γxi2+εi
γ

Tôi cũng thường thử ứng viên đặc tả không đối xứng: Nếu là đáng kể, thì điều đó khiến tôi cân nhắc khám phá thông số kỹ thuật bất đối xứng.

yi=α+βmax(0,xi)+γmin(0,xi)+εi
γβ

Đôi khi, tôi có một số giá trị hoặc dải đặc biệt trong dữ liệu của mình; hoặc biểu đồ của tôi về các biến giải thích có kinks và điểm uốn. Vì vậy, tôi thử các spline tuyến tính xung quanh các điểm hoặc vùng đặc biệt này. Các spline tuyến tính đơn giản nhất sẽ là: Điều này sẽ giới thiệu các độ dốc khác nhau cho trước và sau điểm . Bạn có thể có một số độ dốc cho cùng một biến trong các khu vực khác nhau. Nếu spline tuyến tính của tôi là đáng kể, thì tôi hoặc chơi với các điểm nút và sử dụng nó, hoặc nghĩ về các mô hình phi tuyến.

xa=min(x,a)
xa+=max(x,a)
xx=a

Đây không phải là cách tiếp cận có hệ thống, nhưng nó chỉ là một trong những điều tôi luôn làm.


1
+1 Hiểu biết thú vị. Cảm ơn bạn đã chia sẻ - thật tốt khi biết. Những gì tôi muốn có (hoặc thậm chí chuẩn bị) là một khuôn khổ / quy trình làm việc mạch lạc của các cách tiếp cận tương tự (lớn và nhỏ) với lý luận cơ bản cơ bản. Bạn có nghĩ rằng việc tạo khung như vậy sẽ là 1) khả thi và 2) có giá trị cho người khác không?
Alexanderr Blekh

1
@AleksandrBlekh, tôi không nghĩ có thể tạo ra khuôn khổ chung. Cái chung nhất trong chuỗi thời gian là Box-Jenkins.
Aksakal

4
Kiểm tra thống kê để lựa chọn mô hình sẽ làm sai lệch các ước tính và đặc biệt là các lỗi tiêu chuẩn.
Frank Harrell

1
@ssdecontrol, đối số mở rộng Taylor cũng khiến tôi cảnh giác về việc không sử dụng các thuật ngữ đa thức bậc thấp hơn. Chẳng hạn, nếu một đặc tả ứng viên là , thì bạn phải có ý kiến ​​mạnh mẽ về hình dạng của mô hình của bạn. yi=β2xi2+εi
Aksakal

2
@ssdecontrol: Xem Venables (1998), "Exegeses on linear model", Hội nghị người dùng S-Plus, Washington DC để biết thêm về loạt phim heuristic của Taylor.
Scortchi - Phục hồi Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.