Một định nghĩa nghiêm ngặt về mối quan hệ hình chữ U là gì?


7

Bây giờ tôi đã thấy một số bài viết phân tích mối quan hệ hình chữ U hoặc hình chữ U ngược giữa các biến (trong khung hồi quy). Sự hiểu biết chung mà tôi có từ đó là nó là một loại cụ thể của một mối quan hệ phi tuyến tính mà tất cả chúng ta có thể dễ dàng hình dung.

Tuy nhiên, tôi hơi bối rối về cách chính xác mọi người xác định toán học các hàm hồi quy hình chữ U. Giả sử cho đơn giản chỉ có hồi quy .x

Có hàm hồi quy hình chữ U có nghĩa là hàm hồi quy là lồi và giảm theo đến một số điểm và sau đó sau là lồi và tăng theo ?xccx

Hay nó chỉ đơn giản có nghĩa là hàm hồi quy đang giảm theo đến một số điểm và sau đó sau khi tăng theo ?xccx


3
Các tác giả khác nhau có thể có định nghĩa khác nhau - mối quan hệ có nên liên tục? Khác biệt? Lồi lõm? Định nghĩa chung nhất phù hợp với ý tưởng "tăng rồi giảm" hoặc "giảm rồi tăng" là: Bản đồ với có nghĩa là "hình chữ U" tồn tại sự phân rã trong đó (1) mọi phần tử của nhỏ hơn hoặc bằng mọi phần tử của ; (2) là đơn điệu trên cả và ; (3) hình ảnh và có ít nhất hai giá trị mỗi giá trị; và (4) các hướng đơn điệu củaf:ARARA=BCBCfBCf(B)f(C)fkhác nhau trên và . BC
whuber

@whuber Đây chính xác là những gì tôi đang tìm kiếm - nếu có một thỏa thuận chung về cách định nghĩa nó ....
Neznajka

2
Tôi không thể chứng thực một thỏa thuận chung - và tôi chắc chắn rằng nhiều tác giả sẽ phản đối rằng định nghĩa của tôi rộng hơn họ dự định. Đó là lý do tại sao tôi đã để lại nó như một bình luận.
whuber

3
Tôi không nghĩ "hình chữ U" là một thuật ngữ được định nghĩa tốt về mặt toán học; không có định nghĩa được chấp nhận phổ biến và tôi không nghĩ bạn nên tìm kiếm nó. Tôi đã thay đổi hai câu đầu tiên trong câu trả lời của mình để nhấn mạnh điều đó.
amip

Câu trả lời:


8

Câu trả lời ngắn cho câu hỏi của bạn (như đã nêu ở nơi khác) là không có định nghĩa toán học duy nhất về hình chữ U. Nhận xét của @whuber là định nghĩa chung tốt nhất mà tôi đã thấy.

Tôi thực hiện nghiên cứu về các thử nghiệm về hình chữ U và trong bài thuyết trình của mình, tôi có một slide với tiêu đề "Chữ U có ý nghĩa gì với bạn?", Nghĩa là chủ quan của mọi người về thuật ngữ "hình chữ U". Điều quan trọng nhất là khi bạn sử dụng thuật ngữ "hình chữ U", bạn xác định chính xác những gì bạn có nghĩa là bởi nó, mà không cần giả định rằng những người khác sẽ biết những gì bạn có ý nghĩa.

Vì bạn đã chỉ định trường hợp chỉ có một biến hồi quy, tôi sẽ tập trung vào đó. Tôi đã thấy các định nghĩa sau được sử dụng trong các bài viết khác nhau:

  • Một hình chữ U là một bậc hai.
  • Hình chữ U có nghĩa là độ lồi (đối với một ứng dụng dọc theo các dòng này, xem Van Landeghem's 2012 "Một thử nghiệm cho sự lồi lõm của sức khỏe con người trong vòng đời: Bằng chứng theo chiều dọc từ bảng điều khiển 20 năm").
  • Hình chữ U là một hàm có âm tính đạo hàm trung bình có trọng số cho đến khi một điểm và đạo hàm trung bình có trọng số dương sau điểm đó (xem Hai dòng của Uri Simonsohn : Thử nghiệm hợp lệ đầu tiên về mối quan hệ hình chữ U ).
  • Hình chữ U là một hàm có chính xác một bước ngoặt. Điều này tương ứng với một chức năng gần như lồi nhưng không đơn điệu.

Một điều phức tạp xuất hiện là nếu bước ngoặt gần với điểm cuối của phạm vi của biến x thì sao? Chúng ta vẫn nên coi một chức năng như vậy là một hình chữ U? Theo tôi, nên có một cuộc thảo luận như vậy khi bạn xác định hình chữ U có ý nghĩa gì với ứng dụng của bạn và khi bạn chỉ định giả thuyết khống.

Định nghĩa tôi sử dụng trong bài báo của mình, Thử nghiệm không tham số về các mối quan hệ hình chữ U , như sau:

Hãy là hàm hồi quy và để cho được sự hỗ trợ của . Đối với một tập hợp được chỉ định , chúng tôi quan tâm đến việc kiểm tra các mục sau:m(x)S(X)XA0S(X)

H0:aA0 st xS(X)m(x)(xa)0versusHA:aA0,xS(X) stm(x)(xa)<0

Ví dụ, trong một ứng dụng tôi kiểm tra hình chữ U về sự hài lòng của cuộc sống ở độ tuổi từ 20 đến 70, trong đó bước ngoặt nằm trong độ tuổi từ 30 đến 60. Các quyết định tùy tiện là cần thiết với khung đề xuất này. Điều quan trọng là phải cởi mở về chúng và kiểm tra xem kết quả nhạy cảm như thế nào đối với những thay đổi (và thách thức những người khác làm điều tương tự).

Ngoài việc nêu ra giả thuyết khống, như mọi khi bạn nên nêu ra các giả định mà bạn dựa vào. Ví dụ, một giả định phổ biến là hàm hồi quy có dạng hình chữ U trên đơn điệu. Xem, ví dụ, Lind và Mehlum năm 2009 "Có hay không có U? Thử nghiệm phù hợp cho mối quan hệ hình chữ U", trong đó họ đề xuất cải tiến thử nghiệm bậc hai OLS vanilla bằng cách kiểm tra rằng đạo hàm của một dạng chức năng xác định là âm tính tại bắt đầu của phạm vi, và tích cực ở cuối.

Một điểm bổ sung cần xem xét là: Bạn có muốn một bài kiểm tra bác bỏ giả thuyết khống vì một vi phạm nhỏ về hình chữ U không? Nếu có, hãy xem xét gói R qmutest , thực hiện một thử nghiệm không tham số dựa trên các hàm giả thuyết null cho rằng hàm hồi quy là quasi-lồi và riêng biệt rằng nó là đơn điệu. Nếu bạn không muốn thử nghiệm đưa ra suy luận về hình chữ U vì vi phạm nhỏ, thử nghiệm hai dòng của Uri có thể là tốt nhất nếu bạn muốn kiểm tra rằng hàm hồi quy chủ yếu giảm và sau đó chủ yếu tăng.

Vì câu hỏi của bạn là về việc sử dụng thuật ngữ "hình chữ U" và định nghĩa, tôi thấy nó có liên quan để liệt kê một số thuật ngữ ở đây thường được sử dụng để chỉ cùng một từ "hình chữ U" và "hình chữ U ngược "Được dùng để chỉ:" hình thung lũng "," hình máng "," hình ngọn đồi "," không nguyên hình "," đỉnh đơn "và" hình chuông ". Không có lý do cố hữu tại sao "hình chữ U" là một thuật ngữ tốt hơn so với những người khác, nhưng việc sử dụng nó dường như đã bắt kịp.

Tôi đang làm việc với gói R chung sẽ chỉ là giao diện cho các gói R cụ thể (chẳng hạn như qmutest) kiểm tra các mối quan hệ hình chữ U tuy nhiên họ chọn xác định chúng. Mục tiêu sẽ là giúp người dùng so sánh các thử nghiệm khác nhau và suy nghĩ kỹ về giả thuyết null chính xác mà họ muốn kiểm tra và giả định nào họ chuẩn bị thực hiện.


1
+1. Tôi hơi bối rối bởi câu này: "Bạn có muốn một bài kiểm tra bác bỏ giả thuyết khống vì một vi phạm nhỏ về hình chữ U không?" Tôi giả sử rằng null là không có hình chữ U, do đó, giá trị p đủ nhỏ là bằng chứng của hình chữ U, điều đó có đúng không?
amip

1
(Tôi rất vui khi thấy bạn ưu tiên đề cập đến bài viết của Uri: Tôi đã đề cập đến nó trong câu trả lời của tôi ở đây và nó đã bị chỉ trích nặng nề trong các bình luận.)
amoeba

3
(+1) Rất đẹp, chu đáo, tổng quan có thẩm quyền. Chào mừng đến với trang web của chúng tôi!
whuber

1
@amoeba Khi tôi sử dụng "hình chữ U", tôi đang đề cập đến định nghĩa 4 ở trên (một hàm có chính xác một bước ngoặt). Đối với thử nghiệm của tôi, null là hình chữ U. Điều tôi muốn nói là không có triệu chứng hình dạng chữ U sẽ bị từ chối nếu có bất kỳ vi phạm nào về hình chữ U trong hàm hồi quy cơ bản (ví dụ: có hai bước ngoặt). Đây không phải là trường hợp thử nghiệm của Uri vì thử nghiệm hai dòng là về đạo hàm trung bình. Vì vậy, có thể có những cái lắc lư mà không nhất thiết dẫn đến suy luận tiệm cận đối với hình chữ U.
scottkosty

1
@amoeba Ví dụ, xem hàm có nhãn "sin" trong Hình 2 của bài viết của tôi. Tôi tin rằng (mặc dù tôi chưa kiểm tra) rằng thử nghiệm hai dòng sẽ đưa ra suy luận tiệm cận cho thấy "tội lỗi" là hình chữ U, mặc dù nó có ba bước ngoặt.
scottkosty

7

"Mối quan hệ hình chữ U" không phải là một thuật ngữ chính xác về mặt toán học và không có định nghĩa được chấp nhận phổ biến. Nó thường có nghĩa là mối quan hệ đầu tiên giảm dần và sau đó tăng lên, hoặc ngược lại.

Nói cách khác, nó có nghĩa là mối quan hệ không đơn điệu (không đơn điệu), mà thay vào đó có chính xác một cực trị (tối đa hoặc tối thiểu). Trong khoa học máy tính, điều này đôi khi được gọi là "bitonic" .

Uri Simonsohn gần đây đã viết một bài báo thú vị về việc thử nghiệm các mối quan hệ hình chữ U. Xem bản in hai dòng của anh ấy : Một giải pháp thay thế hợp lệ cho việc kiểm tra không hợp lệ các mối quan hệ hình chữ U với các áp lực bậc hai rất dễ đọc và gây cười. Đây là cách bài báo bắt đầu:

Có những điều như quá nhiều lựa chọn, đức tính, hoặc ví dụ trong một câu mở đầu? Các nhà nghiên cứu thường quan tâm đến các loại câu hỏi này, trong việc đánh giá xem tác động của đối là dương đối với các giá trị thấp của , nhưng âm đối với các giá trị cao của . Để dễ giải thích, tôi đề cập đến tất cả các mối quan hệ như 'hình chữ u', cho dù chúng có đối xứng hay không (nghĩa là hình chữ U hoặc hình chữ J) và liệu tác động của đối đi từ âm sang dương hay ngược lại ( tức là U hoặc ngược-U).xyxxxy

Điều này hỗ trợ định nghĩa tôi đã đưa ra ở trên.


Để có cái nhìn ngắn giấy Uri, người ta có thể đọc mình DataColada bài Hai dòng: Các thử nghiệm hợp lệ đầu tiên của mối quan hệ U-Shaped . Điểm chính là việc sử dụng hồi quy bậc hai để kiểm tra sự hiện diện của mối quan hệ hình chữ U là rất rất sai. Rõ ràng sự phù hợp bậc hai thường được sử dụng trong một số lĩnh vực để tranh luận về mối quan hệ hình chữ U (nghĩa là kiểm tra t cho thuật ngữ bậc hai được coi là phép thử của hình chữ U); điều này thật rắc rối

Đây là con số chính:

Mối quan hệ hình chữ U

Cập nhật: Có một số lời chỉ trích về bài viết của Uri trong các bình luận. Tôi muốn nhấn mạnh rằng ông không bao giờ gợi ý rằng sự phù hợp hai dòng không liên tục được cho là mô hình hóa dữ liệu tốt (hoặc bước nhảy khi gián đoạn có một số ý nghĩa vật lý). Không. Sự phù hợp này được sử dụng cho mục đích duy nhất là cung cấp một bài kiểm tra thống kê về hình chữ U.

Tất nhiên tôi đồng ý với @FrankHarrell rằng việc sử dụng mô hình spline để phù hợp với các mối quan hệ phi tuyến như vậy sẽ hợp lý hơn nhiều. Nhưng spline không cung cấp một bài kiểm tra về hình chữ U, trong khi sự phù hợp hai dòng của Uri thì có.


4
Tôi muốn nói rằng một đường cong bậc hai hướng về phía trước, ở một độ dốc khác nhau. Mà tôi tin là một cách rất rất tốt (hoặc ít nhất là cách dễ dàng, trong nhiều trường hợp) để kiểm tra điều đó. Tuy nhiên, một cách rất xấu để thể hiện mối quan hệ cơ bản (thật), đặc biệt là, nếu bạn có thể nói, tính không hợp lý của một mối quan hệ.
Sextus Empiricus

4
Tôi chỉ đọc nó. Ông nói, "buộc hai dòng kết nối giới thiệu thiên vị". Thật là một cuộc cãi vã kỳ lạ. Cho phép họ không kết nối giới thiệu những điều không thể. Tôi thấy toàn bộ đối số hai dòng yếu. Nó dường như chỉ là tránh splines.
Frank Harrell

2
@FrankHarrell Chà, tôi tưởng tượng rằng thật khó (nếu có thể) để đưa ra giá trị p cho hình chữ U dựa trên mô hình splines. Tôi đoán trong nhiều trường hợp, nó đủ để xây dựng một mô hình splines tốt và sau đó chỉ cần nhìn nó để xem liệu có bất kỳ bằng chứng nào về hình chữ U không. Và dù sao bạn cũng không thích giá trị p. Vậy là tốt rồi. Nhưng bài báo này đang cố gắng phát triển một số công cụ cho các nhà nghiên cứu muốn tính giá trị p cho hình chữ U; và công cụ này rõ ràng không nên có tỷ lệ dương tính giả vô lý như thuật ngữ bậc hai trong hồi quy không ... Ít nhất đó là sự hiểu biết của tôi.
amip

3
Tôi không thấy lập luận của anh ấy mạnh mẽ. Splines có nhiều khả năng phù hợp; Tại sao dừng lại ở song tuyến hoặc thậm chí trình bày nó một cách nghiêm túc? Với spline, kiểm tra sự liên kết (độ phẳng) và phi tuyến là không đáng kể. Thử nghiệm cho sự không đơn điệu là một thách thức; muốn xem một tài liệu tham khảo về điều đó. Liên quan đến việc chỉ kiểm tra tính phi tuyến tính (nhưng bỏ qua tính chính xác của dự đoán), tứ giác thực hiện một công việc khá tốt. Phương pháp hai dòng rất phụ thuộc vào nơi bạn đặt gián đoạn.
Frank Harrell

3
Mặc dù tôi yêu mô hình Bayes nhưng tôi không tin rằng thử nghiệm suy nghĩ tưởng tượng một điểm thay đổi là con đường thẳng nhất để đi. Tôi thà thấy một sự phù hợp trơn tru linh hoạt với một phân phối trước cho mức độ không đơn điệu.
Frank Harrell
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.