Trung bình của betas từ Y ~ X và X ~ Y có hợp lệ không?


7

Tôi quan tâm đến mối quan hệ giữa hai biến chuỗi thời gian: YX. Hai biến có liên quan với nhau và không rõ lý thuyết cái nào gây ra cái kia.

Vì điều này, tôi không có lý do chính đáng để thích hồi quy tuyến tính Y=α+βX kết thúc X=κ+γY.

Rõ ràng có một số mối quan hệ giữa βγ, mặc dù tôi nhớ lại đủ số liệu thống kê để hiểu rằng β=1/γlà không đúng sự thật. Hoặc có lẽ nó thậm chí không gần? Tôi hơi mơ hồ.

Vấn đề là quyết định bao nhiêu X người ta phải chống lại Y.

Tôi đang xem xét lấy trung bình của β1/γ và sử dụng như là tỷ lệ hedge.

Là trung bình của β1/γ một khái niệm có ý nghĩa?

Và như một câu hỏi phụ (có lẽ đây là một bài đăng khác), cách thích hợp để đối phó với thực tế là hai biến có liên quan với nhau - có nghĩa là thực sự không có biến độc lập và phụ thuộc?


1
Vấn đề không phải là nguyên nhân mà thay vào đó là các lỗi đo lường (thường là biến phụ thuộc Y là lỗi có số đo lớn, tạo ra "Y = a + B x + error" biểu thức chung) Bạn có ý tưởng về các lỗi trong phép đo X và Y.
Sextus Empiricus

1
Các giá trị chính xác của βγcó thể được tìm thấy trong câu trả lời này của tôi về Hiệu ứng chuyển đổi câu trả lời và các biến giải thích ... , và, như bạn nghi ngờ,β không phải là đối ứng của γvà trung bình β1/γkhông phải là cách đúng đắn để đi Một cái nhìn hình ảnh của những gìβγđang giảm thiểu được đưa ra trong câu trả lời của Elvis cho cùng một câu hỏi và anh ta giới thiệu một hồi quy "hình chữ nhật nhỏ nhất" mà bạn có thể muốn .....
Dilip Sarwate

3
Bạn đang ở trong kịch bản lý tưởng nơi sự lựa chọn kỹ thuật có tác động trực tiếp, có thể đo lường được; bạn chỉ có thể đo lỗi bảo hiểm rủi ro ngoài mẫu cho từng ước tính và so sánh chúng. Ngoài ra, bảo hiểm rủi ro tối ưu thường được xử lý tốt hơn bằng cách sử dụng mô hình VECM (ví dụ: Gatarek & Johansen, 2014, Bảo hiểm rủi ro tối ưu với mô hình tự phát vectơ kết hợp ), không yêu cầu chọn mô hình Y làm chức năng của X hoặc ngược lại .
Chris Haug

1
Bạn có thể muốn nhìn vào ý nghĩa hình học βγnhư một khả năng (nếu cả hai đều âm, bạn có thể lấy căn bậc hai âm). Sau đó nhìn vàosysx, rất giống nhau
Henry

1
@ricardo Lưu ý rằng tôi đã chỉ định lỗi ngoài mẫu , do đó, không phù hợp (trong mẫu) của mô hình. Và hoàn toàn có thể thay đổi tỷ lệ phòng ngừa tối ưu thay đổi theo thời gian (đặc biệt nếu mối quan hệ không thực sự tuyến tính), điều đó không thay đổi thực tế rằng việc tìm ra chiến lược phòng ngừa rủi ro tốt nhất có thể được thực hiện trực tiếp nhất bằng cách kiểm tra lại mô hình và quan sát kết quả.
Chris Haug

Câu trả lời:


11

Để xem kết nối giữa cả hai biểu diễn, hãy lấy một vectơ bình thường:

(X1X2)N((μ1μ2),(σ12ρσ1σ2ρσ1σ2σ22))
với điều kiện
X1X2=x2N(μ1+ρσ1σ2(x2μ2),(1ρ2)σ12)
X2X1=x1N(μ2+ρσ2σ1(x1μ1),(1ρ2)σ22)
Điều này có nghĩa rằng
X1=(μ1ρσ1σ2μ2)α+ρσ1σ2βX2+1ρ2σ1ϵ1
X2=(μ2ρσ2σ1μ1)κ+ρσ2σ1γX1+1ρ2σ2ϵ2
có nghĩa là (a) γ không phải 1/β và (b) kết nối giữa hai hồi quy phụ thuộc vào phân phối chung của (X1,X2).


Làm thế nào tôi có thể quyết định nếu trung bình của hai betas là thước đo tốt hơn của tỷ lệ hedge so với cái này hay cái kia?
ricardo

4
Tôi không có ý kiến.
Tây An

@ricardo Bằng cách đo lỗi bảo hiểm rủi ro ngoài mẫu theo từng ước tính, đây là điều cuối cùng bạn đang cố gắng giảm thiểu.
Chris Haug

3

Chuyển đổi từ một bình luận .....

Các giá trị chính xác của βγ có thể được tìm thấy trong câu trả lời này của tôi về Hiệu ứng chuyển đổi các phản ứng và các biến giải thích trong hồi quy tuyến tính đơn giản , và, như bạn nghi ngờ, β không phải là đối ứng của γvà trung bình βγ (hoặc tính trung bình β1/γ) không phải là cách đúng đắn để đi. Một cái nhìn hình ảnh của những gìβγ việc tối thiểu hóa được đưa ra trong câu trả lời của Elvis cho cùng một câu hỏi và trong câu trả lời, anh ta giới thiệu một hồi quy "hình chữ nhật nhỏ nhất" có thể là điều bạn đang tìm kiếm. Không nên bỏ qua các bình luận sau câu trả lời của Elvis; họ liên hệ hồi quy "hình chữ nhật nhỏ nhất" này với các kỹ thuật khác, đã được nghiên cứu trước đây. Cụ thể, lưu ý rằng Moderator chl chỉ ra rằng phương thức này được quan tâm khi không rõ đó là biến dự đoán và biến phản ứng nào.


3

βγ

Như Xi'an đã lưu ý trong câu trả lời của mình βγ có liên quan với nhau bằng cách liên quan đến các phương tiện có điều kiện X|YY|X(mà lần lượt của họ liên quan đến một đơn phân phối chung) đây không phải là đối xứng theo nghĩa làβ1/γ. Đây không phải là trường hợp nếu bạn 'biết' sự thậtσρthay vì sử dụng ước tính. Bạn có

β=ρXYσYσX
γ=ρXYσXσY

hoặc bạn có thể nói

βγ=ρXY21

Xem thêm hồi quy tuyến tính đơn giản trên wikipedia để tính toánβγ.

Đây là thuật ngữ tương quan mà làm xáo trộn sự đối xứng. Khi màβγ sẽ chỉ đơn giản là tỷ lệ của độ lệch chuẩn σY/σXσX/σYsau đó họ thực sự sẽ là nghịch đảo của nhau. CácρXYthuật ngữ có thể được coi là sửa đổi điều này như là một loại hồi quy trung bình .

  • Với sự tương quan hoàn hảo ρXY=1 sau đó bạn hoàn toàn có thể dự đoán X dựa trên Yhoặc ngược lại. Độ dốc sẽ bằng nhau
    βγ=1
  • Nhưng với sự tương quan ít hơn hoàn hảo, ρXY<1, bạn không thể thực hiện những dự đoán hoàn hảo đó và giá trị trung bình có điều kiện sẽ gần hơn với giá trị trung bình vô điều kiện, so với tỷ lệ đơn giản bằng σY/σX hoặc là σX/σY. Độ dốc của các đường hồi quy sẽ ít dốc hơn. Các sườn sẽ không liên quan với nhau vì sản phẩm của nhau và sản phẩm của chúng sẽ nhỏ hơn một
    βγ<1

Là một đường hồi quy là phương pháp đúng?

Bạn có thể tự hỏi liệu các xác suất và đường hồi quy có điều kiện này có phải là những gì bạn cần để xác định tỷ lệ của bạn về XY. Tôi không rõ bạn muốn sử dụng đường hồi quy như thế nào trong việc tính toán tỷ lệ tối ưu.

Dưới đây là một cách khác để tính tỷ lệ. Phương pháp này không có tính đối xứng (tức là nếu bạn chuyển X và Y thì bạn sẽ có cùng tỷ lệ).


Thay thế

Nói, lợi suất của trái phiếu XY được phân phối theo phân phối chuẩn nhiều biến với mối tương quan ρXY và độ lệch chuẩn σXσY sau đó sản lượng của một hàng rào là tổng của XY sẽ được phân phối bình thường:

H=αX+(1α)YN(μH,σH2)

0α1 và với

μH=αμX+(1α)μYσH2=α2σX2+(1α)2σY2+2α(1α)ρXYσXσY=α2(σX2+σY22ρXYσXσY)+α(2σY2+2ρXYσXσY)+σY2

Tối đa của giá trị trung bình μH sẽ ở

α=0 or α=1
hoặc không tồn tại khi μX=μY.

Tối thiểu của phương sai σH2 sẽ ở

α=1σX2ρXYσXσYσX2+σY22ρXYσXσY=σY2ρXYσXσYσX2+σY22ρXYσXσY

Tối ưu sẽ ở đâu đó ở giữa hai thái cực đó và phụ thuộc vào cách bạn muốn so sánh tổn thất và lợi nhuận

Lưu ý rằng bây giờ có một sự đối xứng giữa α1α. Không quan trọng bạn có sử dụng hàng rào khôngH=α1X+(1α1)Y hoặc hàng rào H=α2Y+(1α2)X. Bạn sẽ nhận được tỷ lệ tương tự vềα1=1α2.

Trường hợp phương sai tối thiểu và quan hệ với các thành phần nguyên tắc

Trong trường hợp phương sai tối thiểu (ở đây bạn thực sự không cần phải giả sử phân phối Bình thường nhiều biến số), bạn có được tỷ lệ hedge sau là tối ưu

α1α=var(Y)cov(X,Y)var(X)cov(X,Y)
có thể được biểu thị dưới dạng các hệ số hồi quy β=cov(X,Y)/var(X)γ=cov(X,Y)/var(Y) và như sau
α1α=1β1γ

Trong một tình huống có nhiều hơn hai biến / cổ phiếu / trái phiếu, bạn có thể khái quát điều này đến thành phần nguyên tắc cuối cùng (giá trị riêng nhỏ nhất).


Biến thể

Những cải tiến của mô hình có thể được thực hiện bằng cách sử dụng các phân phối khác nhau so với đa biến thông thường. Ngoài ra, bạn có thể kết hợp thời gian trong một mô hình phức tạp hơn để đưa ra dự đoán tốt hơn về các giá trị / phân phối trong tương lai cho cặpX,Y.


Đây là một sự đơn giản hóa nhưng nó phù hợp với mục đích giải thích làm thế nào người ta có thể, và nên, thực hiện phân tích để tìm ra một tỷ lệ tối ưu mà không cần đường hồi quy.


1
Tôi xin lỗi, nhưng là một nhà vật lý, tôi biết quá ít về ngôn ngữ (dài, ngắn, nắm giữ, v.v.) liên quan đến cổ phiếu, trái phiếu và tài chính. Nếu bạn có thể sử dụng ngôn ngữ đơn giản hơn, tôi có thể hiểu và làm việc với nó. Câu trả lời của tôi chỉ là một biểu thức rất đơn giản, không biết về các chi tiết và khả năng làm thế nào để thể hiện bảo hiểm rủi ro và cổ phiếu, nhưng nó cho thấy nguyên tắc cơ bản làm thế nào bạn có thể thoát khỏi việc sử dụng đường hồi quy (quay lại các nguyên tắc đầu tiên, thể hiện mô hình cho lợi nhuận là cốt lõi thay vì sử dụng các đường hồi quy có mức độ liên quan không trực tiếp rõ ràng).
Sextus Empiricus

Tôi nghĩ rằng tôi hiểu. Vấn đề là 1 / ρ_ {XY} \ ne p_ {XY}.indeed,p_ {XY} $ thường thay đổi khá nhiều và bit khi chúng ta thực hiện nghịch đảo. Sự thay thế của bạn gần với trường hợp tôi đang nghĩ đến, nhưng tôi muốn kiểm tra một điều: điều này có cho phép nắm giữ không tiêu cực không? Thông qua thuật ngữ của bạn, tôi sẽ có một đơn vị nắm giữ trái phiếu X và nắm giữ âm của Y. Nói dài một đơn vị trái phiếu X và ngắn (nói) 1,2 đơn vị trái phiếu Y ... nhưng nó có thể là 0,2 đơn vị hoặc 5 đơn vị, tùy thuộc vào toán học.
ricardo

dài có nghĩa là tôi kiếm được 1% trên trái phiếu nếu giá tăng ~ 1%; ngắn có nghĩa là tôi mất ~ 1% trên trái phiếu nếu giá tăng ~ 1%. Vì vậy, ý tưởng là tôi dài một đơn vị của một trái phiếu (vì vậy tôi được hưởng lợi từ sự đánh giá cao) và thiếu một số lượng của trái phiếu khác (vì vậy tôi mất từ ​​một sự đánh giá cao).
ricardo

"Vấn đề là quyết định số tiền của một người nên chống lại Y." Vấn đề của tôi với điều này là không có lời giải thích / mô hình / biểu hiện như thế nào bạn quyết định về điều này. Làm thế nào để bạn xác định thua lỗ và lợi nhuận và bạn định giá chúng bao nhiêu?
Sextus Empiricus

Có chi phí liên quan đến việc ngắn và dài? Tôi tưởng tượng rằng bạn có một khoản tiền nhất định để đầu tư và điều này giới hạn số tiền bạn có thể rút ngắn / dài trong các trái phiếu đó. Sau đó, dựa trên kiến ​​thức trước đây của bạn, bạn có thể ước tính / xác định phân phối tổn thất / lợi nhuận cho bất kỳ kết hợp nào trên giới hạn đó. Cuối cùng, dựa trên một số chức năng xác định cách bạn định giá các khoản lỗ và lãi (điều này thể hiện tại sao / cách bạn phòng ngừa), bạn có thể quyết định lựa chọn kết hợp nào.
Sextus Empiricus

1

Có lẽ cách tiếp cận của "nhân quả Granger" có thể giúp ích. Điều này sẽ giúp bạn đánh giá xem X là một người dự đoán tốt về Y hay liệu X tốt hơn Y. Nói cách khác, nó cho bạn biết liệu beta hay gamma là điều cần nghiêm túc hơn. Ngoài ra, xem xét rằng bạn đang xử lý dữ liệu chuỗi thời gian, nó cho bạn biết bao nhiêu lịch sử của X được tính vào dự đoán của Y (hoặc ngược lại).

Wikipedia đưa ra một lời giải thích đơn giản: Một chuỗi thời gian X được nói với Granger - nguyên nhân Y nếu nó có thể được hiển thị, thường thông qua một loạt các thử nghiệm t và thử nghiệm F về các giá trị bị trễ của X (và cũng bao gồm các giá trị trễ của Y) , rằng các giá trị X đó cung cấp thông tin có ý nghĩa thống kê về các giá trị tương lai của Y.

Những gì bạn làm là như sau:

  • hồi quy X (t-1) và Y (t-1) trên Y (t)
  • hồi quy X (t-1), X (t-2), Y (t-1), Y (t-2) trên Y (t)
  • hồi quy X (t-1), X (t-2), X (t-3), Y (t-1), Y (t-2), Y (t-3) trên Y (t)

Tiếp tục cho bất cứ điều gì chiều dài lịch sử có thể là hợp lý. Kiểm tra tầm quan trọng của thống kê F cho mỗi hồi quy. Sau đó thực hiện tương tự ngược lại (vì vậy, bây giờ hồi quy các giá trị trong quá khứ của X và Y trên X (t)) và xem hồi quy nào có giá trị F đáng kể.

Một ví dụ rất đơn giản, với mã R, được tìm thấy ở đây . Nhân quả Granger đã được phê bình vì không thực sự thiết lập quan hệ nhân quả (trong một số trường hợp). Nhưng có vẻ như ứng dụng của bạn thực sự là về "nhân quả dự đoán", đó chính xác là cách tiếp cận quan hệ nhân quả Granger dành cho.

Vấn đề là cách tiếp cận sẽ cho bạn biết liệu X dự đoán Y hay liệu Y dự đoán X (vì vậy bạn sẽ không còn bị cám dỗ giả tạo - và không chính xác - kết hợp hai hệ số hồi quy) và nó cho bạn dự đoán tốt hơn (như bạn sẽ biết bao nhiêu lịch sử của X và Y bạn cần biết để dự đoán Y), rất hữu ích cho mục đích phòng ngừa rủi ro, phải không?


Tôi có một lý do lý thuyết mạnh mẽ để tin rằng không thực sự là một nguyên nhân, và ngay cả khi một nguyên nhân trở thành nguyên nhân thì nó sẽ không còn đúng theo thời gian. Vì vậy, tôi không nghĩ rằng Granger Causailty là câu trả lời trong trường hợp này. Tôi đã đưa ra câu trả lời trong mọi trường hợp, vì nó hữu ích - đặc biệt. mã R.
ricardo

Đó là lý do tại sao tôi đề cập rõ ràng rằng "quan hệ nhân quả Granger đã bị phê phán vì không thực sự thiết lập quan hệ nhân quả (trong một số trường hợp)." Dường như với tôi rằng câu hỏi của bạn liên quan nhiều hơn đến việc thiết lập "quan hệ nhân quả tiên đoán", đó là ý nghĩa của nhân quả Granger. Ngoài ra, cách tiếp cận của Granger sử dụng thông tin trong dữ liệu chuỗi thời gian của bạn, đây là một sự lãng phí không nên sử dụng nếu bạn có chúng. Tất nhiên, bạn có thể (nên?) Ước tính lại các hiệu ứng theo thời gian. Tôi hy vọng rằng các hiệu ứng Granger ổn định hơn OLS cắt ngang (bạn có thể kiểm tra điều này trước, sử dụng dữ liệu lịch sử). HTH
Steve G. Jones
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.