Có tương quan giả định văn phòng phẩm của dữ liệu?


27

Phân tích liên thị trường là một phương pháp mô hình hóa hành vi thị trường bằng cách tìm kiếm mối quan hệ giữa các thị trường khác nhau. Thông thường, một mối tương quan được tính toán giữa hai thị trường, ví dụ như kho bạc S & P 500 và 30 năm của Hoa Kỳ. Những tính toán này thường xuyên hơn không dựa trên dữ liệu giá, điều hiển nhiên với mọi người là nó không phù hợp với định nghĩa của chuỗi thời gian đứng yên.

Các giải pháp khả thi sang một bên (sử dụng lợi nhuận thay thế), là sự tính toán tương quan có dữ liệu không cố định ngay cả một phép tính thống kê hợp lệ?

Bạn có nói rằng một tính toán tương quan như vậy là hơi không đáng tin cậy, hoặc chỉ vô nghĩa?


1
Bạn có ý nghĩa gì khi "tính toán thống kê hợp lệ", bạn nên nói tính toán thống kê (ước tính) hợp lệ của một cái gì đó. Ở đây một cái gì đó rất quan trọng. Tương quan là một tính toán hợp lệ của mối quan hệ tuyến tính giữa hai bộ dữ liệu. Tôi không thấy lý do tại sao bạn cần văn phòng phẩm, ý bạn là tự động tương quan?
cướp girard

2
có một trang web mới có thể phù hợp hơn cho câu hỏi của bạn: quant.stackexchange.com . Bây giờ bạn rõ ràng khó hiểu tính toán với giải thích.
mpiktas

@mpiktas, cộng đồng lượng tử được giải quyết bằng cách sử dụng lợi nhuận so với giá vì sự ổn định của lợi nhuận và sự không ổn định của giá cả. Tôi đang hỏi ở đây một cái gì đó hơn là một lời giải thích trực quan về lý do tại sao điều này nên được như vậy.
Milktrader

@robin, có một số điều có thể khiến bạn nghi ngờ phân tích thống kê. Cỡ mẫu xuất hiện trong tâm trí, cũng như những thứ rõ ràng hơn như dữ liệu bị thao túng. Có phải sự không cố định của dữ liệu gọi vào một câu hỏi tính toán tương quan?
Milktrader

không phải là tính toán, có thể là sự giải thích nếu tương quan không cao. Nếu nó cao có nghĩa là tương quan cao (nghĩa là quan hệ tuyến tính cao), hai chuỗi thời gian không cố định nói và có thể có khả năng tương quan cao (ví dụ: khi .( Y t ) X t = Y t(Xt)(Yt)Xt= =Yt
robin girard

Câu trả lời:


37

Các mối tương quan đo lường mối quan hệ tuyến tính. Trong mối quan hệ bối cảnh không chính thức có nghĩa là một cái gì đó ổn định. Khi chúng ta tính toán tương quan mẫu cho các biến dừng và tăng số lượng điểm dữ liệu có sẵn, mối tương quan mẫu này có xu hướng tương quan thực sự.

Có thể chỉ ra rằng đối với giá cả, thường là các bước ngẫu nhiên, mối tương quan mẫu có xu hướng biến ngẫu nhiên. Điều này có nghĩa là cho dù chúng tôi có bao nhiêu dữ liệu, kết quả sẽ luôn khác nhau.

Lưu ý tôi đã cố gắng thể hiện trực giác toán học mà không có toán học. Từ quan điểm toán học, lời giải thích rất rõ ràng: Các khoảnh khắc mẫu của các quá trình đứng yên hội tụ xác suất đến các hằng số. Các khoảnh khắc mẫu của các bước đi ngẫu nhiên hội tụ thành các tích phân của chuyển động nâu là các biến ngẫu nhiên. Vì mối quan hệ thường được biểu thị dưới dạng số và không phải là biến ngẫu nhiên, lý do không tính toán tương quan cho các biến không cố định trở nên rõ ràng.

Cập nhật Vì chúng tôi quan tâm đến mối tương quan giữa hai biến trước tiên, chúng xuất phát từ quá trình dừng . Stationarity ngụ ý rằng và không phụ thuộc vào . Vì vậy, mối tương quanE Z t c o v ( Z t , Z t - h ) tZt= =(Xt,Yt)EZtcov(Zt,Zt-h)t

corr(Xt,Yt)= =cov(Xt,Yt)DXtDYt

cũng không phụ thuộc vào , vì tất cả các đại lượng trong công thức đến từ ma trận , không phụ thuộc vào t . Vì vậy, việc tính toán tương quan mẫuc o v ( Z t )tcov(Zt)t

có ý nghĩa, vì chúng ta có thể có hy vọng hợp lý rằng tương quan mẫu sẽ ước tínhρ=corr(Xt,Yt). Nó chỉ ra rằng niềm hy vọng này không phải là không có cơ sở, vì đối với các quá trình văn phòng phẩm đáp ứng các điều kiện nhất định chúng tôi có màρ

ρ^= =1TΣt= =1T(Xt-X¯)(Yt-Y¯)1T2Σt= =1T(Xt-X¯)2Σt= =1T(Yt-Y¯)2
ρ= =corr(Xt,Yt) , nhưtrong xác suất. Hơn nữa,trong phân phối, vì vậy chúng tôi có thể kiểm tra các giả thuyết về.ρ^ρTρT(ρ^ρ)N(0,σρ2)ρ

Bây giờ giả sử rằng không đứng yên. Sau đó, sửa có thể phụ thuộc vào . Vì vậy, khi chúng tôi quan sát một mẫu có kích thước chúng tôi cần ước tính tương quan khác nhau . Điều này tất nhiên là không khả thi, vì vậy trong trường hợp tốt nhất, chúng tôi chỉ có thể ước tính một số chức năng của như giá trị trung bình hoặc phương sai. Nhưng kết quả có thể không có giải thích hợp lý. c o r r ( X t , Y t ) t T T ρ t ρ tZtcorr(Xt,Yt)tTTρtρt

Bây giờ chúng ta hãy xem xét những gì xảy ra với sự tương quan của bước đi ngẫu nhiên không cố định được nghiên cứu nhiều nhất. Chúng tôi gọi tiến trình là bước đi ngẫu nhiên nếu , trong đó là một quá trình đứng yên. Để đơn giản, giả sử rằng . Sau đóZ t = t s = 1 ( U t , V t ) C t = ( U t , V t ) E C t = 0Zt=(Xt,Yt)Zt=s=1t(Ut,Vt)Ct=(Ut,Vt)ECt=0

corr(XtYt)=EXtYtDXtDYt=Es=1tUts=1tVtDs=1tUtDs=1tVt

Để đơn giản hóa vấn đề hơn nữa, giả sử rằng là một tiếng ồn trắng. Điều này có nghĩa là tất cả các tương quan bằng 0 cho . Lưu ý rằng điều này không hạn chế sửa về không.E ( C t C t + h ) h > 0 c o r r ( U t , V t )Ct=(Ut,Vt)E(CtCt+h)h>0corr(Ut,Vt)

Khi đó

corr(Xt,Yt)=tEUtVtt2DUtDVt=corr(U0,V0).

Cho đến nay rất tốt, mặc dù quá trình này không ổn định, nhưng mối tương quan có ý nghĩa, mặc dù chúng tôi đã phải đưa ra các giả định hạn chế tương tự.

Bây giờ để xem điều gì xảy ra với tương quan mẫu, chúng ta sẽ cần sử dụng thực tế sau đây về các bước ngẫu nhiên, được gọi là định lý giới hạn trung tâm chức năng:

trong phân phối, nơis[0,1]vàlàchuyển động Brownianbivariate(quá trình Wiener hai chiều). Để thuận tiện giới thiệu định nghĩa.

1TZ[TS]= =1TΣt= =1[TS]Ct(cov(C0))-1/2WS,
S[0,1]M s = ( M 1 s , M 2 s ) = ( c o v ( C 0 ) ) - 1 / 2 W sWS= =(W1S,W2S)MS= =(M1S,M2S)= =(cov(C0))-1/2WS

Một lần nữa để đơn giản, chúng ta hãy định nghĩa tương quan mẫu là

ρ^= =1TΣt= =1TXtYt1TΣt= =1TXt21TΣt= =1TYt2

Hãy để chúng tôi bắt đầu với phương sai. Chúng ta có

E1TΣt= =1TXt2= =1TEΣt= =1T(ΣS= =1tBạnt)2= =1TΣt= =1TtσBạn2= =σBạnT+12.

Điều này đi đến vô cùng khi tăng, vì vậy chúng tôi gặp vấn đề đầu tiên, phương sai mẫu không hội tụ. Mặt khác, định lý ánh xạ liên tục kết hợp với định lý giới hạn trung tâm chức năng cho chúng taT

T

1T2Σt= =1TXt2= =Σt= =1T1T(1TΣS= =1tBạnt)201M1S2dS
trong đó hội tụ được hội tụ trong phân phối, như .T

Tương tự như vậy, chúng tôi nhận được

1

1T2Σt= =1TYt201M2S2dS
1T2Σt= =1TXtYt01M1SM2SdS

Vì vậy, cuối cùng cho tương quan mẫu của bước đi ngẫu nhiên của chúng tôi, chúng tôi nhận được

T

ρ^01M1SM2SdS01M1S2dS01M2S2dS
trong phân phối dưới dạng . T

Vì vậy, mặc dù mối tương quan được xác định rõ, tương quan mẫu không hội tụ về phía nó, như trong trường hợp quá trình đứng yên. Thay vào đó, nó hội tụ đến một biến ngẫu nhiên nhất định.


1
Quan điểm toán học của giải thích quan điểm là những gì tôi đang tìm kiếm. Nó cho tôi một cái gì đó để suy ngẫm và khám phá thêm. Cảm ơn.
Milktrader

1
Câu trả lời này dường như bỏ qua câu hỏi ban đầu: Không phải bạn chỉ nói rằng có, tính toán tương quan có ý nghĩa cho các quá trình đứng yên?
whuber

1
@whuber, tôi đã trả lời câu hỏi trong đầu nhận xét, nhưng tôi đọc lại câu hỏi một lần nữa và theo như tôi hiểu thì OP hỏi về cách tính tương quan cho dữ liệu không cố định. Tính toán tương quan cho các quá trình đứng yên có ý nghĩa, tất cả các phân tích kinh tế lượng vĩ mô (VAR, VECM) đều dựa vào đó.
mpiktas

Tôi sẽ cố gắng làm rõ câu hỏi của tôi với một câu trả lời.
whuber

3
@whuber tôi lấy đi từ câu trả lời là một mối tương quan dựa trên dữ liệu không cố định mang lại một biến ngẫu nhiên, có thể có hoặc không hữu ích. Tương quan dựa trên dữ liệu đứng yên hội tụ đến một hằng số. Điều này có thể giải thích lý do tại sao các nhà giao dịch bị thu hút bởi "tương quan cán x ngày" bởi vì hành vi tương quan là thoáng qua và giả mạo. Cho dù "tương quan cán x ngày" là hợp lệ hay hữu ích là cho một câu hỏi khác.
Milktrader

13

... Là sự tính toán tương quan mà dữ liệu của nó không cố định ngay cả một phép tính thống kê hợp lệ?

Đặt là một bước đi ngẫu nhiên rời rạc. Chọn một số dương . Xác định các quá trình và theo , nếu , và nếu không ; và . Nói cách khác, bắt đầu giống hệt nhưng mỗi lầnh P V P ( 0 ) = 1 P ( t + 1 ) = - P ( t ) V ( t ) > h P ( t + 1 ) = P ( t ) V ( t ) = P ( t ) W ( t ) V W VWhPVP(0)= =1P(t+1)= =-P(t)V(t)>hP(t+1)= =P(t)V(t)= =P(t)W(t)VWV tăng lên trên , nó sẽ chuyển các dấu hiệu (nếu không thì mô phỏng W ở tất cả các khía cạnh).hW

nhập mô tả hình ảnh ở đây

(Trong hình này (với ) W là màu xanh và V là màu đỏ. Có bốn công tắc trong dấu hiệu.)h= =5WV

VWVW

Mã toán học để tạo ra hình:

With[{h=5},
pv[{p_, v_}, w_] := With[{q=If[v > h, -p, p]}, {q, q w}];
w = Accumulate[RandomInteger[{-1,1}, 25 h^2]];
{p,v} = FoldList[pv, {1,0}, w] // Transpose;
ListPlot[{w,v}, Joined->True]]

thật tốt khi câu trả lời của bạn chỉ ra điều đó nhưng tôi sẽ không nói quá trình này có tương quan với nhau, tôi sẽ nói họ phụ thuộc. Đây là điểm. Tính toán tương quan là valide và ở đây nó sẽ nói "không tương quan" và tất cả chúng ta đều biết điều này không có nghĩa là "không phụ thuộc".
cướp girard

1
@robin Đó là một điểm tốt, nhưng tôi đã xây dựng ví dụ này một cách cụ thể để trong thời gian dài có khả năng hai quá trình này có mối tương quan hoàn hảo . Vấn đề không phải là một trong những sự phụ thuộc so với tương quan mà vốn có liên quan đến một hiện tượng tinh vi hơn: rằng mối quan hệ giữa các quá trình thay đổi theo các giai đoạn ngẫu nhiên. Điều đó, tóm lại, chính xác là những gì có thể xảy ra trong các thị trường thực sự (hoặc ít nhất chúng ta phải lo lắng rằng nó có thể xảy ra!).
whuber

@whubert có, và đây là một ví dụ rất hay cho thấy rằng có những quy trình có tương quan rất cao trong thời gian dài tiềm tàng và vẫn không tương quan gì cả (nhưng phụ thuộc nhiều) khi liên quan đến quy mô thời gian lớn hơn.
cướp girard

2
@robin girard, tôi nghĩ chìa khóa ở đây là đối với các quá trình không cố định, mối tương quan lý thuyết thay đổi theo thời gian, khi đối với các quá trình đứng yên tương quan lý thuyết vẫn giữ nguyên. Vì vậy, với tương quan mẫu về cơ bản là một số, không thể nắm bắt được sự biến đổi của các mối tương quan thực sự trong trường hợp các quá trình không cố định.
mpiktas
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.