Sự khác biệt giữa dữ liệu trung bình sau đó khớp và khớp dữ liệu sau đó lấy trung bình


10

Nếu có, giữa việc khớp một dòng với nhiều "thí nghiệm" riêng biệt thì lấy trung bình các mức khớp hoặc lấy trung bình dữ liệu từ các thử nghiệm riêng biệt sau đó khớp với dữ liệu trung bình. Hãy để tôi giải thích:

Tôi thực hiện mô phỏng máy tính tạo ra một đường cong, hiển thị bên dưới. Chúng tôi trích xuất một số lượng, hãy gọi nó là "A" bằng cách khớp vùng tuyến tính của ô (thời gian dài). Giá trị đơn giản là độ dốc của vùng tuyến tính. Tất nhiên có một lỗi liên quan đến hồi quy tuyến tính này.

Chúng tôi thường chạy 100 hoặc hơn các mô phỏng này với các điều kiện ban đầu khác nhau để tính giá trị trung bình là "A". Tôi đã được thông báo rằng tốt hơn là trung bình dữ liệu thô (của âm mưu bên dưới) thành các nhóm nói 10, sau đó phù hợp với "A" và trung bình 10 "A" đó với nhau.

Tôi không có trực giác cho dù có bất kỳ giá trị nào cho điều đó hay nếu nó tốt hơn việc phù hợp với 100 giá trị "A" riêng lẻ và tính trung bình cho các giá trị đó.

dữ liệu


Tôi không chắc là tôi hiểu: bạn đo A tại các thời điểm khác nhau và sau đó bạn ước tính ? Sau đó, bạn làm điều này nhiều lần và bạn lấy trung bình của tất cả ? β 1A=β0+β1tβ1

Xin lỗi, không. Cốt truyện trên là kết quả của một mô phỏng duy nhất (hãy gọi nó là một thử nghiệm). Vùng phi tuyến tính ban đầu bị loại bỏ, sau đó chúng ta khớp một đường thẳng với phần tuyến tính và thu được độ dốc, "A". Vì vậy, toàn bộ một mô phỏng mang lại một ước tính duy nhất của "A". Tất nhiên câu hỏi của tôi xoay quanh việc tính trung bình nhiều ô sau đó tính A có khác gì so với chỉ tính A cho một loạt các ô và lấy trung bình chúng. Mong rằng làm rõ.
thực

1
Tôi không thấy lý do tại sao điều này sẽ làm cho một sự khác biệt? (nếu các giả định cho hồi quy tuyến tính được thực hiện)

Tôi đoán rằng sự phù hợp không bao giờ sai / không hội tụ / đưa ra ước tính dốc một cách lố bịch do các thí nghiệm từng nhỏ? Đó sẽ là điều mà kết hợp đầu tiên (hoặc mô hình phân cấp) có thể giúp với.
Bjorn

1
Bạn cũng có thể kết hợp tất cả các dữ liệu lại với nhau, nhưng bao gồm một số loại thành phần để phân biệt giữa các thử nghiệm (các lần chặn khác nhau cho từng thử nghiệm hoặc các độ dốc khác nhau), giống như cách tiếp cận mô hình hỗn hợp tuyến tính. Bằng cách này, bạn có thể ước chừng độ dốc tổng thể, nhưng sẽ có thể xác định bất kỳ hiệu ứng "lô" hoặc sự khác biệt nào giữa các thử nghiệm
bdeonovic

Câu trả lời:


2

Hãy tưởng tượng chúng ta đang ở trong một bối cảnh dữ liệu bảng, nơi có sự thay đổi theo thời gian và giữa các doanh nghiệp . Hãy nghĩ về mỗi khoảng thời gian là một thử nghiệm riêng biệt. Tôi hiểu câu hỏi của bạn là liệu nó có tương đương để ước tính hiệu ứng bằng cách sử dụng:i ttit

  • Biến đổi cắt ngang trong trung bình chuỗi thời gian.
  • Chuỗi thời gian trung bình của biến thể cắt ngang.

Câu trả lời nói chung là không.

Các thiết lập:

Trong công thức của tôi, chúng ta có thể nghĩ mỗi khoảng thời gian là một thử nghiệm riêng biệt.t

Giả sử bạn có một bảng điều khiển cân bằng về chiều dài trên hãng. Nếu chúng ta chia mỗi khoảng thời gian cách nhau v.v ... chúng ta có thể viết dữ liệu tổng thể dưới dạng:n ( X t , y t )Tn(Xt,yt)

Y=[y1y2yn]X=[X1X2Xn]

Trung bình phù hợp:

1Ttbt=1Tt(XtXt)1Xtyt=1TtSt1(1nixt,iyt,i)where St=1nixt,ixt,i

Mức trung bình:

Điều này nói chung không bằng với ước tính dựa trên sự thay đổi cắt ngang của trung bình chuỗi thời gian (tức là giữa công cụ ước tính).

(1nix¯ix¯i)11nix¯iy¯i

Trong đó v.v ...x¯i=1Ttxt,i

Ước tính OLS gộp:

Một cái gì đó có lẽ hữu ích để suy nghĩ là ước tính OLS gộp. Nó là gì? Sau đó sử dụng

b^=(XX)1XY=(1nTtXtXt)1(1nTtXtyi)
bt=(XtXt)1Xtyi
=(1nTtXtXt)1(1nTtXtXtbt)

Hãy để và là ước tính của chúng tôi về trên toàn bộ mẫu và trong khoảng thời gian tương ứng. Sau đó chúng tôi có:S=1nTiXXSt=1nXtXtE[xx]t

b^=1Tt(S1St)bt

Đây giống như một mức trung bình của các ước tính cụ thể về thời gian khác nhau , nhưng nó hơi khác một chút. Trong một số ý nghĩa lỏng lẻo, bạn đang tăng thêm trọng lượng cho các khoảng thời gian có phương sai cao hơn của các biến bên phải.bt

Trường hợp đặc biệt: biến bên phải là bất biến thời gian và cụ thể

Nếu quyền biến ở phía bên tay đối với mỗi công ty đang liên tục theo thời gian (ví dụ cho bất kỳ và ) sau đó cho tất cả và chúng ta sẽ có:XiXt1=Xt2t1t2S=Stt

b^=1Ttbt

Bình luận vui vẻ:

Đây là trường hợp Fama và Macbeth khi họ áp dụng kỹ thuật lấy trung bình các ước tính cắt ngang này để đạt được các lỗi tiêu chuẩn nhất quán khi ước tính mức lợi nhuận kỳ vọng thay đổi theo hiệp phương sai với thị trường (hoặc các yếu tố khác).

Quy trình Fama-Macbeth là một cách trực quan để có được các lỗi tiêu chuẩn nhất quán trong ngữ cảnh bảng điều khiển khi các thuật ngữ lỗi có tương quan cắt ngang nhưng độc lập theo thời gian. Một kỹ thuật hiện đại hơn mang lại kết quả tương tự là phân cụm đúng thời gian.


1

(Lưu ý: Tôi không có đủ danh tiếng để bình luận, vì vậy tôi sẽ đăng bài này dưới dạng câu trả lời.)

Đối với câu hỏi cụ thể được đặt ra, câu trả lời của fcop là chính xác: phù hợp với mức trung bình giống như tính trung bình của sự phù hợp (ít nhất là đối với bình phương tối thiểu tuyến tính). Tuy nhiên, điều đáng nói là một trong hai cách tiếp cận " trực tuyến " ngây thơ này có thể cho kết quả sai lệch, so với việc phù hợp với tất cả các dữ liệu cùng một lúc. Vì cả hai tương đương nhau, tôi sẽ tập trung vào phương pháp "phù hợp với mức trung bình". Về cơ bản, khớp các đường cong trung bình bỏ qua sự không chắc chắn tương đối trong các giá trị giữa các điểm khác nhau . Ví dụ: nếu , và , thìyxy1[x1]=y2[x1]=2y1[x2]=1y1[x2]=3 ˉ y [x1]= ˉ y [x2]=2xy¯[x]=y[x]yxy1[x1]=y2[x1]=2y1[x2]=1y1[x2]=3y¯[x1]=y¯[x2]=2 , nhưng bất kỳ đường cong phù hợp nào cũng cần quan tâm nhiều hơn về Misfit tại so với .x 2x1x2

Lưu ý rằng hầu hết các nền tảng phần mềm khoa học nên có các công cụ để tính toán / cập nhật một hình vuông nhỏ nhất "trực tuyến" phù hợp (được gọi là bình phương tối thiểu đệ quy ). Vì vậy, tất cả các dữ liệu có thể được sử dụng (nếu điều này là mong muốn).


1
Câu trả lời được đăng bởi fcop đã bị xóa. Bạn có thể muốn sửa đổi câu trả lời của mình một chút
Glen_b -Reinstate Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.