OLS về phương tiện và cỡ mẫu


8

Đưa ra một mô hình:

y=β0+β1f+u

Trong đó là dummy nếu nữ và nếu không, y là chiều cao tính bằng cm. Cỡ mẫu là trong tổng số. Hơn nữa và . Tính toán các ước tính của các tham số.= 1 0 n f e m a l e = n m a l e = 100 200 ˉ y m a l e = 175 ˉ y f e m a l e = 165f=10nfemale=nmale=100200y¯male=175y¯female=165

Nỗ lực của tôi:

Sử dụng công thức cũng biết:

β^=(XX)1Xy
Tôi nhận được:
[200100100100]1[170200165200]

Đầu tiên, các phần tử trong (XX)1 , vì X chỉ là một nhóm, có 100 nữ trong mẫu và có tổng cộng 200 nam và nữ. Đối với Xy , phần tử đầu tiên là "grand mean" của 170 và phần thứ hai chỉ là giá trị trung bình mẫu của chiều cao đối với nữ. Cả hai đều được chia tỷ lệ 200, vì tôi không "xuống thang" (XX)1 .

Là chính xác? Tôi hỏi, bởi vì giải pháp (khi nhân) dẫn đến một số (rất) số lẻ.

Câu trả lời:


7

Cách tiếp cận là đúng, nhưng có một lỗi số nhỏ: chỉ có nữ, không phải . Chiều cao trung bình của nam và nữ có thể được chuyển đổi thành tổng qua100200

Sum of male heights=100×175

Sum of female heights=100×165.

Do đó, tổng của tất cả các độ cao là

Sum of all heights=100×175+100×165=200×170,

như chỉ ra trong câu hỏi. Do đó các phương trình bình thường là

(200100100100)(β^0β^1)=(200170100165)

( không phải ở bên phải), với giải pháp165200

(β^0,β^1)=(175,10).

Thật là một sai lầm ngớ ngẩn ...
Repmat

1
Tôi sẽ không gọi nó là ngớ ngẩn. Đó là một điều tự nhiên để làm. Tôi phải nhìn chằm chằm vào câu hỏi trong vài phút trước khi vấn đề trở nên rõ ràng ....
whuber

1

Tôi khá bối rối. Ý là gì Là những dư lượng? Nếu vậy thìu

XX =[200100100100]

từ

X=yβ=[y1β1y2β1...ynfβ1ynf+1β1ynf+2β1...ynnf+nmβ1y1β2y2β2...ynfβ2ynf+1β2ynf+2β2...ynnf+nmβ2]T

= =

[11...111...100...011...1]T

Một vài suy nghĩ:

Cho phương trình của bạn IMHO sẽ là 175 và = -10. Vì vậy, đối với phần nam và nữ bạn nhận được:β1β2

fm=175(+)10×0+u=175+u

ff=175(+)10×1+u=165+u

Vì bạn có thể sử dụng

β=(XX)1XTy

để giải quyết bằng cách sử dụng Pseudoinverse Moore-Penrose .β

((XX)1XT)+β=((XX)1XT)+[17510]=y

Bây giờ chứa:y

y[165f1165f2...165f100175m1175m2...175m100]T

Hy vọng nó giúp!


5
Trong khi các nhà thống kê thường sử dụng dưới tên Lỗi cho phần không được giải thích của mô hình, thì các nhà kinh tế lượng thường nói về Error, các cú sốc (tạm thời) hoặc nhiễu loạn. Nó chỉ là một ký hiệu thông thường. ϵu
Mugen

1
@nali, bạn có thể thêm một chút vào đây không? Cho số của bạn, giải pháp của hệ thống là không có ý nghĩa. Và có u là phần dư.
Repmat

@Repmat: Tôi đã cập nhật một số suy nghĩ mà ban đầu tôi có. Hy vọng nó giúp.
nali

@Repmat: Có thể bạn đã hiểu lầm tôi. X '* y không phải là [170 82,5] ^ T
nali
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.