Làm thế nào để thực hiện bài kiểm tra t của Sinh viên chỉ có cỡ mẫu, trung bình mẫu và trung bình dân số được biết đến?


28

-test của sinh viên yêu cầu độ lệch chuẩn mẫu s . Tuy nhiên, làm cách nào để tính toán cho s khi chỉ biết kích thước mẫu và trung bình mẫu?tss

Ví dụ: nếu cỡ mẫu là và trung bình mẫu là 112 , thì tôi sẽ cố gắng tạo danh sách 49 mẫu giống hệt nhau với giá trị 112 mỗi mẫu. Dự kiến, độ lệch chuẩn mẫu là 0 . Điều này sẽ tạo ra một vấn đề chia cho 0 trong bài kiểm tra t .49112491120t

DỮ LIỆU BỔ SUNG:
Thu nhập trung bình của công nhân ACME North Factory là 200 . Được biết, một mẫu ngẫu nhiên gồm 49 công nhân tại ACME South Factory có thu nhập hàng năm 112 đô la . Là sự khác biệt này có ý nghĩa thống kê?$20049$112

Tôi có đúng không khi nói rằng dân số có nghĩa là 200 ?$200


Vấn đề gì bạn đang cố gắng giải quyết? Nó sẽ giúp chúng tôi giúp bạn nếu bạn nói với chúng tôi nhiều hơn.
pmgjones

Chắc chắn rồi. Tôi đã thêm một vấn đề mẫu.
Bộ

Câu trả lời:


32

Điều này có thể làm nhiều người ngạc nhiên, nhưng để giải quyết vấn đề này, bạn không nhất thiết phải ước tính s . Trên thực tế, bạn không cần biết bất cứ điều gì về sự lan truyền của dữ liệu (mặc dù điều đó sẽ hữu ích, tất nhiên). Ví dụ, Wall, Boen và Tweedie trong một bài viết năm 2001 mô tả cách tìm khoảng tin cậy hữu hạn cho giá trị trung bình của bất kỳ phân phối không chính thống nào dựa trên một lần rút.

Trong trường hợp hiện tại, chúng tôi có một số cơ sở để xem giá trị trung bình mẫu của 112 là rút ra từ một phân phối bình thường (cụ thể là phân phối lấy mẫu trung bình của một mẫu ngẫu nhiên đơn giản là 49 mức lương). Chúng tôi mặc nhiên cho rằng có một số lượng khá lớn công nhân nhà máy và phân phối tiền lương của họ không bị sai lệch hoặc đa phương thức để làm cho định lý giới hạn trung tâm không thể hoạt động. Sau đó, 90% CI bảo thủ cho giá trị trung bình kéo dài lên tới

112+5.84 |112|,

rõ ràng bao hàm trung bình thực của 200. (Xem Wall et al công thức 3.) Với các thông tin hạn chế có sẵn và các giả định được đưa ra ở đây, do đó chúng tôi không thể kết luận rằng 112 khác biệt "đáng kể" so với 200.

Tham khảo: "Khoảng tin cậy hiệu quả cho giá trị trung bình với các mẫu có kích thước một và hai." Thống kê người Mỹ, tháng 5 năm 2001, Tập. 55, số 2: trang 102-105. ( pdf )


4
Đúng vậy Đó là lý do tại sao nó đáng để nghiên cứu: những thách thức đối với trực giác của chúng tôi đặc biệt mang tính giáo dục. Lần đầu tiên tôi biết về điều này từ một bài báo rõ ràng trên trang web của Carlos Rodriguez (SUNY Albany) nhưng tôi không thể tìm thấy nó sáng nay: có vẻ như máy chủ đã ngừng hoạt động. Hãy thử "số liệu thống kê carlos rogriguez" sau này. (Bài viết của anh ấy được cho là ở omega.albany.edu/8008/confint.html , nhưng đây có thể là một URL cũ.)
whuber

4
Kinh ngạc. Tôi không biết điều đó. Cảm ơn đã tham khảo.
Rob Hyndman

4
Cảm ơn - có khả năng đây là tờ giấy Rodriguez bạn đang nghĩ đến không? arxiv.org/abs/bayes-an/9504001
ars

2
Điều đó thật tuyệt. Tuy nhiên, tôi tò mò tại sao bạn áp dụng công thức (3) (xuất phát từ Edelman), mà Wall et al mô tả là "rộng hơn mức cần thiết". Đến cuối đoạn ngay trước khi đề cập (3) họ sử dụng 4,84 (chính xác là 1 nhỏ hơn 5,84) cho khoảng thời gian 90%, xuất phát từ phương trình của họ (4). Không nghi ngờ gì tôi đã bỏ lỡ một cái gì đó.
Glen_b -Reinstate Monica

2
@Glen_b Ngược lại, rất có thể tôi đã bỏ lỡ điều gì đó. Tôi sẽ chú ý rằng lần sau tôi cần bài báo này, nhưng trong khi đó, sự khác biệt về hằng số không ảnh hưởng đến phân tích ở đây.
whuber

13

Đây không phải là một câu hỏi hơi khó hiểu. 49 là một hình vuông chính xác của 7. Giá trị của phân bố t với 48 DoF cho phép thử hai mặt của p <0,05 là gần 2 (2,01).

Chúng tôi bác bỏ giả thuyết khống về sự bình đẳng của phương tiện nếu | sample_mean - popn_mean | > 2 * StdError, tức là 200-112> 2 * SE nên SE <44, tức là SD <7 * 44 = 308.

Không thể có được phân phối bình thường với giá trị trung bình 112 với độ lệch chuẩn là 308 (hoặc hơn) mà không có tiền lương âm.

Với mức lương được giới hạn dưới đây, chúng có khả năng bị sai lệch, do đó, giả sử phân phối theo log-log sẽ phù hợp hơn, nhưng vẫn sẽ yêu cầu mức lương thay đổi cao để tránh p <0,05 trong bài kiểm tra t.


3

Giả sử có 999 công nhân tại nhà máy phía bắc ACME, mỗi người kiếm được 112 tiền, và 1 CEO làm 88112. Mức lương trung bình của dân số là μ= =0,999*112+0,001*88112= =200. Xác suất thu hút CEO từ mẫu 49 người tại nhà máy là 49/1000<0,05(đây là từ phân phối siêu bội), do đó với độ tin cậy 95%, trung bình mẫu dân số của bạn sẽ là 112. Trên thực tế, bằng cách điều chỉnh tỷ lệ công nhân / CEO và mức lương của CEO, chúng tôi có thể tùy ý rằng mẫu của 49 nhân viên sẽ thu hút một CEO, trong khi sửa trung bình dân số ở mức 200 và mẫu có nghĩa là 112. Do đó, không đưa ra một số giả định về phân phối cơ bản, bạn không thể rút ra bất kỳ suy luận nào về ý nghĩa dân số.


2
(1) Tôi nghĩ rằng bạn muốn viết rằng mẫu , không phải là dân số , là 112 với xác suất 95% , không phải là sự tự tin. (2) Quan điểm của bạn được thực hiện tốt - nó có thể áp dụng cho bất kỳ câu hỏi nào - nhưng không phải nó được nêu ra một chút cực kỳ sao? Đầu tiên, câu hỏi không yêu cầu suy luận về dân số có nghĩa là: chúng ta được bảo là$200. Như vậy, có điều kiện dựa trên các giả định, chúng ta có thể ước tính dân số có ý nghĩa một cách chắc chắn! Thứ hai, ngay cả khi chúng tôi được yêu cầu ước tính trung bình dân số từ mẫu, vẫn có một số thông tin tầm thường mà chúng tôi có thể cung cấp (ví dụ: nó không vượt quá $ 10 ^ 11 mỗi năm).
whuber

1
(1) bắt tốt. (2), vâng, tôi có thể đặt vấn đề thiết lập không theo triệu chứng cho các kết quả cố định, bài hoc . lỗi của tôi. tuy nhiên, tôi không còn chắc chắn những gì OP đang cố kiểm tra. Nếu họ biết số dân có nghĩa là 200, tại sao họ lại thử kiểm tra nó?
shabbychef

1
BTW, rõ ràng là một mức lương CEO / tỷ lệ lương được trả ít nhất là 400 không được coi là cực đoan ở Mỹ. 800 là một chút sai lầm, mặc dù.
shabbychef

2

Tôi đoán bạn đang đề cập đến một thử nghiệm t mẫu. Mục tiêu của nó là so sánh giá trị trung bình của mẫu của bạn với giá trị trung bình giả định. Sau đó, nó tính toán (giả sử dân số của bạn là Gaussian) một giá trị P trả lời cho câu hỏi này: Nếu dân số có nghĩa thực sự là giá trị giả thuyết, thì sẽ khó có thể vẽ một mẫu có ý nghĩa như thế nào so với giá trị đó (hoặc xa hơn) bạn quan sát? Tất nhiên, câu trả lời cho câu hỏi đó phụ thuộc vào kích thước mẫu. Nhưng nó cũng phụ thuộc vào sự thay đổi. Nếu dữ liệu của bạn có số lượng phân tán khổng lồ, chúng phù hợp với nhiều phương tiện dân số. Nếu dữ liệu của bạn thực sự chặt chẽ, chúng phù hợp với phạm vi dân số nhỏ hơn.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.