Chúng ta có thể nói gì về dân số có nghĩa là từ cỡ mẫu 1?


43

Tôi đang tự hỏi những gì chúng ta có thể nói, nếu bất cứ điều gì, về giá trị trung bình dân số, khi tất cả tôi có là một đo lường, (kích thước mẫu số 1). Rõ ràng, chúng tôi muốn có nhiều số đo hơn, nhưng chúng tôi không thể có được số đo đó.y 1μy1

Đối với tôi, dường như vì giá trị trung bình của mẫu, , tương đương với , nên . Tuy nhiên, với kích thước mẫu là 1, phương sai mẫu không được xác định và do đó, sự tự tin của chúng tôi trong việc sử dụng làm công cụ ước tính của cũng không được xác định, đúng không? Có cách nào để hạn chế ước tính của chúng tôi về không? y1E[ ˉ y ]=E[y1]=L ˉ y LLy¯y1E[y¯]=E[y1]=μy¯μμ


Có, khoảng tin cậy trên có thể được xây dựng theo các giả định nhất định. Nếu không ai đăng nó, tôi sẽ theo dõi nó. μ
soakley

5
Xem stats.stackexchange.com/questions/1807 để biết phiên bản khác của cùng một câu hỏi (trung bình của một mẫu có sẵn, nhưng không phải là cỡ mẫu của nó, vì vậy, trung bình là một quan sát duy nhất từ phân phối lấy mẫu chưa biết) và stats.stackexchange .com / câu hỏi / 20300 cho một cuộc thảo luận liên quan.
whuber

một bài báo gần đây thảo luận về sự tối ưu của các công cụ ước tính này trong trường hợp bình thường: tandfonline.com/doi/full/10.1080/00031305.2017.1360796
user795305

Câu trả lời:


8

Đây là một bài viết hoàn toàn mới về câu hỏi này cho trường hợp Poisson, thực hiện một phương pháp sư phạm tốt đẹp:

Andersson. Per Gotsta (2015). Một phương pháp tiếp cận lớp học để xây dựng một khoảng tin cậy gần đúng của một ý nghĩa Poisson bằng cách sử dụng một quan sát. Thống kê người Mỹ , 69 (3), 160-164, DOI: 10.1080 / 00031305.2015.1056830 .


... không may đằng sau một bức tường.
Tim

@Tim: đúng là như vậy. Sau đó, một lần nữa, tư cách thành viên ASA không quá đắt, và bạn có thể truy cập vào The American Statistician , JASA và một vài tạp chí khác với giá rất hợp lý, cá nhân tôi rất vui vẻ trả tiền từ túi của mình. Tôi thực sự nghĩ rằng bạn nhận được giá trị tiền của bạn ở đây. YMMV, tất nhiên.
S. Kolassa - Tái lập Monica

4
+1 nhưng trường hợp Poisson hoàn toàn khác với trường hợp thông thường vì phương sai phải bằng giá trị trung bình. Kết quả Poisson khá đơn giản trong khikết quả cho trường hợp bình thường là phản trực giác và bí ẩn. x±9.68|x|
amip nói rằng Phục hồi lại

@amoeba: khá chính xác, nhưng OP không chỉ định bất kỳ hạn chế nào đối với việc phân phối.
S. Kolassa - Tái lập Monica

Điều này ngắn gọn đến mức nó sẽ phục vụ tốt hơn như là một nhận xét. Nhưng vì đó là câu trả lời được chấp nhận, có lẽ bạn sẽ không muốn chuyển đổi nó thành một nhận xét. Có lẽ sau đó bạn có thể tóm tắt những điểm chính của bài viết?
Richard Hardy

42

Nếu dân số được biết là bình thường, khoảng tin cậy 95% dựa trên một quan sát được đưa ra bởix ± 9,68 | x |x

x±9.68|x|

Điều này được thảo luận trong bài báo "Khoảng tin cậy hiệu quả cho ý nghĩa với các mẫu có kích thước một và hai" của Wall, Boen và Tweedie, Nhà thống kê người Mỹ , tháng 5 năm 2001, Tập. 55, số 2 . ( pdf )


5
Tôi ghét nghe ngu ngốc nhưng .... chắc chắn là không. Điều này phụ thuộc vào các đơn vị và hoàn toàn không hoạt động đúng (ý tôi là nhân vô hướng ....)
Alec Teal

8
@Alec Chỉ vì một thủ tục phụ thuộc vào các đơn vị đo lường (nghĩa là nó không bất biến) không có nghĩa là nó tự động không hợp lệ hoặc thậm chí xấu. Điều này là hợp lệ: đọc bài viết và làm toán. Nhiều người sẽ cho rằng đó là một chút đáng lo ngại , mặc dù. Đáng ngạc nhiên hơn nữa, bạn thậm chí không phải giả sử phân phối cơ bản là Bình thường: một kết quả tương tự giữ cho bất kỳ phân phối không chính thống nào (nhưng phải tăng 9,68 lên khoảng 19 hoặc hơn): xem các liên kết tôi đã cung cấp trong một nhận xét về điều này câu hỏi
whuber

4
Một số tạp chí sau đó có ba lá thư gửi cho biên tập viên, một trong số đó đưa ra quan điểm của Alec Teal về các đơn vị. Câu trả lời từ Wall nói rằng: "Khoảng tin cậy không tương đương (nghĩa là xác suất bao phủ của nó phụ thuộc vào tỷ lệ ...)" nói "Khoảng tin cậy không dựa trên số lượng quan trọng ..." Đó là một cách tiếp cận và kết quả bất thường, không còn nghi ngờ gì nữa! |μ|σ
soakley

5
Chỉ để tiết kiệm một chút công việc: các chữ cái cho biên tập viên và trả lời các ghi chú @soakley đã xuất hiện trong The American Statistician , vol. 56, không 1 (2002) .
S. Kolassa - Tái lập Monica

3
Điều này dường như đưa ra khoảng tin cậy bao trùm giá trị trung bình với xác suất khoảng khi nhưng với xác suất cao hơn nhiều. Nếu thì rõ ràng xác suất là vì khoảng tin cậy luôn chứa . σ | μ | > 0 μ = 0 100 % 095%σ|μ|>0μ=0100%0
Henry

28

Chắc chắn là có. Sử dụng một mô hình Bayes . Rất có thể bạn có ít nhất một số ý tưởng về những gì có thể có thể được - ví dụ, rằng nó thể chất không thể tiêu cực, hoặc là nó rõ ràng là không thể lớn hơn 100 (có lẽ bạn đang đo chiều cao của trường trung học thành viên đội bóng địa phương của bạn bằng đơn vị feet). Đặt trước đó, cập nhật nó với sự quan sát đơn độc của bạn, và bạn có một hậu thế tuyệt vời.μ


18
(+1) Một quan sát sẽ bị áp đảo bởi ưu tiên, vì vậy dường như những gì bạn nhận được từ phía sau sẽ không nhiều hơn những gì bạn đưa vào trước.
whuber

Điều gì sẽ xảy ra nếu chúng ta kết hợp một ưu tiên như vậy với loại khả năng ngụ ý bởi? x±9.68|x|
Simon Kuang

@SimonKuang: một vấn đề khái niệm là chúng ta chỉ có thể sử dụngkhoảng thời gian sau khi chúng tôi đã quan sát , vì vậy điều này không thể nhập trước . xx±9.68|x|x
S. Kolassa - Tái lập Monica

@StephanKolassa Không, khoảng thời gian này (và phân phối liên quan) hình thành khả năng. Ưu tiên của chúng tôi là riêng biệt.
Simon Kuang

@SimonKuang: vâng, bạn nói đúng, lỗi của tôi. Thật không may, tôi không có thời gian để trải qua điều này vào lúc này, nhưng nếu bạn làm điều này, xin vui lòng gửi những gì bạn tìm thấy!
S. Kolassa - Tái lập Monica

14

Một bài tập mô phỏng nhỏ để minh họa xem câu trả lời của @soakley có hoạt động không:

# Set the number of trials, M
M=10^6
# Set the true mean for each trial
mu=rep(0,M)
# Set the true standard deviation for each trial
sd=rep(1,M)
# Set counter to zero
count=0
for(i in 1:M){
 # Control the random number generation so that the experiment is replicable 
 set.seed(i)
 # Generate one draw of a normal random variable with a given mean and standard deviation
 x=rnorm(n=1,mean=mu[i],sd=sd[i])
 # Estimate the lower confidence bound for the population mean
 lower=x-9.68*abs(x)
 # Estimate the upper confidence bound for the population mean
 upper=x+9.68*abs(x)
 # If the true mean is within the confidence interval, count it in
 if( (lower<mu[i]) && (mu[i]<upper) ) count=count+1
}
# Obtain the percentage of cases when the true mean is within the confidence interval
count_pct=count/M
# Print the result
print(count_pct)
[1] 1

Trong số một triệu thử nghiệm ngẫu nhiên, khoảng tin cậy bao gồm trung bình một triệu lần, nghĩa là luôn luôn như vậy . Điều đó không nên xảy ra trong trường hợp khoảng tin cậy là khoảng tin cậy 95% .

Vì vậy, công thức dường như không hoạt động ... Hoặc tôi đã mắc lỗi mã hóa?

Chỉnh sửa: cùng một kết quả theo kinh nghiệm khi sử dụng ; tuy nhiên, nó là cho - do đó khá gần với khoảng tin cậy 95%.0,950097 0,95 ( μ , σ ) = ( 1000 , 1000 )(μ,σ)=(1000,1)
0.9500970.95(μ,σ)=(1000,1000)


2
Thật vậy, với không bằng 0, điều này rất hữu ích (và +1 để cung cấp mã ở vị trí đầu tiên!). Tôi chỉ có nghĩa là với , đó là một kết luận bỏ qua rằng 0 sẽ luôn bị bắt. μ = 0μμ=0
Wolfgang

2
(@Wolfgang) Đây không phải là cách để kiểm tra khoảng tin cậy. Định nghĩa không yêu cầu rằng -level CI bao gồm trung bình thời gian trong mọi trường hợp : chỉ yêu cầu (a) có ít nhất mức độ bao phủ trong mọi trường hợp và (b) nó xấp xỉ mức độ bao phủ đó trong vài trường hợp. Do đó, để cách tiếp cận của bạn có giá trị và thuyết phục, bạn sẽ phải tìm kiếm một số lượng lớn các khả năng. Hãy thử1 - αα1αsim <- function(rho, n.iter=1e5, sigma=1, psi=9.68) { mu <- runif(n.iter, 0, sigma) * rho; x <- rnorm(n.iter, mu, sigma); mean(p <- abs(x - mu) <= psi * abs(x)) }; sim(1.75)
whuber

2
Tôi hiểu điểm bạn đang cố gắng thực hiện, nhưng tôi hoàn toàn không đồng ý với tuyên bố rằng "đây không phải là cách để kiểm tra khoảng tin cậy". Trong định nghĩa / cấu trúc của CI, tham số là hằng số cố định. Trong mô phỏng của bạn, tục thay đổi. Đối với cố định , nếu phương thức thực sự mang lại 95% CI, thì nó sẽ bao phủ trong 95% trường hợp. Nó không. Ngoài ra, ngay cả với công trình của bạn, mang lại phạm vi bảo hiểm rất gần với 1 (tất nhiên, bây giờ chúng tôi đang tiến lại gần hơn với được cố định ở 0). L L Lμμμsim(0.1)μ
Wolfgang

2
@Wolfgang kiểm tra định nghĩa được sử dụng bởi giấy được trích dẫn, đó là: , nghĩa là xác suất mà là trong khoảng ít nhất là 0,95. LP(Xζ|X|μX+ζ|X|)1αμ
Tim

2
Một lần nữa, là một hằng số. Vì vậy, thật tuyệt khi mô phỏng với . Tất nhiên, sau đó phạm vi bảo hiểm phải là 1. Phương pháp cung cấp một CI có độ bao phủ ít nhất 95% và ví dụ cho thấy (cho dù bằng mô phỏng hoặc thông qua lý luận) rằng trong một số điều kiện, phạm vi bảo hiểm có thể lên tới 100%. Vì vậy, nó không phải là 95% CI. Đây vẫn là một phương pháp khá thông minh để rút ra một số loại suy luận từ rất ít thông tin. μ = 0μμ=0
Wolfgang

0

Xem Edelman, D (1990) 'Khoảng tin cậy cho trung tâm của phân phối không chính thống không xác định dựa trên cỡ mẫu một' Thống kê người Mỹ, Tập 44, số 4. Bài viết về các trường hợp Bình thường và Không theo dõi.


3
Chào mừng bạn đến với Thống kê.SE. Bạn có thể vui lòng chỉnh sửa câu trả lời của bạn để mở rộng nó, để bao gồm những điểm chính của cuốn sách bạn trích dẫn không? Nó sẽ hữu ích hơn cho cả poster gốc và cho những người khác đang tìm kiếm trong trang web này. Nhân tiện, hãy tận dụng cơ hội để tham quan , nếu bạn chưa thực hiện. Xem thêm một số mẹo về Cách trả lời , về định dạng trợ giúp và viết ra các phương trình bằng LaTeX / MathJax .
Ertxiem - phục hồi Monica

Chào mừng đến với trang web của chúng tôi, David. Đóng góp của bạn, với tư cách là tác giả của bài viết đó (mà tôi tin rằng đã được trích dẫn trong một số chủ đề ở đây), được đánh giá rất cao, vì vậy mọi quan điểm hoặc nhận xét bạn có thể cung cấp trong câu trả lời này sẽ được hoan nghênh nhất.
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.