Cập nhật 2014-01-15
Tôi nhận ra rằng tôi đã không trả lời câu hỏi ban đầu của Danica về việc biên độ sai số cho tỷ lệ được điều chỉnh gián tiếp bị vô hiệu hóa sẽ lớn hơn hay nhỏ hơn biên sai số cho cùng một tỷ lệ trong ACS. Câu trả lời là: nếu tỷ lệ danh mục công ty không khác biệt nhiều so với tỷ lệ ACS của tiểu bang, thì tỷ lệ lỗi được đưa ra dưới đây sẽ nhỏ hơn tỷ lệ lỗi ACS. Lý do: tỷ lệ gián tiếp coi số người thuộc loại công việc tổ chức (hoặc tỷ lệ tương đối) là số cố định . Ước tính ACS về tỷ lệ bị vô hiệu hóa đòi hỏi, thực tế, ước tính các tỷ lệ đó và tỷ lệ sai số sẽ tăng để phản ánh điều này.
Để minh họa, hãy viết tỷ lệ bị vô hiệu hóa như sau:
P^adj=∑ninpi^
trong đó là tỷ lệ bị vô hiệu hóa ước tính trong loại trong ACS.p^ii
Mặt khác, tỷ lệ ước tính ACS có hiệu lực:
P^acs=∑(NiN)ˆpi^
Trong đó và tương ứng là loại dân số và tổng số tổng thể và là tỷ lệ dân số trong loại .NiNNi/Ni
Do đó, lỗi tiêu chuẩn cho tỷ lệ ACS sẽ lớn hơn do phải ước tính ngoài .Ni/Npi
Nếu tỷ lệ loại tổ chức và tỷ lệ ước tính dân số khác nhau rất lớn, thì có thể là . Trong một ví dụ hai loại mà tôi đã xây dựng, các danh mục được biểu diễn theo tỷ lệ và . Lỗi tiêu chuẩn cho tỷ lệ ước tính bị vô hiệu hóa là .SE(P^adj)>SE(P^acs)N1/N=0.7345N2/N=0.2655SE(P^acs)=0.0677
Nếu tôi coi 0,7345 và 0,2655 là các giá trị cố định và (phương pháp điều chỉnh gián tiếp), , nhỏ hơn nhiều. Nếu thay vào đó, và , , tương tự như ở mức cực đoan và , . Tôi sẽ ngạc nhiên nếu tỷ lệ tổ chức và dân số khác nhau rất nhiều. Nếu họ không, tôi nghĩ rằng sẽ an toàn khi sử dụng tỷ lệ lỗi ACS như một ước tính bảo thủ, có thể rất bảo thủ về tỷ lệ lỗi thực sự.n1/nn2/nSE(P^adj)=0.0375n1/n=0.15n2/n=0.85SE(P^adj)=0.0678SE(P^acs)n1/n=0.001S E ( P một d j ) = 0,079n2/n=0.999SE(P^adj)=0.079
Cập nhật 2014-01-2014
Câu trả lời ngắn
Theo tôi, sẽ là vô trách nhiệm khi trình bày một thống kê như vậy mà không có CI hoặc biên sai số (một nửa chiều dài CI). Để tính toán những điều này, bạn sẽ cần tải xuống và phân tích Mẫu Microdata sử dụng công cộng (PUMS) của ACS ( http://www.cencies.gov/acs/www/data_documentation/public_use_microdata_sample/ ).
Câu trả lời dài
Đây không thực sự là một trọng số lại của ACS. Nó là một phiên bản của tiêu chuẩn hóa gián tiếp, một quy trình chuẩn trong dịch tễ học (google hoặc xem bất kỳ văn bản epi nào). Trong trường hợp này, tỷ lệ khuyết tật của công việc ACS (loại) được tính theo số lượng nhân viên của loại công việc tổ chức. Điều này sẽ tính toán một số lượng người khuyết tật dự kiến trong tổ chức E
, có thể so sánh với số lượng quan sát được O
. Số liệu thông thường để so sánh là một tỷ lệ chuẩn hóa R= (O/E)
. (Thuật ngữ thông thường là "SMR", cho "tỷ lệ tử vong được tiêu chuẩn hóa", nhưng ở đây "kết quả" là khuyết tật.). R
cũng là tỷ lệ của tỷ lệ khuyết tật quan sát được (O/n)
và tỷ lệ tiêu chuẩn hóa gián tiếp (E/n)
, trong đó n
số lượng nhân viên của tổ chức.
Trong trường hợp này, dường như chỉ cần một CI cho E
hoặc E/n
sẽ cần thiết, vì vậy tôi sẽ bắt đầu với điều đó:
Nếu
n_i = the organization employee count in job category i
p_i = disability rate for job category i in the ACS
Sau đó
E = sum (n_i p_i)
Phương sai của E
là:
var(E) = nn' V nn
trong đó nn
vectơ cột của danh mục tổ chức được tính và V
là ma trận phương sai hiệp phương sai ước tính của tỷ lệ khuyết tật loại ACS.
Ngoài ra, tầm thường, se(E) = sqrt(var(E))
và se(E/n) = se(E)/n
.
và 90% CI cho E là
E ± 1.645 SE(E)
Chia n
cho để có được CI cho E/n
.
Để ước tính, var(E)
bạn sẽ cần tải xuống và phân tích dữ liệu Mẫu dữ liệu sử dụng công cộng (PUMS) của ACS ( http://www.cencies.gov/acs/www/data_documentation/public_use_microdata_sample/ ).
Tôi chỉ có thể nói về quá trình tính toán var(E)
trong Stata. Vì tôi không biết nếu nó có sẵn cho bạn, tôi sẽ trì hoãn các chi tiết. Tuy nhiên, ai đó am hiểu về các khả năng khảo sát của R hoặc (có thể) SAS cũng có thể cung cấp mã từ các phương trình trên.
Khoảng tin cậy cho tỷ lệ R
Khoảng tin cậy đối với R
thông thường dựa trên giả định Poisson cho O
, nhưng giả định này có thể không chính xác.
Chúng ta có thể xem xét O
và E
độc lập, vì vậy
log R = log(O) - log(E) ->
var(log R) = var(log O) + var(log(E))
var(log(E))
có thể được tính là một bước Stata nữa sau khi tính toán var(E)
.
Theo giả định độc lập Poisson:
var(log O) ~ 1/E(O).
Một chương trình như Stata có thể phù hợp, giả sử, một mô hình nhị thức âm hoặc mô hình tuyến tính tổng quát và cung cấp cho bạn một thuật ngữ phương sai chính xác hơn.
Khoảng 90% CI cho log R
là
log R ± 1.645 sqrt(var(log R))
và các điểm cuối có thể được lũy thừa để lấy CI cho R
.