Tôi có thể sử dụng điểm Z với dữ liệu sai lệch và không bình thường không? [đóng cửa]


12

Tôi đã làm việc với một số dữ liệu thời gian chu kỳ quy trình và nhân rộng bằng cách sử dụng chỉ số z tiêu chuẩn để so sánh giữa các phần của thời gian chu kỳ đầy đủ.

Tôi có nên sử dụng một số chuyển đổi khác vì dữ liệu bị lệch nhiều / không bình thường? ('ngoại lệ' không bao giờ có thể mất thời gian tiêu cực và thường mất nhiều thời gian hơn 'trung bình')

Sử dụng chỉ số z dường như vẫn "hoạt động" ...

###############
# R code    
###############
mydata <- rweibull(1000,1,1.5)
hist(mydata)
hist(scale(mydata))

5
zz

Câu trả lời:


5

Nếu X bị lệch nhiều, thống kê Z sẽ không được phân phối bình thường (hoặc t nếu độ lệch chuẩn phải được ước tính. Vì vậy, phần trăm của Z sẽ không chuẩn bình thường. Vì vậy, theo nghĩa đó, nó không hoạt động.


Theo hiểu biết của tôi, X bị lệch nhiều có nghĩa là cỡ mẫu không đủ lớn (định lý giới hạn trung tâm). Tuy nhiên tôi không chắc chắn, liệu dân số có cần phải bình thường hay không, để thống kê Z hoạt động. Phải không?
Andrzej Gis

1
OP đang nói về phân bố dân số chứ không phải phân phối trung bình. Vì vậy, cỡ mẫu và định lý giới hạn trung tâm không áp dụng.
Michael R. Chernick

2

Mã R sẽ hoạt động, nhưng điểm z sẽ có ý nghĩa như câu "Nho đang gọi điện cho bút máy một cách nhẹ nhàng". Đó là một câu hợp lệ, nhưng không truyền đạt bất cứ điều gì có ý nghĩa.

Đánh giá theo mã R của bạn, có vẻ như bạn nghĩ rằng dữ liệu của bạn được Weibull phân phối. Trong trường hợp đó, tôi chỉ sử dụng thống kê Weibull và không mở rộng bất cứ điều gì trừ khi bạn thực sự phải làm. Mặc dù điểm z được dạy trong mọi lớp thống kê giới thiệu, điều đó không có nghĩa là bạn nên sử dụng chúng mọi lúc, và đặc biệt là nếu bạn không có dữ liệu đối xứng.


1

Nếu dân số không được phân phối bình thường. Trong trường hợp đó, phân phối của thanh (X) {mẫu trung bình} tiếp cận phân phối bình thường theo định lý giới hạn trung tâm; cho cỡ mẫu lớn. Mặc dù về mặt lý thuyết, chúng tôi nói rằng chúng tôi đang sử dụng Student-t nhưng với giá trị cao hơn của n (cỡ mẫu hoặc mức độ tự do), phân phối t & phân phối Z gần như bằng nhau.


-4

DỮ LIỆU CỦA BẠN KHÔNG PHẢI LÀ BÌNH THƯỜNG CHO MỘT KIỂM TRA Z. (TOWNEND, 2002) TUY NHIÊN, NHỮNG NGƯỜI BIẾN ĐỔI NÊN ĐƯỢC TIẾP CẬN. ĐỂ KIỂM TRA R CARNG CHĂM SÓC MỘT F-TEST TRÊN HAI cơ sở dữ liệu của bạn, và nếu các biến thể của bạn là phù hợp, thì KẾT QUẢ KIỂM TRA Z ĐƯỢC SỬ DỤNG. NẾU KHÔNG, CHUYỂN ĐỔI SỐ LIỆU.


9
Câu hỏi là về việc biến đổi một biến không phải là một bài kiểm tra, vì vậy tôi không nghĩ câu trả lời của bạn được áp dụng. Ngoài ra, nó có thể có nhiều thông tin hơn nếu bạn cung cấp tài liệu tham khảo đầy đủ thay vì chỉ một tài liệu tham khảo năm tên và một số người phản đối việc KHÔNG NÊN.
Maarten Buis

Tôi đồng ý với @MaartenBuis nhưng không giống như anh ấy, tôi sẽ đánh giá thấp điều này.
Erik
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.