Tôi chuyên ngành khoa học, và kiến thức về thống kê của tôi khá hời hợt.
Vấn đề
Tôi đã phải tìm một tập dữ liệu và phân tích nó với khả năng tốt nhất của tôi như là một bài tập cho khóa học thống kê của tôi. Đây không còn là một bài tập nữa, tôi chỉ cần trợ giúp trong việc diễn giải lý do tại sao tôi đã phân tích kém và thay vào đó tôi nên làm gì.
Tôi đã sử dụng một bộ dữ liệu phân loại về tỷ lệ việc làm ở New Zealand, dự định sắp xếp nó trong bảng dự phòng 2x2 và sử dụng bài kiểm tra chi bình phương của Pearson và bài kiểm tra chính xác của Fisher để kiểm tra xem giới có tương quan với việc làm hay không.
Những gì tôi muốn trả lời
- Hiểu lý do tại sao tôi không thể sử dụng kiểm tra chi bình phương và kiểm tra chính xác của Fisher cho vấn đề này và tìm hiểu những gì tôi nên sử dụng thay thế. "Tỷ lệ lẻ là một hàm của thời gian", tôi giả sử? Bất kỳ liên kết hữu ích về cách làm điều đó, hoàn hảo trong R?
- Hiểu nhận xét "tương quan tuần tự" liên quan đến phần đầu tiên của bài tập và chính xác những gì tôi nên làm.
Cách giúp tôi # 1 (ngắn hơn)
Đó là cách dữ liệu của chúng tôi trông (dựa trên điều tra dân số):
Male Female
Employed 1201600 1060200
Unemployed 73300 75000
Tôi đã thực hiện một bài kiểm tra chi bình phương và một bài kiểm tra chính xác của Fisher ở R, giả sử rằng giá trị p thu được sẽ cho tôi biết xác suất phân phối công việc như vậy (hoặc một cực đoan hơn) cho rằng null là đúng (nam và nữ có cơ hội nhận được công việc như nhau). Tôi nhận được giá trị p rất nhỏ và thử nghiệm của Fisher cho tôi tỷ lệ chênh lệch 1,16, nghĩa là có mối tương quan và đặc biệt là nam giới có khả năng tìm việc ở New Zealand cao hơn 16%.
Tuy nhiên, theo giảng viên của tôi, tôi đã sử dụng các bài kiểm tra này không phù hợp. Tôi hoàn toàn không hiểu tại sao, nhưng tôi nghĩ rằng anh ta đã nói rằng các thử nghiệm này cho thấy sự độc lập và bởi vì có một số lượng công việc nhất định có sẵn ở New Zealand, các mẫu của chúng tôi không độc lập ... mặc dù tôi không chắc về điều đó (bạn có thể xem phản hồi của anh ấy trích dẫn dưới đây).
Cách giúp tôi # 2 (lâu hơn)
Nếu bạn có thời gian rảnh, tôi sẽ đánh giá rất cao nếu bạn có thể xem xét toàn bộ bài tập. Tôi cũng sẽ cung cấp phản hồi của giảng viên, vì vậy nếu bạn có thể diễn giải nó cho tôi, nó sẽ rất tuyệt! Bài tập rất dễ đối với một nhà toán học / nhà thống kê, chỉ có hai câu hỏi ở đó, nó chỉ đầy những phần đệm mà tôi đã cố gắng chứng minh rằng tôi biết những gì tôi đang làm, bạn có thể bỏ qua hầu hết.
Đây là liên kết đến một tệp PDF với bài tập tôi không thành công: thống kê gán.pdf .
Phản hồi của giảng viên
Hình 1 của bạn thể hiện mối tương quan tuần tự, đó là lý do thực sự tại sao hồi quy tuyến tính không hoạt động. Cả bài kiểm tra của ngư dân hay chi bình phương đều tốt cho bảng 2x2 của bạn. Điều này là do bạn muốn kiểm tra tính đồng nhất, nhưng bạn đang từ chối null vì không độc lập (điều này không thú vị). Sự khác biệt giữa hai là không liên quan ở đây (chúng giống hệt nhau trong mọi trường hợp). Bạn có thể đã vẽ tỷ lệ cược là một hàm của thời gian.