Tôi đang phân tích dữ liệu từ hai cuộc khảo sát mà tôi đã hợp nhất với nhau:
Khảo sát nhân viên nhà trường, trong các năm 2005-06 và 2007-08
Khảo sát học sinh, từ năm 2005-06 đến 2008-09
Đối với cả hai bộ dữ liệu này, tôi có các quan sát (ở cấp học sinh hoặc nhân viên) từ 3 khu học chánh khác nhau, mỗi khu vực có mẫu đại diện mỗi năm trong khu học chánh riêng biệt của họ.
Để phân tích, tôi đã kết hợp dữ liệu của sinh viên thành hai giai đoạn 2 năm (2005-07 và 2007-09). Sau đó, tôi sẽ gửi từng bộ dữ liệu để có được tỷ lệ phần trăm nhân viên hoặc học sinh trả lời các câu hỏi theo ngưỡng (ví dụ: liệu họ có trả lời trong câu khẳng định, "Đồng ý" hay liệu học sinh đánh dấu rằng họ đã sử dụng rượu, Vân vân.). Vì vậy, khi tôi hợp nhất các bộ dữ liệu cấp độ nhân viên và học sinh lại với nhau, trường là đơn vị phân tích và tôi chỉ có 1 quan sát cho mỗi trường trong khoảng thời gian 2 năm (cho rằng trường không bị mất dữ liệu trong một khoảng thời gian nhất định ).
Mục tiêu của tôi là ước tính mối liên hệ giữa nhân viên và phản hồi của sinh viên. Cho đến nay, kế hoạch của tôi là lấy các hệ số tương quan Pearson giữa tất cả các biến (vì tất cả chúng đều là các phản hồi liên tục đại diện cho tỷ lệ phần trăm) cho từng khu học chánh riêng biệt (vì điều này loại bỏ giả định về tính tổng quát cho các quận khác trong bộ dữ liệu này) . Để làm điều này, tôi sẽ trung bình dữ liệu của quận trong hai năm dù sao chỉ nhận được một quan sát cho mỗi trường.
Câu hỏi:
- Đây có phải là một kế hoạch phân tích thích hợp? Có một số phương pháp khác tôi có thể sử dụng có thể cung cấp cho tôi suy luận hoặc sức mạnh tốt hơn?
- Nếu kế hoạch của tôi phù hợp, tôi có nên đạt được các mối tương quan có trọng số dựa trên tuyển sinh của trường không (vì có nhiều trường nhỏ hơn lớn sẽ đóng góp không tương xứng vào các hệ số tương quan)?
Tôi đã hỏi người quản trị dữ liệu về vấn đề này và anh ấy đã đề cập rằng các yếu tố chính quyết định sự cần thiết của việc cân nhắc dữ liệu của tôi là liệu tôi có nghĩ rằng quy mô trường học có ảnh hưởng đến mức độ tương quan hay không và liệu sự giải thích của tôi sẽ ở cấp độ học sinh hay trường học. Tôi nghĩ rằng cách giải thích của tôi sẽ ở cấp trường (ví dụ: "một trường có tỷ lệ nhân viên trả lời theo cách này tương quan với tỷ lệ phần trăm học sinh trả lời theo cách này ...").