Đây là một khả năng.
Đánh giá hiệu suất giáo viên theo truyền thống là khó khăn. Một phần của khó khăn này là các sinh viên khác nhau có mức độ quan tâm khác nhau trong một môn học nhất định. Nếu một học sinh nhất định đạt điểm A, điều này không nhất thiết có nghĩa là việc giảng dạy là tuyệt vời - thay vào đó, điều đó có nghĩa là một học sinh rất có năng khiếu và quan tâm đã cố gắng hết sức để thành công ngay cả khi chất lượng giảng dạy kém. Ngược lại, một học sinh đạt điểm D không nhất thiết có nghĩa là việc giảng dạy kém - đúng hơn, điều đó có thể có nghĩa là một học sinh không quan tâm đến bờ biển mặc dù những nỗ lực tốt nhất của giáo viên để giáo dục và truyền cảm hứng.
Khó khăn càng trầm trọng hơn bởi thực tế là lựa chọn của sinh viên (và do đó mức độ quan tâm của sinh viên) không phải là ngẫu nhiên. Thông thường các trường học nhấn mạnh một môn học (hoặc một nhóm môn học) hơn các môn học khác. Ví dụ, một trường học có thể nhấn mạnh các môn học kỹ thuật hơn nhân văn. Học sinh trong các trường như vậy có lẽ rất quan tâm đến các lĩnh vực kỹ thuật đến nỗi họ sẽ nhận được điểm qua ngay cả với giáo viên tồi nhất có thể. Do đó, tỷ lệ học sinh thi môn toán không phải là một biện pháp giảng dạy tốt - chúng tôi hy vọng giáo viên giỏi sẽ làm tốt hơn nhiều so với những học sinh rất ham học. Ngược lại, những sinh viên đó có thể không quan tâm đến nghệ thuật. Thậm chí rất khó để mong đợi ngay cả từ giáo viên giỏi nhất để đảm bảo tất cả học sinh đạt điểm A.
Một khó khăn khác là không phải tất cả thành công trong một lớp nhất định đều được quy cho giáo viên của lớp đó trực tiếp. Thay vào đó, thành công có thể là do trường học (hoặc toàn bộ quận) tạo ra động lực và khuôn khổ cho thành tích.
Để tính đến tất cả những khó khăn này, các nhà nghiên cứu đã tạo ra một mô hình đánh giá 'giá trị gia tăng' của giáo viên. Về bản chất, mô hình tính đến các đặc điểm nội tại của mỗi học sinh (mức độ quan tâm và thành công chung trong học tập), cũng như những đóng góp của trường và khu học chánh đối với sự thành công của học sinh và dự đoán điểm số của học sinh sẽ được dự kiến ở mức 'trung bình' Dạy học trong môi trường đó. Mô hình sau đó so sánh các điểm thực tế với các lớp dự đoán và dựa vào đó quyết định việc giảng dạy có đầy đủ hay không với tất cả các cân nhắc khác, tốt hơn là đầy đủ, hoặc tồi tệ hơn. Mặc dù mô hình có vẻ phức tạp đối với một người không phải là nhà toán học, nhưng nó thực sự khá đơn giản và chuẩn. Các nhà toán học đã sử dụng các mô hình tương tự (và thậm chí phức tạp hơn) trong nhiều thập kỷ.
Tóm lại, suy đoán của cô Isaacson là chính xác. Mặc dù 65 trong số 66 học sinh của cô đạt điểm thành thạo trong bài kiểm tra của tiểu bang, họ vẫn sẽ đạt điểm tương tự ngay cả khi một con chó là giáo viên của họ. Một giáo viên giỏi thực sự sẽ cho phép những học sinh này đạt được không chỉ "thành thạo", mà thực sự là "điểm tốt" trong cùng một bài kiểm tra.
Tại thời điểm này tôi có thể đề cập đến một số mối quan tâm của tôi với mô hình. Ví dụ, các nhà phát triển mô hình tuyên bố nó giải quyết một số khó khăn trong việc đánh giá chất lượng giảng dạy. Tôi có đủ lý do để tin họ không? Các khu vực có dân số thu nhập thấp hơn sẽ có điểm số 'quận' và 'trường học' dự kiến thấp hơn. Nói một khu phố sẽ có điểm số dự kiến là 2,5. Một giáo viên đạt được trung bình 3 sẽ nhận được một đánh giá tốt. Điều này có thể khiến giáo viên nhắm tới điểm 3, thay vì điểm 4, 5. Nói cách khác, giáo viên sẽ nhắm đến sự tầm thường hơn là sự hoàn hảo. Chúng ta có muốn điều này xảy ra không? Cuối cùng, mặc dù mô hình đơn giản về mặt toán học, nó hoạt động theo cách rất khác với cách trực giác của con người hoạt động. Do đó, chúng tôi không có cách rõ ràng để xác nhận hoặc tranh chấp mô hình ' quyết định. Ví dụ đáng tiếc của cô Isaacson minh họa những gì điều này có thể dẫn đến. Chúng ta có muốn phụ thuộc một cách mù quáng vào máy tính trong một cái gì đó rất quan trọng không?
Lưu ý rằng đây là một lời giải thích cho một giáo dân. Tôi đã bỏ qua một số vấn đề có thể gây tranh cãi ở đây. Ví dụ, tôi không muốn nói rằng các khu học chánh có nhân khẩu học thu nhập thấp được dự kiến sẽ hoạt động kém hơn, bởi vì điều này sẽ không tốt cho một giáo dân.
Ngoài ra, tôi đã giả định rằng mục tiêu thực sự là đưa ra một mô tả hợp lý về mô hình. Nhưng tôi khá chắc chắn rằng đây không phải là mục tiêu của NYT ở đây. Vì vậy, ít nhất một phần lý do giải thích của họ kém là FUD có chủ ý, theo ý kiến của tôi.