Hãy tưởng tượng, bạn là một bác sĩ y khoa trong một đơn vị chăm sóc tích cực. Bạn có một bệnh nhân bị sốt mạnh và một số lượng tế bào máu nhất định và trọng lượng cơ thể nhất định và hàng trăm dữ liệu khác nhau và bạn muốn dự đoán, nếu người đó sẽ sống sót. Nếu có, anh ta sẽ che giấu câu chuyện về đứa con khác của mình với vợ, nếu không, điều quan trọng là anh ta phải tiết lộ nó, trong khi anh ta có thể.
Bác sĩ có thể thực hiện dự đoán này dựa trên dữ liệu của các bệnh nhân cũ mà anh ta có tại đơn vị của mình. Dựa trên kiến thức phần mềm của mình, anh ta có thể dự đoán bằng cách sử dụng hồi quy tuyến tính tổng quát (glm) hoặc thông qua mạng lưới thần kinh (nn).
1. Mô hình tuyến tính tổng quát
Có rất nhiều thông số tương quan cho glm để có kết quả, bác sĩ sẽ phải đưa ra các giả định (tuyến tính, v.v.) và quyết định xem thông số nào có khả năng có ảnh hưởng. Glm sẽ thưởng cho anh ta một bài kiểm tra quan trọng đối với từng thông số của anh ta để anh ta có thể thu thập bằng chứng mạnh mẽ, rằng giới tính và sốt có ảnh hưởng đáng kể, trọng lượng cơ thể không nhất thiết phải như vậy.
2. Mạng lưới thần kinh
Mạng lưới thần kinh sẽ nuốt và tiêu hóa tất cả thông tin có trong mẫu của các bệnh nhân cũ. Nó sẽ không quan tâm, liệu các yếu tố dự đoán có tương quan hay không và sẽ không tiết lộ nhiều thông tin, về việc ảnh hưởng của trọng lượng cơ thể dường như chỉ quan trọng trong mẫu trong tay hay nói chung (ít nhất là không ở mức độ chuyên môn mà bác sĩ phải cung cấp). Nó sẽ chỉ tính toán một kết quả.
Cái gì tốt hơn
Lựa chọn phương pháp nào phụ thuộc vào góc độ mà bạn nhìn nhận vấn đề: Là một bệnh nhân, tôi thích mạng lưới thần kinh sử dụng tất cả dữ liệu có sẵn để dự đoán tốt nhất về những gì sẽ xảy ra với tôi mà không có giả định mạnh mẽ và rõ ràng là sai tuyến tính. Là bác sĩ, người muốn trình bày một số dữ liệu trong một tạp chí, anh ta cần giá trị p. Y học rất bảo thủ: họ sẽ yêu cầu giá trị p. Vì vậy, bác sĩ muốn báo cáo rằng trong tình huống như vậy, giới tính có ảnh hưởng đáng kể. Đối với bệnh nhân, điều đó không quan trọng, chỉ cần sử dụng bất kỳ ảnh hưởng nào mà mẫu gợi ý là có khả năng nhất.
Trong ví dụ này, bệnh nhân muốn dự đoán, nhà khoa học của bác sĩ muốn suy luận. Hầu hết, khi bạn muốn hiểu một hệ thống, thì suy luận là tốt. Nếu bạn cần đưa ra quyết định trong đó bạn không thể hiểu hệ thống, dự đoán sẽ phải đủ.