Các câu trả lời cho đến nay đã tập trung vào chính dữ liệu , điều này có ý nghĩa với trang web này và các sai sót về nó.
Nhưng tôi là một nhà dịch tễ học tính toán / toán học theo khuynh hướng, vì vậy tôi cũng sẽ nói về mô hình này một chút, bởi vì nó cũng liên quan đến cuộc thảo luận.
Trong suy nghĩ của tôi, vấn đề lớn nhất với bài báo không phải là dữ liệu của Google. Các mô hình toán học trong dịch tễ học xử lý dữ liệu lộn xộn mọi lúc, và theo tôi, các vấn đề với nó có thể được giải quyết bằng một phân tích độ nhạy khá đơn giản.
Vấn đề lớn nhất, với tôi, là các nhà nghiên cứu đã "cam chịu thành công" - điều cần luôn luôn tránh trong nghiên cứu. Họ làm điều này trong mô hình mà họ quyết định phù hợp với dữ liệu: mô hình SIR tiêu chuẩn.
Tóm lại, một mô hình SIR (viết tắt của mẫn cảm (S) truyền nhiễm (I) đã phục hồi (R)) là một loạt các phương trình vi phân theo dõi tình trạng sức khỏe của dân số khi nó gặp phải một bệnh truyền nhiễm. Các cá nhân bị nhiễm bệnh tương tác với các cá nhân nhạy cảm và lây nhiễm cho họ, và sau đó kịp thời chuyển sang loại bị thu hồi.
Điều này tạo ra một đường cong trông như thế này:
Đẹp phải không? Và vâng, cái này là cho một đại dịch zombie. Câu chuyện dài.
Trong trường hợp này, đường màu đỏ là thứ được mô phỏng là "người dùng Facebook". Vấn đề là đây:
Trong mô hình SIR cơ bản, lớp I cuối cùng sẽ và chắc chắn sẽ tiến gần đến mức không có triệu chứng .
Nó phải xảy ra. Sẽ không có vấn đề gì nếu bạn lập mô hình zombie, sởi, Facebook hoặc Stack Exchange, v.v. Nếu bạn mô hình hóa nó bằng mô hình SIR, kết luận tất yếu là dân số trong lớp (I) truyền nhiễm giảm xuống khoảng không.
Có những phần mở rộng cực kỳ đơn giản cho mô hình SIR khiến điều này không đúng - hoặc bạn có thể khiến những người trong lớp (R) được khôi phục trở lại dễ bị ảnh hưởng (S) (về cơ bản, đây sẽ là những người rời Facebook thay đổi từ "Tôi không bao giờ quay lại "thành" Tôi có thể quay lại vào một ngày nào đó "), hoặc bạn có thể có người mới vào dân (đây sẽ là Timmy bé nhỏ và Claire có được những chiếc máy tính đầu tiên của họ).
Thật không may, các tác giả đã không phù hợp với những mô hình. Đây là một vấn đề phổ biến trong mô hình toán học. Một mô hình thống kê là một nỗ lực để mô tả các mẫu của các biến và tương tác của chúng trong dữ liệu. Một mô hình toán học là một khẳng định về thực tế . Bạn có thể có được một mô hình SIR để phù hợp với nhiều thứ, nhưng sự lựa chọn của bạn về một mô hình SIR cũng là một sự khẳng định về hệ thống. Cụ thể, một khi nó đạt đến đỉnh điểm, nó sẽ hướng về không.
Ngẫu nhiên, các công ty Internet sử dụng các mô hình duy trì người dùng trông rất giống mô hình dịch bệnh, nhưng chúng cũng phức tạp hơn đáng kể so với mô hình được trình bày trong bài báo.