Trực quan hóa quy trình suy luận


9

Tôi cung cấp hỗ trợ thống kê cho một bộ phận y tế công cộng. Như bạn có thể tưởng tượng, chúng tôi tập hợp rất nhiều bản đồ một cách thường xuyên. Đối với tôi, bản đồ chỉ là một loại trực quan hóa dữ liệu khác - hữu ích để cảm nhận dữ liệu, tạo và kiểm tra các giả thuyết, v.v. Nhưng chúng ta thường không theo dõi qua thử nghiệm mô hình hóa và giả thuyết thực tế .

Làm thế nào để bạn / tổ chức của bạn đi về điều này? Một quy trình làm việc bao gồm suy luận trông như thế nào? Ai tham gia? Bạn dùng dụng cụ gì vậy? Điều gì sẽ nó lý tưởng như thế nào, nếu bạn có theo cách của bạn?

Cảm ơn!

BIÊN TẬP

Để rõ ràng, tôi tò mò về các chiến lược khác nhau để đi từ dữ liệu không gian đến các thử nghiệm thống kê, chính thức về các giả thuyết về những gì đang diễn ra trên thế giới. Ví dụ: giả sử tôi đang cố gắng nhắm mục tiêu một chiến dịch giáo dục để tăng xét nghiệm bệnh lao. Tôi (cá nhân) sẽ vạch ra các trường hợp bệnh lao chống lại các đồng biến quan tâm (giả sử, thu nhập trung bình hoặc phần trăm cư dân sinh ở nước ngoài) và thử xem liệu có bất kỳ mô hình nào không.

Tôi có thể hoặc không thể tìm thấy bất kỳ; nhưng cuối cùng tôi sẽ xây dựng một mô hình để ước tính mối liên hệ giữa các hiệp phương sai đó và số lượng nhân khẩu học. Đây là một bước quan trọng bởi vì con người giỏi như thế nào trong việc tìm kiếm các mẫu mà không tồn tại hoặc tìm thấy những mẫu không thú vị. Tôi biết cách tự làm điều này, nhưng tôi tò mò về cách các tổ chức khác nhau thể chế hóa nó (nếu có).


Câu hỏi tuyệt vời!
whuber

Bạn có nói rằng bạn cần phải có một quy trình làm việc để nếu có một đợt bùng phát một số bệnh mà nguồn cung cấp vắc-xin hạn chế có sẵn, bạn cần phải chứng minh rằng bạn đang phân phối vắc-xin một cách tối ưu?
Kirk Kuykendall

Nói chung, tôi chỉ quan tâm đến cách mọi người kết hợp suy luận thống kê vào các quy trình lập bản đồ của họ. Những gì bạn mô tả chắc chắn là một kịch bản có thể xảy ra, nhưng có rất nhiều kịch bản khác và tôi thậm chí không quan tâm đặc biệt đến các phản hồi từ dịch tễ học.
Matt Parker

Câu trả lời:


2

Câu hỏi rất thú vị!

Đầu tiên, câu hỏi của bạn ám chỉ đến điều tôi gọi là 'khai thác dữ liệu' và tôi nghĩ rằng đáng để giải quyết vấn đề một cách rõ ràng vì một số người ở đây có thể không hiểu được: với bất kỳ tập dữ liệu nào (không phải là không gian) để đạt được giá trị thống kê mối quan hệ quy ước là nó phải ở mức hoặc trên 95% xác suất. Tuy nhiên, nếu bạn thực hiện 20 bài kiểm tra thì khả năng cao là ít nhất một trong số các kết quả 'có giá trị thống kê' mà bạn có được là do cơ hội thuần túy. Vì vậy, thực tế tồi tệ của nó là chơi xung quanh với một tập dữ liệu (trong GIS nó sẽ được ánh xạ ra) để hình dung nhiều mối quan hệ có thể có giữa các biến, tìm một số thú vị và cắm các số liệu thống kê và trích dẫn kết quả như thể đây là thử nghiệm duy nhất cho bạn đã làm Bạn vẫn có thể sử dụng kết quả nhưng bạn phải tính đến số lượng bài kiểm tra bạn đã thực hiện.

Có phải đó là những gì bạn đang lái xe?

Câu hỏi của bạn xuất hiện để hỏi làm thế nào mọi người chính thức tránh vấn đề này. Câu trả lời của tôi là tùy chọn 'hoàn toàn không' mà bạn đề cập là phổ biến. Các nhà thống kê y tế (ví dụ như bạn gái của tôi) theo kinh nghiệm của tôi áp dụng tiêu chuẩn nghiêm ngặt cao hơn nhiều cho quy trình này so với các lĩnh vực khác, tôi nghi ngờ tất cả các loại ánh xạ dữ liệu ngoài sức khỏe cộng đồng được thực hiện mà không có sự xem xét chính thức nào về vấn đề với các công thức thống kê được áp dụng một cách mù quáng mà không hiểu đúng quy trình. Một ví dụ địa chất xuất hiện trong tâm trí:

Tôi đã đọc một bài báo đánh giá ngang hàng, trong đó các tác giả đã xem xét sản lượng lỗ khoan (lượng nước có thể bơm) liên quan đến ảnh hưởng địa chất và không gian ở Châu Phi, ví dụ như độ dày của lớp sỏi được đào trước khi đá rơi xuống đất. Ý tưởng là giúp những người khoan lỗ khoan để họ có thể nhắm mục tiêu đến những vị trí tốt nhất cho lỗ khoan. Các tác giả đã khai thác dữ liệu một cách trắng trợn kết hợp tất cả các loại biến để xem biến nào đưa ra mức tin cậy 95% và (tôi cho rằng) không ai trong số các nhà đánh giá đã đặt câu hỏi về tính hợp lệ của kết quả. Do đó, kết luận của họ hoàn toàn không đáng tin.

Hy vọng đó là sự quan tâm


Bạn có thể giải thích thêm một chút tại sao bài báo bạn mô tả là không đáng tin? Nó không rõ ràng với tôi tại sao đây là trường hợp. Nếu mối quan hệ tồn tại theo thống kê, liệu "mô hình tinh thần" bạn đã sử dụng để đạt được việc xác định nó có quan trọng không? Tôi hiểu rằng nó không giải thích cơ chế, nhưng đó là một vấn đề riêng biệt.
djq
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.