Sự khác biệt giữa thống kê và tin học là gì?


10

Chúng tôi luôn nói rằng số liệu thống kê chỉ là xử lý dữ liệu. Nhưng chúng ta cũng biết rằng tin học cũng đang có được kiến ​​thức từ phân tích dữ liệu. Ví dụ, người tin sinh học hoàn toàn có thể đi mà không cần thống kê sinh học. Tôi muốn biết đâu là sự khác biệt cơ bản giữa thống kê và tin học.


7
Không, đây chỉ là vì từ "tin học" đã hoàn toàn mất đi ý nghĩa dứt khoát. "Tin sinh học" được tạo ra chỉ dành cho "sinh học được tạo ra trên máy tính", không có gì sâu sắc trong vấn đề này.

1
@mbq Đồng ý. "Tin học" và "Tin sinh học" đã mất bất kỳ định nghĩa có ý nghĩa.
Fomite

theo cách tin sinh học rõ ràng (áp dụng kết quả của bạn để quan sát kết quả của bạn theo cách sinh học)
Kamal Alblwei

Câu trả lời:


20

Câu hỏi tuyệt vời !!

Tôi đã nghe nhiều lần rằng các nhà sinh học có thể đi mà không cần thống kê sinh học, hoặc thậm chí không có số liệu thống kê. Điều đó hoàn toàn đúng cho đến khi nó trở thành sai. Theo tôi, thiếu kiến ​​thức thống kê nói chung có ảnh hưởng tai hại trong lĩnh vực này, như Keith Baggerly thể hiện . Tôi cũng có thể quan sát rằng việc thiếu kiến ​​thức cơ bản về thống kê (và đại số tuyến tính) là nguyên nhân gây trì trệ các nhà sinh học trong thời gian dài: không có kiến ​​thức sâu về lý thuyết, họ có xu hướng phát minh lại bánh xe và sử dụng các giải pháp ad hoc để giải quyết không có gì ngoài vấn đề của riêng họ

Nhưng bây giờ, để trả lời câu hỏi của bạn, tôi đồng ý rằng về tổng thể, số liệu thống kê không thể làm được nếu không có máy tính những ngày đó. Tuy nhiên, một trong những khía cạnh chính của thống kê là suy luận , không liên quan gì đến máy tính. Suy luận thống kê thực sự là những gì làm cho thống kê trở thành một khoa học, bởi vì nó cho bạn biết liệu kết luận của bạn có giữ được các bối cảnh khác hay không.

Nói tóm lại, bạn có thể phân tích dữ liệu ra khỏi dữ liệu của mình, bạn vẫn sẽ cần số liệu thống kê để biết tính hợp lệ của các dự đoán hoặc quyết định bạn sẽ đưa ra dựa trên các phân tích của mình.


Cảm ơn. Bạn có thể giải thích thêm về nguyên tắc chung đằng sau tin sinh học là gì để biến nó thành một môn học. Để thống kê, nói chung, có hai phần chính, một phần là thao tác dữ liệu thuần túy, phần còn lại là suy luận thống kê, dựa trên xác suất, một trong những toán học thuần túy. Dựa trên các mô hình thống kê (mô hình xác suất), người dân có thể làm khoa học. Còn tin sinh học thì sao?
Honglang Wang

4
Tin sinh học đơn giản là việc sử dụng máy tính để nghiên cứu các câu hỏi sinh học. Các môn học thường được xác định bởi các câu hỏi họ hỏi, không phải bằng phương pháp của họ, vì vậy tin học sinh học nên là một phần của sinh học theo quan điểm của tôi. Nó có một cái tên đặc biệt bởi vì các nhà sinh học rất tệ với máy tính, vì vậy những người có thể làm điều đó phải có một nhãn hiệu đặc biệt. Tôi không chắc chắn rằng trong 50 năm nữa, khi các nhà sinh học giỏi hơn về CNTT và toán, tin học sinh học vẫn sẽ tồn tại.
gui11aume

2
Thật tuyệt khi thấy người khác đánh giá cao những nỗ lực của Keith. Anh ấy chắc chắn đã không tránh khỏi những tranh cãi hoặc các tình huống chuyên nghiệp khó khăn và không thoải mái.
Đức hồng y

@cardinal Saw Keith nói chuyện tại một hội nghị APHA một hoặc hai năm trước. Đó là một trong những cuộc nói chuyện hay nhất tôi từng thấy.
Fomite

9

Quan điểm của tôi là trong khi có một số lượng trùng lặp khá lớn giữa các lĩnh vực cũng có những khác biệt chính. Nói chung, một sinh viên thống kê (ở mức độ cao hơn) sẽ học nhiều lớp lý thuyết (toán và toán) hơn sinh viên tin học, nhưng sinh viên tin học sẽ học nhiều hơn về phần điện toán (đặc biệt là phần cơ sở dữ liệu).

Phát triển một thử nghiệm thống kê mới sẽ giảm nhiều hơn cho nhà thống kê so với người cung cấp thông tin, nhưng thiết kế giao diện cho người dùng nhập dữ liệu và tạo bảng và sơ đồ sẽ rơi vào nhà thông tin nhiều hơn so với nhà thống kê.

Đối với nhà thống kê, máy tính là một công cụ giúp thống kê. Theo số liệu thống kê thông tin là một công cụ giúp thu thập và phân phối thông tin (thông qua máy tính nói chung).

Chỉnh sửa bên dưới đây -----

Để exand, đây là một ví dụ. Tôi đã làm việc trong các dự án với các nhà tin học (tôi là nhà thống kê) nơi một bác sĩ y khoa muốn có một hệ thống sử dụng thông tin về bệnh nhân để dự đoán nguy cơ mắc một số bệnh (ví dụ như phát triển cục máu đông) và muốn nhận được một số dạng cảnh báo để cho họ biết về rủi ro. Vai trò của tôi trong dự án (vai trò thống kê) là phát triển một mô hình sẽ dự đoán rủi ro với các biến dự đoán (mô hình hồi quy logistic là một mô hình như vậy). Vai trò thông tin trong dự án là phát triển các công cụ thu thập các biến dự đoán, sử dụng mô hình của tôi trên chúng, sau đó gửi kết quả cho bác sĩ. Dữ liệu có thể được thu thập từ hồ sơ y tế điện tử hoặc thông qua màn hình nhập dữ liệu để y tá điền vào hoặc người khác.

Bây giờ tôi (và nhiều nhà thống kê khác) biết đủ về lập trình rằng tôi có thể truy vấn cơ sở dữ liệu để có được các yếu tố dự đoán và tạo ra một số loại cảnh báo, nhưng tôi rất vui lòng để lại cho các nhà tin học (và dù sao họ cũng giỏi hơn về nó). Có những người tin học biết đủ số liệu thống kê để phù hợp với mô hình hồi quy logistic. Vì vậy, một phiên bản đơn giản của dự án này chỉ có thể được thực hiện bởi một nhà thống kê, hoặc chỉ một người cung cấp thông tin, nhưng tốt nhất là khi cả hai làm việc cùng nhau. Nếu bạn nhìn vào dự án này và nghĩ rằng phần mô hình hóa là phần thú vị và việc thu thập dữ liệu, cảnh báo và các giao diện khác chỉ là công cụ để di chuyển thông tin đến và từ mô hình thì bạn là một nhà thống kê. Nếu bạn thấy thiết kế giao diện, tối ưu hóa đối thủ dữ liệu, thử nghiệm các loại cảnh báo khác nhau, v.v.


(+1) Tôi thích sự cân bằng của câu trả lời này. Tôi không chắc là tôi khá hiểu ý định của câu cuối cùng.
Đức hồng y

1
Tôi nghĩ rằng ví dụ của bạn rất hay và cho một bức chân dung tốt về vị trí cơ bản của vùng đất. Tôi ước tôi có thể nâng cấp nó một lần nữa cho phần đó. Chúc mừng.
Đức hồng y

Ví dụ của bạn là thực sự mát mẻ. Cảm ơn rất nhiều. Bây giờ tôi chỉ đang tự hỏi một câu hỏi. Đối với nhà thống kê, liệu tất cả các mô hình thống kê nên có phần suy luận, chẳng hạn như khoảng tin cậy hoặc kiểm tra giả thuyết, và do đó dựa trên các mô hình xác suất? Mặt khác, họ chỉ thao túng tập dữ liệu bằng cách vẽ và tóm tắt.
Honglang Wang

9

Thống kê xâm nhập từ dữ liệu; Tin học hoạt động trên dữ liệu. Tất nhiên chúng trùng nhau, nhưng câu hỏi trong đó có phạm vi lớn hơn không có câu trả lời.


"Thống kê suy ra từ dữ liệu; Tin học hoạt động trên dữ liệu." Đây thực sự là những gì tôi muốn xác nhận. Đối với suy luận, luôn dựa trên phân phối xác suất, nó nên bao gồm khoảng tin cậy hoặc kiểm tra giả thuyết. Nếu không, bạn chỉ đang hoạt động trên dữ liệu.
Honglang Wang
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.