Kiến thức tên miền quan trọng như thế nào trong nghề nghiệp của chúng tôi?


8

hoặc: Việc chọn tên miền khi vào công việc có thu hẹp các tùy chọn trong tương lai của bạn cho tên miền và do đó công việc không?

Để làm cho câu hỏi này được áp dụng rộng rãi nhất có thể ...

  • nghề nghiệp đề cập đến tất cả các loại nhà phân tích dữ liệu, từ các nhà thống kê về lập trình viên học máy cho đến các nhà khai thác dữ liệu.
  • hãy tưởng tượng bạn được yêu cầu đưa ra một lời khuyên cho khán giả có cả sinh viên và chuyên gia thuộc các lớp tuổi khác nhau

Có lẽ một điểm khởi đầu:

Các cuộc thi trên Kaggle đã chỉ ra rằng người ngoài có thể vượt trội hơn các mô hình được tạo bởi nhân viên công ty (xem ví dụ ở đây ). Mặt khác, kinh nghiệm làm việc (có giới hạn) của tôi đã đưa tôi đến kết luận, rằng việc hiểu cách thức và nơi dữ liệu được tạo ra là hoàn toàn bắt buộc để tạo ra một môi trường trừu tượng nơi có thể xảy ra một cuộc thi như Kaggle. Hơn nữa, không có kiến ​​thức về miền, tôi thấy khó có thể báo cáo kết quả cho các lớp / phòng ban khác. Một số người liên kết kỹ năng cuối cùng là chìa khóa cho "Khoa học dữ liệu" "nghề nghiệp" mới (xem ví dụ tại đây hoặc tại đây ).


câu hỏi đã được gắn cờ để làm cho nó cw.
steffen

1
Wrt. với ví dụ về Kaggle: 1. "Điểm chuẩn nội bộ" (dường như là cơ sở cho "340% vượt trội") không nói rằng đó là mô hình tốt nhất mà Allstate có. Các cuộc thi khác sử dụng các mô hình hợp lý đơn giản và cơ bản để đo điểm chuẩn, đó cũng có thể là trường hợp ở đây. 2. Không có kiến ​​thức về miền: đừng quên số lượng kiến ​​thức phân tích dữ liệu và tên miền xuất hiện trong quá trình chuẩn bị bộ dữ liệu. Và: Tôi không biết chuyên môn / ứng dụng chuyên môn của người chiến thắng.
cbeleites không hài lòng với SX

Câu trả lời:


7

Tôi thực hiện một sự tương tự: Giải quyết các vấn đề thống kê mà không có bối cảnh giống như quyền anh trong khi bịt mắt. Bạn có thể hạ gục đối thủ của mình nhưng bạn có thể đánh tay vào ringpost.

Tôi làm việc chủ yếu với các nhà nghiên cứu khoa học y tế và xã hội. Dường như có một cảm giác rộng rãi rằng mô hình thích hợp cho nghiên cứu là

1) Họ đưa ra một ý tưởng, thu thập dữ liệu, viết về nó và sau đó 2) Họ đưa nó cho chúng tôi để "làm số liệu thống kê".

Vì vậy, tôi đồng ý rằng chúng ta cần hiểu các vấn đề; tất nhiên, chúng ta không cần hiểu biết đầy đủ về nghiên cứu như người thực hành. Đó là lý do tại sao tôi (và nhiều người dữ liệu khác) có thể làm việc với những người trong nghề khác nhau. Nhưng, chúng ta càng ít biết về một chủ đề, chúng ta càng cần phải tương tác với chuyên gia để đảm bảo rằng kết quả có ý nghĩa.

Một trong nhiều điều tôi thích về những gì tôi làm là tôi có thể tìm hiểu một chút về rất nhiều môn học khác nhau.


1
Tương tự rất tốt đẹp. Mặc dù một chút số liệu thống kê trong DoE (ngẫu nhiên, lập kế hoạch kích thước mẫu) không gây hại, nhưng ... Và nhu cầu tương tác có thể bùng nổ nếu sự trùng lặp về kiến ​​thức (và cả thuật ngữ) quá thấp.
cbeleites không hài lòng với SX

5

Kiến thức tên miền quan trọng như thế nào trong nghề nghiệp của chúng tôi?

  • Đủ quan trọng để đặt tên riêng cho các phân tích dữ liệu hướng miền (ví dụ: -metrics: sinh trắc học, tâm lý học, hóa học, ...)

  • Sự kết hợp giữa kiến thức tên miền và kiến ​​thức thống kê là vô cùng quan trọng trong

    • thiết kế thí nghiệm, ví dụ thực tế ./. tính khả thi thống kê, định mức cụ thể của miền, quy hoạch cỡ mẫu
    • hướng dẫn phân tích dữ liệu (Loại biến đổi hoặc tiền xử lý nào có ý nghĩa về mặt vật lý / sinh học / hóa học? Điều chỉnh dữ liệu thô nào là cần thiết?, tiêu chí cho chất lượng dữ liệu, chẩn đoán)
    • kiểm tra xem kết quả có thể có ý nghĩa / chính xác không
    • giải thích kết quả
      Đây là một ví dụ về cách giải thích theo phân loại cụ thể theo miền chỉ có thể có vì cả kiến ​​thức phân tích dữ liệu và phổ đều có trong tay (phần "LDA mô tả và giải đoán phổ"). Hãy thử tưởng tượng lượng giao tiếp cần thiết giữa một nhà phân tích dữ liệu mà không có kiến ​​thức về quang phổ và một nhà quang phổ học không có ý tưởng về LDA để đi đến một giải thích như vậy.
    • Trong bối cảnh (thiếu) khả năng tái tạo các kết quả được công bố, có mối quan tâm về nghiên cứu được thực hiện như thể không có thêm kiến ​​thức về lĩnh vực / vấn đề / dữ liệu, xem ví dụ E. R: Dougherty: Phát triển Biomarker: Thận trọng, rủi ro và khả năng tái tạo, BioEssays, 2012, 34, 277-279.
      Beck-Bornholt & Dubben có thể sẽ lập luận rằng việc kết hợp nhiều kiến ​​thức tên miền sẽ thúc đẩy sự phổ biến (xác suất trước) của các ý tưởng khoa học tốt.
    • Các không miễn phí ăn trưa lý gợi ý vào cùng một hướng.

    (Tôi là một nhà hóa học chuyên về hóa học và quang phổ học, và thực hiện cả phép đo và phân tích dữ liệu)

Việc chọn tên miền khi nhập công việc có thu hẹp các tùy chọn trong tương lai của bạn cho tên miền và do đó công việc không?

Có thể, nhưng đồng thời, bạn sẽ có thể yêu cầu nhiều chuyên môn hơn trong lĩnh vực đó và do đó có thể áp dụng cho các công việc chuyên môn (và kinh nghiệm của tôi là các nhà hóa học là một loài rất muốn).

Và, ngoài ra, bạn cho thấy rằng bạn có thể tham gia công việc trong các lĩnh vực mới.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.