Hiện tại và vai trò tương lai của các nhà khoa học dữ liệu trong Thiên văn học là gì? [đóng cửa]


7

Tôi là một nhà khoa học dữ liệu và tò mò về vai trò của họ trong Thiên văn học hiện đại, cả hiện tại và trong tương lai gần. Loại vai trò và dự án mà nhà khoa học dữ liệu tích cực nhất trong Thiên văn học là gì? Các giải pháp cơ bản được cung cấp bởi các nhà khoa học dữ liệu trong thiên văn học là gì. Có các nhà khoa học dữ liệu như các nhà điều tra chính, hoặc ít nhất họ là thành viên trong nhóm trong các nỗ lực nghiên cứu?


Một số ví dụ được cung cấp trong hướng dẫn về coursera này: coursera.org/learn/data-driven-astronomy/home/welcome
Nickpick

Như một ví dụ ngẫu nhiên về giao điểm của khoa học dữ liệu và thiên văn học, hãy xem jakevdp.github.io/pages/about.html cũng như vanderplas.com và cả youtube.com/watch?v=U51oPYSVU74 bắt đầu lúc 23:30 cho "dữ liệu lớn dòng chảy "
uhoh

Tôi đã thực hiện một số chỉnh sửa để loại bỏ rủi ro về "câu trả lời chủ yếu dựa trên quan điểm", hy vọng có thể được mở lại.
uhoh

Câu trả lời:


5

Nhà thiên văn học đang tiến tới kỷ nguyên dữ liệu lớn (ger) vì nhiều công nghệ khảo sát bầu trời. Những cái sắp tới bao gồm, ví dụ, LSST, JWST và WFIRST.

Theo ý nghĩa của khảo sát, thông thường có nghĩa là quan sát toàn bộ bầu trời trong một vài ngày và liên tục lặp đi lặp lại. Ngoài ra, vì hầu hết các khảo sát là công nghệ hình ảnh, mỗi pixel trong ảnh đều quan trọng.

Vì vậy, bạn có thể tưởng tượng có bao nhiêu dữ liệu được gửi đến mỗi ngày và bao nhiêu khoa học dữ liệu quan trọng trong nhiều lĩnh vực thiên văn học (và vũ trụ học). Vì vậy, khoa học dữ liệu, loại, tiếp quản khi phân tích dữ liệu từ các cuộc khảo sát.


3

Tôi là một nhà thiên văn học và tôi nhận được rất nhiều lời mời làm việc để đào tạo lại thành một nhà khoa học dữ liệu, nhưng có thể khó khăn hơn để đi theo con đường khác.

Thiên văn học chắc chắn là một lĩnh vực trong đó 'dữ liệu lớn' rất quan trọng và các kỹ thuật phân tích và trực quan hóa mà chúng ta sử dụng hàng ngày có lẽ chậm hơn nhiều thập kỷ so với những gì được dạy cho các nhà khoa học máy tính. Tuy nhiên, hầu hết các phần mềm thiên văn học rất thích hợp, chỉ được sử dụng bởi một số ít người trên khắp thế giới và thường được chỉnh sửa để phù hợp với mục đích cụ thể của họ. Tôi đã thấy những nỗ lực để tạo ra phần mềm thiên văn 'chung chung' hơn có thể được tiêu chuẩn hóa và sử dụng rộng rãi, nhưng rất khó để tìm thấy một nhiệm vụ có thể được tự động hóa và tiêu chuẩn hóa bởi vì chúng ta thường làm việc với các ràng buộc hơi khác nhau mỗi lần.

Cách đây vài năm, tôi đã gặp một nghiên cứu sinh đã học ngành khoa học máy tính ở trường đại học và sau đó chuyển sang ngành thiên văn học, và anh ấy đã rất ngạc nhiên về những kỹ thuật mà chúng ta vừa nắm bắt được, nhưng anh ấy cũng gặp khó khăn thực sự khi hiểu anh ấy là gì cố gắng phân tích vì anh ta không có kiến ​​thức thiên văn để biết tất cả các nguồn lỗi và tiếng ồn trong dữ liệu của mình.

Tôi tin rằng có những nhà khoa học dữ liệu làm việc về các vấn đề trừu tượng hơn, như đường ống của kính viễn vọng, nhưng thật không may, tôi không thể đưa ra nhiều lời khuyên trong lĩnh vực này vì đó là một vấn đề quan sát và công việc của tôi là lý thuyết.


Nó đơn giản là hấp dẫn, Man. Tôi chắc chắn trong. Bạn có thể cho tôi bất kỳ ví dụ về các tập dữ liệu lớn trong công việc lý thuyết mà bạn thường giải quyết; cùng với các thông lệ hiện tại được triển khai để xử lý các tập dữ liệu đó?
Zulkifl Agha

Về mặt lý thuyết, bất kỳ mô phỏng quy mô lớn nào, chẳng hạn như mô phỏng Illustris hoặc Millenium . Ngay cả các mô phỏng quy mô tương đối nhỏ của riêng tôi cũng tạo ra các ảnh chụp nhanh khoảng 2G mỗi ảnh và tôi có hàng trăm ảnh chụp nhanh cũng như các tệp nhật ký và dữ liệu sao. Quan sát, các bộ dữ liệu lớn nhất có lẽ là từ [ALMA] (www.almaobservatory.org)
FJC
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.