Tùy chọn lưu trữ cho dữ liệu có sẵn công khai


12

Vì vậy, bạn đã quyết định hỗ trợ ý tưởng nghiên cứu có thể tái tạo và muốn cung cấp dữ liệu của bạn trực tuyến để mọi người xem và sử dụng. Câu hỏi là, bạn lưu trữ nó ở đâu?

Tất nhiên, thiên hướng đầu tiên của tôi là không gian web riêng tư tôi có trên một máy chủ của trường đại học, nhưng những thứ này thực sự không phải là tất cả - nếu tôi rời đi, thư mục vẫn mở trong một khoảng thời gian rất ngắn trước khi nó biến mất. Hầu như không có cài đặt phù hợp để giữ dữ liệu có sẵn cho mọi người sử dụng và làm việc trong tương lai.

Bạn có sử dụng cái gì đó như GitHub hoặc SourceForge không? Hoặc dịch vụ khác?

Dữ liệu được đề cập là đầu ra của một số mô phỏng có mức độ quan tâm rất hẹp - vì vậy tôi không nhất thiết phải nghĩ ở đâu đó như InfoChimps hoặc một trong những kho lưu trữ dữ liệu công cộng là ngôi nhà phù hợp cho nó. Đây là ít hơn "Bạn có thể tìm hiểu mọi thứ với mã này!" và hơn thế nữa "Bạn có thể sao chép Hình 3 trong bài viết này".


1
Có liên quan, có thể trùng lặp: stats.stackexchange.com/questions/10045/ trên
Matt Parker

1
Hoàn toàn phù hợp - thêm một số chi tiết cho thấy lý do tại sao tôi không nghĩ đó là một bản sao.
Fomite

@EpiGrad: Bạn đang nghĩ đến loại ngày nào? Nếu đó là một mã nguồn liên quan đến dự án nghiên cứu của bạn, bạn có thể đính kèm nó vào bản in sẵn arXiv của bạn .
Piotr Migdal

@PiotrMigdal Lý tưởng nhất, tôi muốn dữ liệu có thể được sử dụng trong vài năm, đủ lâu để việc truyền bá trích dẫn giấy thông thường, v.v. Tôi sẽ đính kèm nó vào bản in sẵn arXiv nếu chỉ lĩnh vực của tôi sử dụng nó;)
Fomite

@EpiGrad Sau đó, có thể một nơi tốt để tìm kiếm là Dữ liệu mở như một khía cạnh của Khoa học mở - michaelnielsen.org/blog/open-science .
Piotr Migdal

Câu trả lời:


4

Một lựa chọn đơn giản là github .

Tôi sử dụng nó một chút để chia sẻ dữ liệu và mã phân tích dữ liệu. Một vài ví dụ tốt về những người khác chia sẻ mã và dữ liệu trên trang web được liệt kê trong câu hỏi này .

Lợi ích của github

  • Dễ dàng tải lên khi bạn đã quen với git và tại sao không sử dụng git cho nhu cầu kiểm soát phiên bản của bạn.
  • Bạn có thể sử dụng ý chính cho các tệp đơn giản
  • Người khác dễ dàng tải xuống một hoặc nhiều tệp dưới dạng lưu trữ
  • Nó có một lượng lưu trữ miễn phí tốt
  • mã nguồn có thể được duyệt trên internet
  • và hơn thế nữa...

Tất nhiên, github không hoàn hảo cho dữ liệu. Tôi có thể thấy những ưu điểm của việc sử dụng kho lưu trữ thể chế lâu dài hơn hoặc một số công cụ chuyên dụng khác để lưu trữ nghiêm túc hơn.


1
Đây thực sự là giải pháp tôi đã đi cùng. Một phần của vấn đề với kho lưu trữ thể chế là tổ chức tôi đang ở trong tình trạng thay đổi và dữ liệu không thực sự đủ quan trọng đối với một trong những kho dữ liệu lớn.
Fomite

4

Một tùy chọn khác dường như là Dataverse , có sẵn dưới dạng dịch vụ và phần mềm nguồn mở. Tôi đã không thử nó, mặc dù.


2

Một khả năng cho những người trong học viện là việc sử dụng kho lưu trữ kỹ thuật số trong khuôn viên trường thường được lưu trữ bởi các thư viện trong khuôn viên trường (đối với tôi là một địa điểm logic cho các bộ dữ liệu đi kèm với các ấn phẩm).

Kho lưu trữ kỹ thuật số phổ biến (miễn phí) là DSpace , theo hiểu biết của tôi, có thể lưu trữ các tập dữ liệu. Nhưng đây là một dịch vụ mà ai đó trong tổ chức của bạn phải lưu trữ.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.