"Nghiên cứu sinh sản" là phân tích tái sản xuất
Nghiên cứu sinh sản là một thuật ngữ được sử dụng trong một số lĩnh vực nghiên cứu để chỉ cụ thể để tiến hành phân tích sao cho
- mã biến đổi dữ liệu thô và dữ liệu meta thành dữ liệu được xử lý,
- mã chạy phân tích trên dữ liệu và
- mã kết hợp các phân tích vào một báo cáo.
Khi dữ liệu và mã như vậy được chia sẻ, điều này cho phép các nhà nghiên cứu khác:
- thực hiện các phân tích không được báo cáo bởi các nhà nghiên cứu ban đầu
- kiểm tra tính đúng đắn của các phân tích được thực hiện bởi các nhà nghiên cứu ban đầu
Cách sử dụng này có thể được nhìn thấy trong các cuộc thảo luận về các công nghệ như Sweave . Ví dụ, Friedrich Leisch viết trong bối cảnh của Sweave rằng "báo cáo có thể được cập nhật tự động nếu dữ liệu hoặc phân tích thay đổi, cho phép nghiên cứu thực sự có thể tái tạo." Cũng có thể thấy trong Quan điểm về nhiệm vụ CRAN về nghiên cứu sinh sản trong đó nêu rõ rằng "mục tiêu của nghiên cứu tái sản xuất là gắn các hướng dẫn cụ thể vào phân tích dữ liệu và dữ liệu thử nghiệm để học bổng có thể được tạo lại, hiểu rõ hơn và được xác minh."
Sử dụng rộng rãi hơn của thuật ngữ "tái sản xuất"
Sinh sản là một mục tiêu cơ bản của khoa học. Nó không mới. Báo cáo nghiên cứu bao gồm các phần phương pháp và kết quả sẽ phác thảo cách dữ liệu được tạo, xử lý và phân tích. Một quy tắc chung là các chi tiết được cung cấp phải đủ để cho phép một nhà nghiên cứu có thẩm quyền thích hợp lấy thông tin được cung cấp và sao chép nghiên cứu.
Khả năng sinh sản cũng liên quan chặt chẽ đến các khái niệm về khả năng nhân rộng và khái quát hóa.
Do đó, thuật ngữ "nghiên cứu có thể tái tạo", được hiểu theo nghĩa đen, được áp dụng cho các công nghệ như Sweave, là một cách gọi sai, cho rằng nó cho thấy mức độ liên quan rộng hơn so với nó. Ngoài ra, khi trình bày các công nghệ như Sweave cho các nhà nghiên cứu chưa sử dụng các công nghệ đó, các nhà nghiên cứu như vậy thường ngạc nhiên khi tôi gọi quá trình này là "nghiên cứu có thể tái tạo".
Một thuật ngữ tốt hơn "nghiên cứu tái sản xuất"
Cho rằng "nghiên cứu tái sản xuất" như được sử dụng trong bối cảnh giống như Sweave chỉ liên quan đến một khía cạnh của nghiên cứu tái sản xuất, có lẽ nên áp dụng một thuật ngữ thay thế. Các lựa chọn thay thế có thể bao gồm:
- Phân tích sinh sản:
- Phân tích dữ liệu sinh sản
- Phân tích thống kê sinh sản
- Báo cáo sinh sản
Tất cả các điều khoản trên là một sự phản ánh chính xác hơn về những gì phân tích giống như Sweave đòi hỏi. Phân tích sinh sản là ngắn và ngọt ngào. Thêm "dữ liệu" hoặc "thống kê" làm rõ thêm mọi thứ, nhưng cũng làm cho thuật ngữ này dài hơn và hẹp hơn. Hơn nữa, "thống kê" có nghĩa hẹp và rộng, và chắc chắn trong phạm vi hẹp, phần lớn xử lý dữ liệu không phải là thống kê. Do đó, chiều rộng ngụ ý của thuật ngữ "phân tích tái sản xuất" có lợi thế của nó .
Nó không chỉ là về khả năng tái sản xuất
Vấn đề khác với thuật ngữ "nghiên cứu tái sản xuất" là mục đích của các công nghệ giống như Sweave không chỉ là "khả năng tái tạo". Có một số mục tiêu liên quan đến nhau:
- Khả năng tái lập
- Các phân tích có thể dễ dàng được chạy lại để chuyển đổi dữ liệu thô thành báo cáo cuối cùng với cùng kết quả không?
- Đúng
- Là phân tích dữ liệu phù hợp với ý định của nhà nghiên cứu?
- Là ý định của nhà nghiên cứu có đúng không?
- Sự cởi mở
- Minh bạch, trách nhiệm
- Những người khác có thể kiểm tra và xác minh tính chính xác của các phân tích được thực hiện?
- Khả năng mở rộng, thay đổi
- Những người khác có thể sửa đổi, mở rộng, tái sử dụng và nghiền, dữ liệu, phân tích hoặc cả hai để tạo ra các nghiên cứu mới không?
Có một lập luận rằng phân tích tái sản xuất nên thúc đẩy các phân tích chính xác, bởi vì có một bản ghi các phân tích có thể được kiểm tra. Hơn nữa, nếu dữ liệu và mã được chia sẻ, nó tạo ra trách nhiệm giải trình thúc đẩy các nhà nghiên cứu kiểm tra các phân tích của họ và cho phép các nhà nghiên cứu khác lưu ý sửa chữa.
Phân tích sinh sản cũng phù hợp chặt chẽ với các khái niệm xung quanh nghiên cứu mở. Tất nhiên, một nhà nghiên cứu có thể sử dụng các công nghệ giống như Sweave cho riêng họ. Nguyên tắc nghiên cứu mở khuyến khích chia sẻ dữ liệu và mã phân tích để cho phép tái sử dụng và trách nhiệm cao hơn.
Đây không thực sự là một bài phê bình về việc sử dụng từ "tái sản xuất". Thay vào đó, nó chỉ nhấn mạnh rằng sử dụng các công nghệ giống như Sweave là cần thiết nhưng không đủ để đạt được các mục tiêu nghiên cứu khoa học mở.