Xem xét thống kê trong bài báo


43

Đối với một số người trong chúng ta, giấy tờ trọng tài là một phần của công việc. Khi làm trọng tài tài liệu phương pháp thống kê, tôi nghĩ lời khuyên từ các lĩnh vực chủ đề khác khá hữu ích, tức là khoa học máy tínhToán học .

Câu hỏi này liên quan đến việc xem xét các giấy tờ thống kê áp dụng nhiều hơn. Ý tôi là, bài báo được gửi đến một tạp chí phi thống kê / toán học và số liệu thống kê chỉ được đề cập trong phần "phương pháp".

Một số câu hỏi cụ thể:

  1. Chúng ta nên bỏ ra bao nhiêu nỗ lực để hiểu được lĩnh vực ứng dụng?
  2. Tôi nên dành bao nhiêu thời gian cho một báo cáo?
  3. Làm thế nào bạn kén chọn khi nhìn vào số liệu / bảng.
  4. Làm thế nào để bạn đối phó với dữ liệu không có sẵn.
  5. Bạn có thử và chạy lại các phân tích được sử dụng.
  6. Số lượng giấy tờ tối đa bạn sẽ xem xét trong một năm là bao nhiêu?

Có bỏ lỡ câu hỏi nào không? Hãy chỉnh sửa hoặc thêm một bình luận.

Biên tập

Tôi đến với câu hỏi này với tư cách là một nhà thống kê đang xem xét một bài báo sinh học, nhưng tôi quan tâm đến việc xem xét thống kê về bất kỳ môn học phi toán học nào.


Tôi không chắc đây có phải là CW không. Một mặt nó hơi mở, nhưng mặt khác tôi có thể thấy mình chấp nhận một câu trả lời. Ngoài ra, câu trả lời có thể sẽ khá dài.

Câu trả lời:


21

Tôi không chắc chắn về lĩnh vực khoa học mà bạn đang đề cập đến (tôi chắc chắn câu trả lời sẽ thực sự khác biệt nếu xử lý sinh học so với vật lý chẳng hạn ...)

Dù sao, là một nhà sinh vật học, tôi sẽ trả lời từ quan điểm "sinh học":

Chúng ta nên bỏ ra bao nhiêu nỗ lực để hiểu được lĩnh vực ứng dụng?

Tôi ít nhất có xu hướng đọc các bài báo trước từ cùng các tác giả và tìm kiếm một vài đánh giá về chủ đề này nếu tôi không quá quen thuộc với nó. Điều này đặc biệt đúng khi xử lý các kỹ thuật mới mà tôi không biết, vì tôi cần hiểu nếu họ thực hiện tất cả các điều khiển thích hợp, v.v.

Tôi nên dành bao nhiêu thời gian cho một báo cáo?

Nhiều như cần thiết (OK, câu trả lời ngu ngốc, tôi biết !: P) Nói chung tôi không muốn ai đó xem lại bài viết của mình để làm một công việc gần đúng chỉ vì anh ấy / cô ấy có việc khác để làm, vì vậy tôi cố gắng không tự làm .

Làm thế nào bạn kén chọn khi nhìn vào số liệu / bảng.

Khá kén chọn. Hình là thứ đầu tiên bạn nhìn vào khi duyệt qua một tờ giấy. Họ cần phải nhất quán (ví dụ: tiêu đề đúng trên các trục, truyền thuyết chính xác, v.v.). Thỉnh thoảng tôi đã đề nghị sử dụng một loại cốt truyện khác để hiển thị dữ liệu khi tôi nghĩ rằng cái được sử dụng không phải là tốt nhất. Điều này xảy ra rất nhiều trong sinh học, một lĩnh vực bị chi phối bởi loại biểu đồ "barplot +/- SEM". Tôi cũng khá kén chọn phần "vật liệu và phương pháp": một phân tích thống kê hoàn hảo về mô hình sinh học vốn đã sai hoàn toàn vô dụng.

Làm thế nào để bạn đối phó với dữ liệu không có sẵn.

Bạn chỉ cần làm và tin tưởng các tác giả, tôi đoán. Trong nhiều trường hợp trong sinh học, bạn không thể làm được gì nhiều, đặc biệt là khi xử lý những việc như hình ảnh hoặc hành vi động vật và tương tự. Trừ khi bạn muốn mọi người xuất bản hàng tấn hình ảnh, video, v.v. (mà rất có thể bạn sẽ không trải qua bất kỳ cách nào), nhưng điều đó có thể rất không thực tế. Nếu bạn nghĩ rằng dữ liệu thực sự cần thiết, hãy yêu cầu các tác giả cung cấp chúng dưới dạng dữ liệu / số liệu bổ sung.

Bạn có thử và chạy lại các phân tích được sử dụng.

Chỉ khi tôi có nghi ngờ nghiêm trọng về kết luận được rút ra bởi các tác giả. Trong sinh học thường có sự khác biệt giữa "có ý nghĩa thống kê" và "có ý nghĩa về mặt sinh học". Tôi thích một phân tích thống kê mỏng hơn với lý luận sinh học tốt sau đó ngược lại. Nhưng một lần nữa, trong trường hợp rất khó xảy ra là tôi sẽ xem xét một bài báo thống kê sinh học (ahah, điều đó sẽ rất vui !!!) tôi có lẽ sẽ chú ý nhiều hơn đến các số liệu thống kê hơn là sinh học trong đó.


6
Tôi đã có thể đưa ra gần như cùng một câu trả lời nhưng ở đây nó cũng được nêu rõ. Hãy để tôi thêm chỉ hai điều dựa trên kinh nghiệm. Đầu tiên, tôi đã thấy rằng hầu như luôn luôn đáng để chạy lại bất kỳ phân tích nào tôi có thể: nó phục vụ để kiểm tra sự hiểu biết của tôi và, thường xuyên hơn mọi người có thể mong đợi, nó phơi bày lỗi trong chính bài báo. Thứ hai, điều cần thiết là tìm các tài liệu tham khảo chính và tìm tài liệu tham khảo của riêng bạn bằng cách tìm kiếm trên Web các cụm từ trong bài báo. Một số lượng đáng kể các khoản đóng góp gần đây là (tự động) đạo văn hoặc cố gắng hói để lấy một bài báo khác ra khỏi công việc cũ.
whuber

Tôi đã thêm một câu hỏi. Nếu nó không quá rắc rối, bạn sẽ cập nhật câu trả lời của mình chứ?
csgillespie

1
@csgillespie: Tôi đoán rằng tôi còn quá sớm trong sự nghiệp để trả lời rằng, vì tôi có thể không được yêu cầu xem xét nhiều giấy tờ như một người có nhiều kinh nghiệm hơn tôi. Tôi nghĩ rằng @whuber trả lời có rất nhiều ý nghĩa mặc dù.
nico

16

Điều này giải quyết câu hỏi mới # 6: "Số lượng giấy tờ tối đa bạn sẽ xem xét trong một năm là bao nhiêu?" Tôi đang trả lời như một thành viên của một số ban biên tập. Vấn đề lâu năm là tìm đủ người đánh giá. Tùy thuộc vào tạp chí, mỗi bài nộp cần một đến ba người đánh giá ngang hàng, thường là ba. Nếu tạp chí có tỷ lệ chấp nhận %, thì số lượng đánh giá trung bình trên mỗi tờ giấy được chấp nhận rõ ràng là khoảng . Ví dụ , nếu tỷ lệ chấp nhận là 33%, các biên tập viên cần có được chín đánh giá cho mỗi bài báo được xuất bản. Nếu bạn, với tư cách là một tác giả, thực hiện điều này một cách nghiêm túc, thì bạn nên cố gắng cung cấp chín đánh giá (hoặc bất cứ con số nào hóa ra là cho các tạp chí mục tiêu của bạn) cho mỗi bài báo bạn xuất bản!x3/(x/100)

Tôi đã cảm động viết điều này do sự song hành mạnh mẽ với việc bỏ phiếu trên trang web này: để bạn có được danh tiếng của , những người khác phải đưa ra một số kết hợp của câu trả lời của bạn và câu hỏi của bạn. Do đó, nếu bạn đang tăng cân, kiểm tra hồ sơ của bạn sẽ hiển thị ít nhất . Đó là trường hợp của nhiều người nhưng chắc chắn không phải tất cả các thành viên tích cực nhất của trang web này. Một cái gì đó để suy nghĩ về ... Hãy nhớ bỏ phiếu!rr/10r/5 r/10


1
@chl của tất cả những người ở đây bạn nên ít quan tâm nhất về việc bỏ phiếu đủ!
whuber

1
@chl: bạn đặt một thanh cao theo mọi cách! :) Có lẽ dự án polystats đầu tiên của chúng tôi nên thiết lập một số tập lệnh để duy trì và cập nhật một tập hợp các biểu đồ như sau: meta.stats.stackexchange.com/questions/314/
ars

11

POV của tôi sẽ xem xét một bài báo về tâm lý học hoặc dự báo về giá trị thống kê của nó. Tôi sẽ chủ yếu nhận xét rất tốt thứ hai của Nico.

Chúng ta nên bỏ ra bao nhiêu nỗ lực để hiểu được lĩnh vực ứng dụng?

Khá nhiều, thực sự. Tôi sẽ không tin tưởng bản thân mình để bình luận về nhiều vấn đề thống kê cơ bản nhất mà không hiểu khu vực. May mắn thay, điều này thường không quá khó trong nhiều ngành tâm lý học.

Tôi nên dành bao nhiêu thời gian cho một báo cáo?

Tôi sẽ đi ra ngoài và nói một thời gian cụ thể: Tôi sẽ dành bất cứ điều gì từ hai đến tám giờ để đánh giá, đôi khi nhiều hơn. Nếu tôi thấy rằng tôi dành hơn một ngày cho một tờ giấy, điều đó có nghĩa là tôi thực sự không đủ điều kiện để hiểu nó, vì vậy tôi sẽ đề nghị tạp chí tìm người khác (và cố gắng đề xuất một số người).

Làm thế nào bạn kén chọn khi nhìn vào số liệu / bảng.

Thực sự rất kén chọn. Các số liệu sẽ là những gì mọi người nhớ về một bài báo và những gì kết thúc trong các bài thuyết trình mà không có nhiều bối cảnh, vì vậy những điều này thực sự cần phải được thực hiện tốt.

Làm thế nào để bạn đối phó với dữ liệu không có sẵn.

Trong tâm lý học, dữ liệu thường không được chia sẻ - đo 50 người bằng MRI rất tốn kém và các tác giả sẽ muốn sử dụng những dữ liệu này cho các bài báo khác, vì vậy tôi hiểu được sự miễn cưỡng của họ khi chỉ đưa ra dữ liệu. Vì vậy, bất cứ ai chia sẻ dữ liệu của họ đều nhận được một phần thưởng lớn trong cuốn sách của tôi, nhưng không chia sẻ là điều dễ hiểu.

Trong dự báo, nhiều bộ dữ liệu có sẵn công khai. Trong trường hợp này tôi thường khuyên các tác giả chia sẻ mã của họ (và tự mình làm như vậy).

Bạn có thử và chạy lại các phân tích được sử dụng.

Không có dữ liệu, chỉ có rất nhiều người có thể học hỏi từ điều này. Tôi sẽ chơi xung quanh với dữ liệu mô phỏng nếu có gì đó rất đáng ngạc nhiên về kết quả của bài báo; mặt khác, người ta thường có thể nói thích hợp từ các phương pháp không phù hợp mà không có dữ liệu (một khi người ta hiểu khu vực này, xem ở trên).

Số lượng giấy tờ tối đa bạn sẽ xem xét trong một năm là bao nhiêu?

Thực sự có rất ít để thêm vào điểm của người đăng ký ở trên - giả sử rằng mỗi bài viết có trung bình n đồng tác giả tôi (đồng gửi) nhận được 3 đánh giá, một người nên thực sự nhắm đến việc xem xét ít nhất 3 / ( n + 1 ) bài cho mỗi lần gửi (đếm các bài nộp thay vì giấy tờ riêng có thể bị từ chối và gửi lại). Và tất nhiên, số lượng bài nộp cũng như số lượng đồng tác giả thay đổi mạnh mẽ theo ngành học.


Tôi đã thêm một câu hỏi. Nếu nó không quá rắc rối, bạn sẽ cập nhật câu trả lời của mình chứ?
csgillespie

1
Thật thú vị, hầu hết các nhà nghiên cứu trong nghiên cứu di truyền được khuyến khích hoặc hài lòng (nó phụ thuộc vào đánh giá) để làm cho dữ liệu có sẵn. Tôi cũng nhắc nhở @csgillepsie câu trả lời hay về nghiên cứu tái sản xuất , stats.stackexchange.com/questions/1980/ mẹo
chl

@chl: vâng, làm cho dữ liệu có sẵn rất nhiều phụ thuộc vào ngành học và tôi rất muốn thấy nhiều hơn về điều này trong tâm lý "chính thống" - Tôi chỉ không thể nhớ đã thấy một ví dụ duy nhất của một bài báo tâm lý thực sự đã đưa ra dữ liệu.
S. Kolassa - Tái lập Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.