ArXiv có phổ biến trong cộng đồng thống kê không?


25

Tôi biết rằng các cộng đồng vật lý và toán học rất thích ArXiv, nhưng cộng đồng thống kê thì sao? Có thông thường để gửi ở đó trước khi trình?


Tôi chưa bao giờ đăng ở đó và cũng không thể nhớ đã tìm giấy tờ ở đó.
Christoph Hanck

@DeepNorth vâng, điều đó sẽ rất thú vị. Tôi đang hỏi cả hai vì tò mò và vì gần đây tôi đã đăng một bản nháp "như đã gửi" trên ArXiv. Đã tự hỏi nếu nó thực sự sẽ đạt được bất kỳ nhãn cầu thêm ....

1
Vâng; một số người trong chúng ta nhìn vào arXiv ít nhất là một thời gian. Tôi làm khi tôi có thể hoặc khi ai đó chỉ tôi ở đó và tôi thường liên kết mọi người với giấy tờ ở đó.
Glen_b -Reinstate Monica

3
Xác định "thống kê". Trong lĩnh vực tôi làm việc, phương pháp khảo sát, những người tìm kiếm ngây thơ của tôi cho "khảo sát phức tạp" và "dân số hữu hạn" lần lượt đưa ra 2 và 42 kết quả trên arXiv. Hàng năm, Bộ phận Phương pháp nghiên cứu khảo sát của Hiệp hội thống kê Hoa Kỳ có khoảng 40 phiên tại các cuộc họp thống kê chung, từ 1 đến 3 trong mỗi khoảng thời gian trong suốt 4 ngày của hội nghị và tương ứng tạo ra ít nhất một trăm bài báo Kỷ yếu. Theo như tôi có thể nói, không ai trong số đó làm cho nó thành arXiv.
StasK

Câu trả lời:


19

Vâng, Arxiv là phổ biến trong các số liệu thống kê và cộng đồng khoa học dữ liệu.

Khi thế giới thống kê và khoa học dữ liệu phát triển hàng ngày, điều quan trọng đối với các nhà thống kê và nhà khoa học dữ liệu là phải luôn tự tin với những diễn biến, kỹ thuật và thuật toán mới nhất.

Nó có thể không phổ biến như trong cộng đồng vật lý, nhưng nó có phần quan trọng trong thế giới giàu dữ liệu.

Bạn có thể quan tâm đến Gitxiv , nơi kết hợp nghiên cứu hiện đại với mã / thư viện mã nguồn mở tương ứng.


3
+1 cho liên kết đến Gitxiv ... tôi hãy xem. Bạn có thường xuyên kiểm tra ArXiv hoặc đăng ký một trong các danh sách email của nó không?

2
Hân hạnh. Gitxiv đã đưa thế giới nghiên cứu gần hơn một chút với thế giới thống kê và khoa học máy tính. Kudos cho những kẻ đó. Không, tôi không đăng ký danh sách gửi thư, nhưng vì hầu hết các tài liệu về Máy học và phân tích đều có ở đó, tôi kiểm tra nó mỗi tuần.
Dawny33

3
Sẽ tốt hơn nếu bạn bao gồm một số bằng chứng hỗ trợ. Bây giờ nó chỉ là một từ "Có", và phần còn lại không có nhiều thông tin (nhưng Gitxiv rất thú vị, cảm ơn vì đã đề cập).
Richard Hardy

19

Tôi sẽ đưa ra một câu trả lời dứt khoát, dựa trên bằng chứng. Câu trả lời là CÓ.

Nhìn vào số liệu của Google Scholar để biết xác suất và thống kê, 10 nguồn hàng đầu theo chỉ số h5:

    Publication                               h5-index  h5-median
1.  Journal of Econometrics                         62  93
2.  The Annals of Statistics                        58  81
3.  arXiv Statistics Theory (math.ST)               57  80
4.  Journal of Statistical Software                 53 113
5.  arXiv Probability (math.PR)                     53  65
6.  arXiv Methodology (stat.ME)                     48  69
7.  Journal of the American Statistical Association 48  66
8.  Statistics in Medicine                          42  62
9.  Computational Statistics & Data Analysis        40  51
10. Journal of Business & Economic Statistics       39  67

Lưu ý, danh sách này không dựa trên số lượng ấn phẩm, nó dựa trên chỉ số trích dẫn .

Chỉ số trích dẫn của Google đang trở nên phổ biến như Scopus và Reuters (ok, tôi không có bằng chứng về tuyên bố này), vì vậy câu trả lời của tôi là khách quan như nó nhận được.

So sánh danh sách này với danh sách từ Scimagojr.com về Thống kê và Xác suất:

    Title   Type    SJR H index Total Docs. (2014)  Total Docs. (3years)    Total Refs. Total Cites (3years)    Citable Docs. (3years)  Cites / Doc. (2years)   Ref. / Doc. Country
1   Annals of Mathematics   j   Q1  8,551   72  46  209 1.572   647 207 3,05    34,17   US
2   Vital and health statistics. Series 10, Data from the National Health Survey    k   Q1  7,801   30  4   7   55  125 7   16,33   13,75   US
3   Journal of the Royal Statistical Society. Series B: Statistical Methodology j   Q1  6,148   90  45  99  1.507   547 94  3,09    33,49   GB
4   Annals of Statistics    j   Q1  5,602   103 64  296 2.099   809 287 2,25    32,80   US
5   Journal of Statistical Software j   Q1  5,003   64  67  220 2.540   1.364   220 3,91    37,91   US
6   Journal of the American Statistical Association j   Q1  4,162   123 106 408 3.501   907 373 1,85    33,03   US
7   Probability Surveys j   Q1  3,645   22  1   20  84  46  19  2,73    84,00   US
8   Bioinformatics  j   Q1  3,576   248 809 2.145   18.801  11.329  2.089   4,69    23,24   GB
9   Journal of Business and Economic Statistics j   Q1  3,496   66  58  146 1.464   384 139 2,21    25,24   US
10  Biometrika  j   Q1  3,342   83  58  233 1.485   369 229 1,28    25,60   GB

Có sự trùng lặp tốt với danh sách top 10 của Google Scholar, như bạn có thể thấy. Danh sách sau này cũng dựa trên chỉ mục h, nhưng đó không phải là trích dẫn của Google. Điều này chỉ xác nhận bảng cũ và kết luận từ nó: arXiv là phổ biến trong các nhà thống kê trong học viện.

SSRN là một nơi khác để đổ bản in lại. Nó phổ biến trong các nhà kinh tế lượng.


+1 - Công việc tuyệt vời khi sử dụng số liệu của Google! Chỉ số h chắc chắn đặt nó lên đó.

@Bey, một điều cần lưu ý: phong trào truy cập mở. arXiv là nơi mọi người đổ bản in lại của họ, đó là cách nó bắt đầu trong vật lý. Vì vậy, bạn sẽ thấy cùng một bài báo trong arXiv, sau đó là trong Phys Rev, chẳng hạn. Do đó, arXiv ban đầu được tạo ra như là phương tiện để phổ biến nghiên cứu nhanh hơn. Giấy tờ tốt thường không xuất hiện trên arXiv độc quyền.
Aksakal

Vâng. Tôi thường chỉ trích dẫn một bài báo tôi tìm thấy trên ArXiv nếu tôi có thể tìm thấy nó trong một tạp chí đánh giá ngang hàng. Bài viết của tôi ở đó trong khi nó trải qua đánh giá và cập nhật Ill với bản in được chấp nhận sau thời gian cấm vận (giả sử nó không bị từ chối).

@Bey, trong khi chúng tôi ở trên đó, có hai nơi khác mà bạn có thể bỏ bản in lại của mình: RePec và SSRN. Các nhà kinh tế lượng có thể sử dụng những thứ này thường xuyên hơn arXiv
Aksakal

14

Đây không phải là vấn đề về quan điểm cá nhân, vì vậy, hãy xem xét một số số liệu về các thuật ngữ xuất hiện trên các trang arXiv (một số truy vấn ngẫu nhiên của Google với một số thuật ngữ dành riêng cho tên miền):

trang xác thực chéo: trả về arxiv.org

Khoảng 17.800 kết quả

trang web monte carlo: arxiv.org trả về

Khoảng 187.000 kết quả

trang web lấy mẫu: arxiv.org trả về

Khoảng 141.000 kết quả

trang web dự báo: arxiv.org trả về

Khoảng 11.300 kết quả

trang hồi quy: arxiv.org trả về

Khoảng 51.100 kết quả

CHỈNH SỬA

Như @Scortchi nhận thấy, arXiv đăng số liệu thống kê của riêng mình. danh mục stat xuất hiện trong các báo cáo trong ba năm qua như sau:

year submissions % submissions
2014 2025        2.2% 
2013 1602        1.7%
2012 1284        1.5%

Tuy nhiên, điều này có thể không thể hiện đầy đủ nội dung của các bài báo được xuất bản vì một số trong số chúng có thể liên quan nhiều đến thống kê nhưng được gắn thẻ dưới dạng tên miền khác nhau (ví dụ như toán học hoặc cs ).

Ngoài ra, blog của Tây An có thể đặt ra như một trường hợp nghiên cứu. Ông viết nhiều về số liệu thống kê Bayes và thường đề cập đến các giấy tờ được tạo ra (có thẻ riêng ).

Dường như chúng tôi đã đề cập đến "arXiv" trên CrossValidated trong 689 bài đăng và bình luận cho đến bây giờ (bao gồm cả ở đây).

Điều này có làm cho nó phổ biến hay không? Tuy nhiên, khó có thể nói, nhưng chắc chắn hàng ngàn bài báo liên quan đến thống kê đã được đăng trên arXiv và mức độ phổ biến của nó ngày càng tăng.


3
Hoặc ít nhất, hàng ngàn bài báo sử dụng / đề cập đến phương pháp thống kê
Glen_b -Reinstate Monica

@Glen_b có, đó là vấn đề của các từ khóa để kiểm tra, nhưng tôi thấy không có cách nào tốt hơn để kiểm tra nếu nó là "phổ biến".
Tim

4
'Thống kê' là một lĩnh vực chủ đề trên arXiv - với 7.711 bài nộp đến cuối năm 2014, chiếm 0,9% tổng số. arxiv.org/help/stats/2014_by_area/index
Scortchi - Tái lập Monica

@Scortchi Tôi chưa bao giờ đào sâu như vậy trong trang web này, cảm ơn!
Tim

+1 :) Tôi không tưởng tượng câu hỏi này là một bài tập phân tích ... nhưng bạn đã tìm ra cách để giải quyết nó ... điều này rất tuyệt :) Sẽ không mong đợi bất cứ điều gì ít hơn từ mọi người trên trang web này! Tôi muốn nói dựa trên @Aksakal và phân tích của bạn, ArXiv được đăng ký hợp lý để thống kê :-)

8

Tất cả các tạp chí do Viện Thống kê Toán học (IMS) xuất bản - và bao gồm Biên niên sử Thống kê (một trong những tạp chí thống kê hàng đầu), Biên niên sử Thống kê Ứng dụng , v.v. - rõ ràng khuyến khích các tác giả đưa bản in lên arXiv và , hơn nữa, hãy chú ý đến việc in dấu lên arXiv. Tôi thực sự không biết về bất kỳ tạp chí toán học hay vật lý nào tải các bài báo lên arXiv nếu các tác giả không tự làm điều đó!

IMS khuyến khích tất cả các thành viên đăng bài viết của họ trên arXiv.

( http://www.imstat.org/publications/arxiv.html )

Tất cả các bài viết của IMS 2004 và chuyển tiếp đều có sẵn miễn phí ở định dạng sau in trên arXiv, cũng như các bài viết được đăng bởi các tác giả.

ArXiv là một truy cập mở, máy chủ lưu trữ và phân phối điện tử hoàn toàn tự động cho các bài báo nghiên cứu, hiện do Đại học Cornell sở hữu và vận hành, và được tài trợ một phần bởi NSF. Các lĩnh vực chính mà nó bao gồm là vật lý, toán học, khoa học phi tuyến tính, khoa học máy tính và sinh học định lượng. Gần đây, arXiv đã hợp tác với IMS và Hiệp hội Bernoulli để mở ra một danh mục thống kê mới trong toán học. Chúng tôi hy vọng thể loại này cuối cùng sẽ phát triển thành một kho lưu trữ cấp cao nhất có thể so sánh với ví dụ toán học và vật lý.

( http://www.imstat.org/publications/eaccess.htm )

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.