Cách để bắt đầu và học R?


16

Tôi đã cố gắng nhiều lần để "tự mình đi" - nhưng với thành công hạn chế. Tôi là một người dùng SPSS bình thường và có một số kinh nghiệm về SAS.

Sẽ đánh giá cao một hoặc hai con trỏ từ một người có nền tảng tương tự và hiện sử dụng R.



Xem bài đăng meta của chúng tôi, được gắn thẻ faq : meta.stats.stackexchange.com/questions/793/ .
Andre Silva

Câu trả lời:


17

Tôi nghĩ rằng cách duy nhất để có được vào đó là lần sau khi bạn bạn cần phải làm điều gì đó trong SAS hoặc SPSS lửa lên R thay . Đó là khó khăn khi bắt đầu và lúc đầu bạn sẽ dành nhiều thời gian cho các nhiệm vụ đơn giản. Khi bạn gặp khó khăn google vấn đề và bạn có thể sẽ tìm thấy một giải pháp. Bạn có thể kiểm tra kết quả của mình với SPSS hoặc SAS.

Cuối cùng, bạn bắt đầu hiểu rõ và công việc bắt đầu nhanh hơn. Tham khảo mã cũ luôn giúp. Hy vọng bạn tìm thấy một số cảm giác tự hào về sự tiến bộ bạn đạt được.

Sau đó, khi bạn trở nên nâng cao hơn và đọc blog cộng với trang web này, bạn bắt đầu tìm hiểu sức mạnh thực sự của R, các thủ thuật và tất cả những gì có thể với nó.


2
Một vấn đề lớn: Hệ thống trợ giúp của R rất tốt khi bạn biết chi tiết bạn muốn. Sẽ không tốt lắm nếu bạn không có manh mối những gì bạn cần làm. Vì vậy, hãy tìm một tài nguyên cho bạn thấy những điều cơ bản như: cách đọc dữ liệu, cách lưu công việc của bạn cho đến nay, cách tạo và lưu biểu đồ, cách nhận trợ giúp, v.v. Ví dụ: nếu bạn nói, "Này, Tôi muốn dự báo điều gì đó, vì vậy tôi sẽ nhập? Dự báo để được giúp đỡ về điều đó. " Bạn sẽ không có gì. Trong R, thuật ngữ thông thường là "dự đoán". Tôi yêu R, nhưng phải giữ cho nó thật. Ngoài ra, nhận ra R là một ngôn ngữ lập trình, không giống như SAS hay SPSS: lúc đầu khó hơn, tốt hơn về sau.
Wayne

13

Một vài gợi ý:

  1. Câu trả lời của @Glen là chính. Bạn cần buộc bản thân làm điều gì đó trong R, ngay cả khi bạn biết bạn có thể làm điều đó dễ dàng với SPSS.
  2. Vài tháng trước tôi đã lập một danh sách các sách lập trình R không cố dạy số liệu thống kê, thay vào đó chúng chỉ mô tả R.
  3. Đăng ký nguồn cấp RSS của r-bloggers.comthẻ R stackoverflow . Tôi thấy nó rất hữu ích chỉ để đọc lướt các bài báo để có được gợi ý và lời khuyên.

7

Cuốn sách này có thể nằm ngay trên con hẻm của bạn: R. Muenchen (2008). R cho người dùng SAS và SPSS .

Tôi đã có những trải nghiệm rất giống nhau khi bắt đầu R nhiều lần. Tôi là một người dùng Stata mặc dù. Muenchen và Hilbe (một biên tập viên thời gian lo-ong phụ trách phần phần mềm thống kê của The American Statistician ) có một cuốn sách tương tự R cho người dùng Statavà đôi khi tôi thấy nó mang tính giải trí, khi họ cung cấp một đoạn mã gồm 20 dòng cho một thứ gì đó có thể thực hiện được trong ba dòng trong Stata. (Mặt khác, tất nhiên có những tình huống khi bạn chỉ đơn giản là không thể làm một việc hướng đối tượng một cách có ý nghĩa trong Stata.) Tôi đoán thông điệp là, bạn nên trừu tượng hóa từ trải nghiệm SPSS và SAS của mình, vì R nghĩ theo các thuật ngữ hoàn toàn khác về gần như tất cả mọi thứ. Kinh nghiệm trước đây của bạn có thể sẽ gây trở ngại nhiều hơn, ít nhất là trong trường hợp R (bạn có thể có thể học lại từ SPSS sang Stata khá nhanh nếu bạn phải). Không có bộ dữ liệu hình chữ nhật nữa và không có THẺ để đọc. Cuối cùng, bạn sẽ cần học cách làm R, thay vì cố gắng làm những điều SPSS trong R.


Tôi thích cuốn sách Muenchen rất nhiều
Peter Flom - Tái lập Monica

7

Tôi đã ở trong đôi giày của bạn - thực sự có lẽ vẫn còn trong đôi giày của bạn - vì tôi sử dụng cả R và SAS thường xuyên cho các nhiệm vụ khác nhau. Như đã đề cập ở trên, có "R cho người dùng SAS" và bạn cũng có thể muốn xem xét việc xem blog "SAS và R": http://sas-and-r.blogspot.com/ và sách đi kèm, cung cấp ví dụ hoạt động trong cả SAS và R.

Nói chung, trải nghiệm chuyển đổi giữa SAS và R có phần mất phương hướng, bởi vì chúng khác nhau về mặt triết học. Về cốt lõi, SAS không phải là ngôn ngữ lập trình - đó là giao diện dòng lệnh mạnh mẽ. R ... là một ngôn ngữ lập trình. R có ý nghĩa với tôi hơn khi tôi bắt đầu học Python và C so với khi tôi biết SAS. Phải thừa nhận rằng nó là ngôn ngữ lập trình được xây dựng để thống kê, nhưng ở đó bạn có nó.

Mặc dù cách tiếp cận buộc bạn phải kích hoạt R thay vì SAS là một cách tốt, tôi sẽ đề xuất một cái gì đó khác khi bạn mới bắt đầu, khi lần đầu tiên bước chân vào dự án mới và phần mềm mới thật đáng sợ. Lặp lại một phân tích cũ . Lấy một tờ giấy bạn đã viết, một vấn đề bạn đã thực hiện, bất cứ điều gì trong SAS (hoặc SPSS) và lặp lại nó trong R. Từng bước, Googling và đặt câu hỏi ở đây khi bạn đi. Điều này có ba lợi thế:

  1. Bạn sẽ không vô tình giết chết một dự án mới với quyết định "Tôi nên học một ngôn ngữ mới".
  2. Bạn biết câu trả lời rồi. Điều này có nghĩa là bạn có thể chắc chắn rằng bạn đã đi đến câu trả lời đúng trong R.
  3. Nó sẽ minh họa sự khác biệt giữa các ngôn ngữ khác nhau tốt hơn. "Wow, đó là cách dễ dàng hơn để làm trong R ...", "Tôi chưa bao giờ thực sự nhìn vào loại biểu đồ đó", v.v.

7

Rất nhiều lời khuyên tốt ở đây, nhưng tôi nghĩ rằng điều hữu ích nhất bạn có thể làm là chỉ ngồi xuống với một người biết R trong vài giờ. Có lẽ tôi đã mất nhiều năm để học R một mình; chỉ cần có ai đó nói, "Nah, làm theo cách này dễ hơn nhiều" sẽ giúp tôi tiết kiệm rất nhiều đau buồn. Tôi nghĩ rằng điều này đặc biệt quan trọng đối với việc học làm R, thay vì những thứ SPSS trong R, như StasK đề cập, nhưng nó cũng sẽ ngăn bạn dành hàng giờ để theo đuổi các lỗi cú pháp nhỏ ngu ngốc.

Có vẻ như Pittsburgh không có Nhóm người dùng R, gây khó khăn cho tôi, nhưng phải có nhiều Rgonauts trong vùng lân cận. Hãy cố gắng tìm chúng. Mua chuộc ai đó để đi chơi với bạn trong khi bạn làm việc thông qua bất cứ điều gì được mô tả ở trên - dịch một dự án cũ sang R nghe có vẻ đặc biệt tốt.


Tôi nghĩ rằng việc xác định ảnh hưởng sức khỏe của việc vượt qua đường cong học tập R sẽ là một nghiên cứu tuyệt vời!
N Brouwer

5

Tôi đồng ý với @Matt Parker rằng có rất nhiều lời khuyên tốt. Một điều tôi muốn nhấn mạnh trong câu trả lời của mình là việc hiểu lập trình cơ bản là rất quan trọng nếu bạn muốn làm việc với R.

Lập trình cơ bản

Trang web yêu thích của tôi để tìm hiểu những điều mới là Khan Academy có một số video về kịch bản Python rất giống với R và thực sự có một plugin cho phép bạn sử dụng Python trong SPSS mà bạn có thể tìm thấy ở đây . Tôi đã sử dụng plugin Python rất nhiều khi thực hiện các phép hợp nhất phức tạp, đếm số lần xuất hiện, tạo bảng tùy chỉnh, v.v ... Đó là một cách rất tốt để bắt đầu với lập trình.

Thỏa thuận với R là gì?

Tôi biết một số ngôn ngữ lập trình khác nhau và điều khiến R trở nên đặc biệt là vectơ / ma trận và đó là đầu ra đồ họa. Tôi khuyên bạn nên tìm hiểu các cách khác nhau để thao tác vectơ vì chúng là cơ sở của các tệp dữ liệu và hầu hết dữ liệu bạn sẽ sử dụng, đây là một hướng dẫn tốt . Khi nói đến đầu ra đồ họa, có các chức năng tốt cho hầu hết các biểu đồ có sẵn và bạn có thể không cần phải lo lắng về phần này.

Một phần cơ bản khác của R là hàm install.packages ("my_package_name") giúp tìm nạp các thành phần mới và cài đặt chúng không gặp rắc rối - điều mà rất nhiều ngôn ngữ khác làm cho khó khăn hơn.

Bắt đầu ở R

Trang web favourit R của tôi là Quick-R và tôi sẽ đề nghị thử một số mã của họ. Khi bạn đã nhận được cùng một biểu đồ, hãy thử thay đổi màu sắc, số lượng cột, xlabel, v.v. Ngoài ra còn có rất nhiều hướng dẫn R trên YouTube có thể giúp bạn bắt đầu.

Học bằng cách kiểm tra mã người khác

Một cách tuyệt vời để học R là cố gắng hiểu các chức năng khác nhau hoạt động như thế nào. Viết tên hàm (không có dấu ngoặc đơn), nhấn enter và bạn nhận được mã - nhìn vào mã của nó và cố gắng hiểu nó làm gì. Hàm debug () cũng có thể giúp ích khi cố gắng hiểu cách thức hoạt động của công cụ.

Sử dụng R mà không cần mã hóa

Có, bạn có thể chọn sử dụng R trong môi trường tương tự SPSS :

install.packages("Rcmdr")
library(Rcmdr)

R so với SAS

Tôi cũng đã từng làm việc với SAS, một ngôn ngữ rất không trực quan, khác rất nhiều so với tất cả các ngôn ngữ lập trình khác và thật không may, bạn có thể có rất ít mà bạn có thể sử dụng từ trải nghiệm SAS của mình khi làm việc với R. Điều đó nói rằng, R là nhiều dễ dàng hơn mà SAS ;-)

GUI

Thật tuyệt khi có một môi trường tốt để làm việc khi bạn sử dụng R, đề xuất của tôi cho người mới bắt đầu là RStudio .

Chúc may mắn!


Heh - Tôi không đồng ý rằng SAS khó hơn R. Họ ... khác biệt. Nếu một người xuất phát từ truyền thống ngôn ngữ lập trình, R có thể có ý nghĩa hơn so với SAS. Nhưng thực sự khi nói về nó, chúng khác biệt - như tôi đã nói trong bài viết của mình, SAS giống như một giao diện dòng lệnh hơn là một ngôn ngữ lập trình thích hợp.
Fomite

Tôi đồng ý rằng chúng rất khác nhau và đó là một ý kiến ​​nhiều hơn là một tuyên bố. Có một số tính năng cơ bản mà tôi thiếu khi cố gắng học SAS trong đó cơ bản nhất là chức năng trợ giúp tốt, tôi không bao giờ đào sâu vào SAS. Một điều tôi nhận thấy là nhiều người sử dụng SAS sao chép cú pháp cũ của họ mà không hiểu. Tôi đã thấy mọi người viết mã trong đó một nửa lệnh thậm chí không được sử dụng. Đó là lý do tại sao tôi tin rằng một khi bạn hiểu được việc học lập trình R không quá khó. Trợ giúp tốt, đánh dấu cú pháp, cộng đồng trực tuyến phong phú có giá trị rất nhiều và biết lập trình thực sự hữu ích năm 2011.
Max Gordon

Hệ thống trợ giúp của SAS tập trung trong các tài liệu hỗ trợ. Nhưng vâng, chủ yếu là chúng khá khác nhau. Khó chịu, có những chức năng của cả hai ngôn ngữ hơi khó lặp lại trong ngôn ngữ kia, điều này khiến tôi thỉnh thoảng sử dụng cả hai ngôn ngữ. Điều mà tôi thực sự không muốn làm.
Fomite

4

Tôi nghĩ rằng câu trả lời được đề cập bởi @Glen là rất quan trọng tuy nhiên bạn cần một số cuốn sách để bắt đầu.

Liên quan đến RI tin rằng bạn cần 3 cuốn sách.

Đầu tiên, để thực hiện thống kê với R tôi có thể đề nghị bạn R trong Hành động . Robert duy trì một trang web và blog R rất tích cực (http://www.statmethods.net/) và cuốn sách và những nỗ lực của anh ấy thật tuyệt vời.

Thứ hai, bạn có thể cần một cuốn sách để lập trình trong R, vì R không chỉ là một chương trình thống kê mà còn là một ngôn ngữ hùng mạnh. Lập trình rất hữu ích khi thực hiện các phân tích phức tạp hoặc khi kết hợp phân tích hoặc để viết các hàm thực hiện cùng một thứ trên các bộ dữ liệu khác nhau. Tôi chỉ có thể khuyên bạn nên The Art of R Lập trình . Không có số liệu thống kê chính nào được trình bày ở đây, nhưng bạn sẽ nắm được cách kết hợp, kết nối và tự động hóa các phân tích của bạn.

Thứ ba, bạn sẽ cần một cuốn sách tham khảo , một cuốn bách khoa toàn thư. Tôi có thể khuyên bạn nên R Book . Đây không phải là cuốn sách bạn sẽ đọc từ đầu đến cuối mà là cuốn sách bạn mở bây giờ và sau đó để xem nếu một số điều có thể, nếu có những cách khác để phân tích dữ liệu, v.v.

Và quan trọng nhất là ngừng sử dụng bất cứ thứ gì khác và cố gắng giải quyết tất cả các vấn đề của bạn trong R. Giải quyết vấn đề theo cách tốt nhất để học.

Ngoài ra, trước khi tôi quên. Có một số blog tuyệt vời từ một số người tuyệt vời viết về tất cả những thứ người ta có thể làm trong R. Tìm kiếm và bạn sẽ tìm thấy. Rất khuyến khích là trang tổng hợp http://www.r-bloggers.com/ nơi tập hợp các blog có liên quan R.

Chúc vui vẻ!


1

Nếu tôi có thể thêm hai mục vào nhiều gợi ý hay ở đây rồi;

1) Tìm một nhóm R. Tôi biết trong khu vực Boston có một nhóm R khá mạnh. Nó được tài trợ bởi RStudio , nhân tiện là một trong những IDE TỐT NHẤT xung quanh.
Truy cập Meetup hoặc nhóm Google hoặc RSeek.org để tìm kiếm chúng.

2) Một điều nữa, tôi thấy việc học R tự mình leo dốc nhưng lời khuyên chung của tôi là hãy tiếp tục tìm những cuốn sách giúp VÀ KHÔNG DỪNG LẠI cho đến khi bạn tìm đúng.


1

Nhân viên tiếp thị:

Tôi biết vấn đề của bạn là điều tốt nhất và tồi tệ nhất của R quá chức năng cho đến khi chúng tôi không biết bắt đầu từ đâu.

Trước tiên, bạn cần biết mục đích bạn học R. Nếu bạn chỉ học một ngôn ngữ mới thì tôi nghĩ Blog của SAS và R có thể hữu ích, với tư cách là người dùng SAS / SPSS.

Tuy nhiên, R không khó lắm nếu so với SAS hoặc SPSS, nó trông có vẻ phức tạp do các gói và chức năng ngày càng tăng. Vì vậy, tôi khuyên bạn nên tìm hiểu từ đầu bằng cách sử dụng bất kỳ hướng dẫn sử dụng hoặc web nào được đề xuất, chẳng hạn như Quick-R, của tác giả của R in Action. Lưu ý: R in Action là một cuốn sách hay để bắt đầu.

Điều gì xảy ra nếu, bạn đã sử dụng R cho các mục đích cụ thể, thì tốt hơn là bạn nên xem danh sách Sách R R tại R Project Web. Có 129 cuốn sách liên quan đến R và S trong các ứng dụng cụ thể, như Kinh tế lượng, Đồ họa, Mô hình hóa, v.v.

Gần đây, tôi đang nghĩ về Nền tảng học tập trực tuyến ngôn ngữ tương tác R và tôi cũng đã yêu cầu phản hồi ở đây. Đó là dự án mã nguồn mở (chưa được phát hành). Tôi đã bắt đầu tạo ra một nguyên mẫu hoạt động với 3 bài học cơ bản về Ngôn ngữ R. Bạn có thể thử nó.

Hy vọng nó sẽ giúp :-)



0

Có phiên bản R miễn phí ban đầu cho Người dùng SAS và SPSS tại http://r4stats.com . Trang web đó cũng có nhiều ví dụ về sách hiện được hiển thị dưới dạng trang web. Nếu bạn có quyền truy cập vào thư viện trường đại học, họ thường có tất cả các sách Springer R trực tuyến miễn phí.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.