Phần mềm thống kê nào phù hợp để giảng dạy một khóa học giới thiệu đại học về khoa học xã hội?


11

Tôi đang tìm kiếm một gói phần mềm thống kê mà tôi có thể sử dụng trong một khóa học giới thiệu về thống kê cho một chương trình nghiên cứu khoa học xã hội. Các sinh viên không có kiến ​​thức về thống kê và cũng không có kinh nghiệm với các ngôn ngữ lập trình. Mục tiêu là giới thiệu cho họ các khái niệm thống kê cơ bản (như phương tiện, phương sai, tổng bình phương, giá trị p, ... và cuối cùng là hồi quy tuyến tính) và cho phép họ tự thực hiện các phân tích cơ bản bằng cách sử dụng bộ dữ liệu mẫu. Khóa học nên là về việc học các khái niệm bằng cách thực hiện thống kê thay vì ghi nhớ các công thức (mặc dù tôi nghĩ rằng các công thức là quan trọng).

Do đó, tôi đang tìm kiếm một giải pháp thay thế cho cú pháp thông thường (như R thông thường) hoặc phần mềm điều khiển điểm và nhấp (như SPSS hoặc Rcmdr). Phần mềm phải dễ học và nó phải có giao diện người dùng đồ họa rõ ràng, trực quan hóa các bộ dữ liệu và cung cấp các biểu đồ và bảng tiêu chuẩn. Điều tốt nhất sẽ là nếu nó trực quan hóa tất cả các bước khác nhau của phân tích (ví dụ: đọc và thao tác dữ liệu, tính toán các biện pháp mô tả, lập bảng và biểu đồ mô tả, tính toán các biện pháp suy luận, vẽ đồ thị suy luận, xuất ra báo cáo).

Bạn có đề xuất về phần mềm thống kê (nguồn mở hoặc miễn phí) phù hợp cho việc học và thực hành thống kê đầu tiên không?

EDIT
Cảm ơn lời đề nghị của bạn. Tôi đã xem xét kỹ lưỡng và hai chương trình khác mà tôi đã tìm thấy trong cuộc điều tra trực tuyến của riêng mình: RapidMinerStatistics Lab . [1]
Tôi đã thấy rằng gretlgiao diện và đầu ra rõ ràng và tập trung hơn so với Rcmdr, SPSS hoặc Stata. Do đó, nó là một công cụ đủ điều kiện để bắt đầu giảng dạy thống kê theo quan điểm của tôi.
Tuy nhiên, sơ đồ GUI của RapidMinerStatistical Labgây ấn tượng với tôi khi họ hình dung các bước duy nhất của phân tích thống kê (bắt đầu bằng việc tải dữ liệu). Tôi nghĩ rằng điều này có thể hữu ích cho nhiều sinh viên đấu tranh với sự tập trung thông thường vào các giải thích toán học. Tất nhiên, RapidMiner dường như quá tải với các chức năng, menu và nút cho người mới bắt đầu trong khi Phòng thí nghiệm thống kê tập trung hơn nhiều. Điểm cộng lớn của Phòng thí nghiệm thống kê là "Máy tính R" giống như bàn điều khiển với "Trình hướng dẫn mã R" hỗ trợ tạo ra cú pháp R thực sự khi Phòng thí nghiệm thống kê dựa vào Rtính toán của nó.
Cuối cùng, tôi quyết định bắt đầu với Phòng thí nghiệm thống kê trong học kỳ đầu tiên trong khi giới thiệu các khái niệm cơ bản và chuyển sang RStudio (và Rcmdr) trong học kỳ thứ hai.

[1]: Gnumeric, SciPy, Scilab, GNU Octave và tôi dường như ít hướng đến khoa học xã hội.


8
@Matthias: Tôi nghĩ rằng nếu sinh viên của bạn đến / nhắm đến / cho một lĩnh vực khoa học xã hội, thì việc dạy họ R như một bước đầu tiên trong Thống kê là quá mức cần thiết. Hầu hết trong số họ sẽ gặp vấn đề với khái niệm về giao diện điều khiển, lệnh, cú pháp, v.v. và bạn sẽ dành nhiều thời gian hơn để xem qua "khái niệm lập trình" ("hàm", "vòng lặp", v.v.) so với "thống kê". Tôi dựa trên kinh nghiệm này trước đây, khi tôi đã hướng dẫn cho Chỉ số 101 trong bộ phận Soc.Science; mọi người đã bỏ lỡ điểm của các bài giảng vì họ tập trung nhiều hơn vào việc R làm việc cho họ hơn là thực sự khám phá dữ liệu của họ.
usεr11852

1
@ user11852: Bạn có thể đúng nhưng thật buồn khi các trường trung học gửi học sinh ra ngoài mà không có tiếp xúc với chương trình. Hoặc các trường đại học cho phép khoảng cách này. Không nên có sinh viên đến lớp đại học mà không biết vòng lặp hoặc chức năng là gì. Trì hoãn tiếp xúc chỉ đẩy vấn đề ở nơi khác.
tò mò_cat

2
@ user11852: Tùy chọn ít ngon miệng khác có thể dành cho các bộ phận Satistic để khẳng định rằng các lớp "Chỉ số 101 cho Khoa học Xã hội" có một điều kiện tiên quyết về một số kinh nghiệm lập trình hoặc một lớp khắc phục về lập trình. Ngày nay, khi hầu hết tất cả các môn học đều thiên vị tính toán quá nhiều, thực sự không có lý do gì Lập trình-101 không phải là lớp đầu tiên mà mọi người đều tham gia.
tò mò_cat

6
Để biết giá trị của nó, tôi đã sử dụng R thành công trong khóa học thống kê giới thiệu về khoa học chính trị. Tôi đã sử dụng RStudio . Tôi cũng có "phòng thí nghiệm" hàng tuần, nơi tôi sẽ cho phép sinh viên làm việc cùng nhau trong các bài tập nhỏ, trong khi tôi đi xung quanh và trả lời các câu hỏi. Với một số mã ví dụ được nhận xét tốt, các sinh viên đã làm tốt và hầu như không phàn nàn gì cả. Họ thực sự phàn nàn về R rất ít so với học kỳ trước khi tôi sử dụng Stata. Vì Stata không miễn phí, sinh viên phải đến trong phòng thí nghiệm để làm công việc của họ - họ ghét điều đó.
Jason Morgan

6
Tôi nghĩ rằng R kết hợp với RStudio có thể là một cách tiếp cận tuyệt vời. Nó cũng đặt sân khấu cho thực hành nghiên cứu tái sản xuất, không giống như các hệ thống menu. Tôi khuyên bạn nên đưa ra một số mẫu mã mà sinh viên có thể tải vào RStudio từ web (RStudio giúp việc này dễ dàng) và để sinh viên thực hiện công việc thay đổi tên biến và mô hình thống kê thành những gì cần thiết cho vấn đề.
Frank Harrell

Câu trả lời:


12

Có lẽ Gretl? http://gretl.sourceforge.net/

Nó là miễn phí và được sử dụng tại trường đại học của chúng tôi để thống kê đại học.


9
+1. Đề nghị tuyệt vời. Tôi luôn thấy GUI của Gretl trực quan và đến điểm và phản hồi mà nó cung cấp chính xác và không có quá nhiều kiểu cách sẽ khiến một số sinh viên ít "công nghệ" hơn. Thêm vào đó, nó là miễn phí, tài liệu tốt và có bảng điều khiển R nếu ai đó nếu muốn nhìn thấy một cái gì đó "sâu hơn" một chút.
usεr11852

8

Tôi sẽ tránh hầu hết những thứ "nổi tiếng", MatLab , Maple , Mathematica , JMP , SAS hoặc Minitab , vì khi sinh viên của bạn tốt nghiệp, họ phải trả hàng ngàn đô la mỗi năm để sử dụng nó một cách chuyên nghiệp. Mỗi công ty có xu hướng có công cụ yêu thích cụ thể của mình và nếu bạn dạy họ một công cụ mà công ty của họ sẽ không trả tiền thì bộ kỹ năng của họ sẽ bị lãng phí. Tôi cũng không thích các thư viện độc quyền - họ huấn luyện người dùng nhấn nút và nếu người dùng muốn đi đến một nơi khác (JMP hoặc bất cứ điều gì) thì không cần phải học.

Python bao gồm SciPy / NumPy là khá tốt. Nó là nguồn mở và được hỗ trợ tốt. Nó có một ngữ pháp dễ học / dễ học. Nó vẫn được giải thích để nó không hét lên nhanh chóng, nhưng nếu họ không biết bất kỳ kịch bản hay bảng tính nào thì nó sẽ nhanh hơn nhiều so với những gì họ cần. PythonXY là phiên bản tốt, có libs và hỗ trợ tốt. Tôi cũng thích lập trình GUI đó thông qua nó. Xây dựng các ứng dụng độc lập trong các cửa sổ là một thách thức nhỏ nhưng có khả năng sẽ vượt quá trình độ của học sinh. (chỉnh sửa) SageCythoncải thiện đáng kể đề xuất giá trị của Python. Giao diện và khả năng sử dụng được cải thiện đáng kể. Một mã được biên dịch nhanh hơn 1000 lần so với một mã được diễn giải khá tốt nghe có vẻ tuyệt vời (hoặc tuyệt vời) đối với tôi. EDIT: Tôi đã có một số niềm vui khi sử dụng các bản phân phối Anaconda (còn gọi là conda), và chúng cũng rất đơn giản để sử dụng.

Tôi không phải là một fan hâm mộ lớn của Perl . Đó là một chút lỗi thời. Đó là về phân tích cú pháp và xử lý văn bản nhiều hơn toán học / khoa học. Đừng hiểu sai ý tôi, nó có thể làm toán / khoa học, nhưng nếu bạn biết VBA thì MSWord có thể làm toán / khoa học. Có thể không giống nhau có một công việc cụ thể là trọng tâm chính của bạn.

Tôi thích R , mặc dù bạn không, bởi vì nó đang được phát triển mạnh mẽ bởi tiến sĩ toán học / thống kê. Điều này có nghĩa là mặc dù ngữ pháp có thể là klugy, nhưng nó sẽ có các thư viện được cập nhật và không có lỗi. (Nói chung)

Excel không phải là một khởi đầu tồi. Một khi bạn biết một bảng tính, nó làm cho việc sử dụng bất kỳ khác dễ dàng hơn. Trong môi trường kinh doanh, gần như mọi công ty đều có văn phòng MicroSloth, vì vậy Excel không phải là ý tưởng tồi. Tôi không thích kịch bản của họ, nhưng đó chỉ là sở thích, tôi vẫn có thể sử dụng nó. Nó có giá khoảng 150 đô la Mỹ so với 5000 đô la Mỹ cho một số phần mềm khác vì vậy chi phí đầu vào cho người bình thường là hợp lý hơn.

Ngôn ngữ kịch bản JMP là xa lạ. Nó không dịch sang phần mềm khác (nonSAS). Tránh xa nó ra Tính năng có thể đổi lại duy nhất của ngôn ngữ là nó có thể (trong một số ý nghĩa hạn chế) chạy mã "R". Nếu bạn đang mã hóa trong "R", chỉ cần sử dụng "R" và "RStudio".

Tôi chưa sử dụng MathCAD nên tôi không thể nói về mức độ liên quan của nó. Tôi nghĩ rằng nó mang tính biểu tượng hơn, ít hơn về việc nhập dữ liệu bên ngoài. Nó rẻ hơn, cho đến nay. Nó không miễn phí và mở. Cơ sở tại nó không dịch sang cơ sở bằng ngôn ngữ khác. ( EDIT ) Cũng trong danh mục này là EES , tôi cũng không ấn tượng lắm với bên ngoài cửa sổ sử dụng rất hẹp.

EDIT : Tôi đã bị ấn tượng một chút bởi LabVIEW . Nó đủ đơn giản để sử dụng rằng một vài giờ có thể có được một người có khả năng. Nó chạy rất nhanh, nhanh hơn 1000 lần so với MatLab theo đúng nghĩa đen của mã ( MathScript ). Nếu bạn có một số vật nặng, nó đáng để xem xét một chút. Nó có giá tiền, nhưng một cái gì đó trong khu phố 1/5 của sắt lớn thông thường.

May mắn nhất

EDIT: Tôi sẽ không sử dụng Công cụ thống kê vì ngay cả khi bạn chọn "tiếng Anh" cho ngôn ngữ, nó phát ra bằng tiếng Đức và nó không gỡ cài đặt trên windows 7. Cả hai điểm yếu về quản trị đều khiến tôi không thể thực hiện được. Tôi không thể vận hành nó và khi tôi cố gắng loại bỏ nó thì thất bại.

Bằng cách dùng thử và lỗi, tôi phát hiện ra cài đặt menu để hiển thị bằng tiếng Anh. Nó dường như là một giao diện tương đối đơn giản (và do đó hữu ích và nhất quán) trong một số thư viện R để xử lý và hiển thị dữ liệu. Tôi sẽ phải xem xét nhiều hơn về nó, vì vậy tại thời điểm này 'bồi thẩm đoàn vẫn chưa kết thúc'.

EDIT thêm:

-> Ở đây <- là một liên kết thú vị cho toàn bộ cuộc thảo luận khác về các công cụ và bàn làm việc.


2
Ngoài ra còn có RPy rpy.sourceforge.net , R là thư viện cho Python, do đó bạn có được các khía cạnh cập nhật, không có lỗi đã được chứng minh của R với tính đơn giản cú pháp của Python.
Ghillie Dhu

1
"họ huấn luyện người dùng nhấn nút và nếu người dùng muốn đi đến một nơi khác (JMP hoặc bất cứ điều gì) thì không cần phải học hỏi." SAS, một chương trình độc quyền, đặc biệt không đào tạo tốt cho "các nút ấn" và gặp khó khăn trong việc chuyển đổi giữa các ngôn ngữ khác nhau hầu như không phải là một tính năng của phần mềm độc quyền. Heck, tôi ở nhà nhiều hơn từ SysStat đến JMP hơn là từ Python đến R.
Fomite

@Epigrad - Tôi xem nó biến bộ não của các kỹ sư mọi lúc. Hàng chục và hàng chục người. Tôi rất vui vì bạn đã tìm thấy tiện ích cho nó, nhưng tôi thực sự mong đợi rằng bạn là một ngoại lệ và xu hướng gây hại chung không thay đổi đáng kể bởi kinh nghiệm của bạn.
EngrStudent

@EngrStudent: Cảm ơn bạn đã nỗ lực thử Phòng thí nghiệm thống kê! Cài đặt menu cho ngôn ngữ tiếng Anh thực sự không trực quan, nhưng sau khi cài đặt xong, tôi không gặp phải vấn đề gì với ngôn ngữ. Thật không may, tôi không thể làm cho "Trình hướng dẫn biểu đồ R" hoạt động, mặc dù Biểu đồ R bình thường hoạt động tốt nếu tôi đặt một số mã R. Do đó, tôi sẽ cung cấp cho học sinh của mình một số đoạn mã ví dụ để tạo đồ họa cơ bản. Có lẽ tôi chuyển sớm hơn sang RStudio ...
không phải là số_argument

1

Bạn có thể thử sử dụng Gnumeric, một bảng tính được đánh giá cao, cũng có bảng tính Open Office. Miễn là bạn giải thích những cạm bẫy của việc sử dụng bảng tính, đặc biệt là Excel, sau khi học đại học trong cuộc sống thực tế sau này, họ có thể không có thứ gì xa xỉ như SPSS, nhưng vẫn có thể nhận được dịch vụ hữu ích từ những sản phẩm miễn phí không đòi hỏi quá nhiều về toán học và kỹ năng lập trình . Nhiều môi trường văn phòng chứa Excel theo mặc định.

Có một cái nhìn tại:

http://groups.google.com/group/sci.stat.math/browse_thread/thread/26fe9a9a0d91139d# - Thống kê và Excel 2007

và tìm kiếm các tài liệu tham khảo tương tự như

http://groups.google.com/group/comp.soft-sys.stat.spss/browse_frm/thread/3940bcd6c6266f1b/d85edd4978e53568?hl=vi#d85edd4978e53568 Keeling, Kellie B. & Pavur, Robert. Một nghiên cứu so sánh về độ tin cậy của chín gói phần mềm thống kê. Thống kê tính toán & phân tích dữ liệu, 51, 3811 Từ3831.


1

Tôi đã được CalEst . Giấy phép rẻ, như 10 buck và cung cấp cả tính toán / đồ họa cũng như mô phỏng / hoạt động tuyệt vời cho sinh viên thực hành. Hơn nữa, trong trang web của họ, họ có một số công cụ, chủ yếu là các bản phân phối mà bạn có thể thấy hữu ích.


Câu trả lời này hơi ngắn. Bạn có thể biết thêm về lý do tại sao bạn sẽ đề xuất phần mềm này không, và nó có những ưu điểm gì so với đối thủ cạnh tranh?
kjetil b halvorsen

1

Chúng tôi đã bắt đầu sử dụng Rguroo. Phần mềm này mới được phát hành. Nó dựa trên R, nhưng không có kiến ​​thức về mã hóa R được yêu cầu. Đây cũng là một ứng dụng web để bạn chỉ cần đăng nhập trên trình duyệt. Học sinh của tôi có thể lưu công việc của họ ở bất kỳ giai đoạn nào và quay lại để hoàn thành công việc của họ. Giao diện người dùng đồ họa rất trực quan và đầu ra trông tuyệt vời.


0

Chúng tôi đã sử dụng phiên bản beta của Rguroo trong các khóa học thống kê giới thiệu của chúng tôi tại Đại học bang California, Fullerton trong ba năm qua. Hiện tại họ (tháng 8 năm 2019) đã phát hành phiên bản chính thức, xem https://Rguroo.com. Đây là phần mềm Thống kê ứng dụng web hoạt động trong mọi trình duyệt. Phần mềm này được thiết kế để giảng dạy và họ cung cấp một bản demo và đào tạo cho giảng viên; chỉ cần gửi email hoặc gọi cho họ để sắp xếp cho một bản demo. Phần mềm chạy R ở chế độ nền, nhưng bạn không cần biết R, tất cả đều là điểm và nhấp. Nó có nhiều tính năng tuyệt vời, bao gồm đầu ra chi tiết, công cụ đồ họa tuyệt vời, máy tính xác suất và công cụ mô phỏng. Tôi đặc biệt thích Các tính năng tái tạo nơi bạn có thể lưu công việc của mình ở bất kỳ giai đoạn nào và quay lại và tiếp tục nơi bạn rời đi. Bạn cũng có thể chia sẻ công việc của mình với sinh viên thông qua những gì họ gọi là các tệp RGR. Điểm mấu chốt ... thật tuyệt vời và chúng tôi tiếp tục sử dụng nó.


0

Cá nhân tôi sử dụng phần mềm DataMelt để giảng dạy thống kê. Nó được ghi chép rất tốt, nó có hướng dẫn, sách và rất nhiều ví dụ để xem xét. Điều cũng quan trọng là người ta có thể tìm kiếm bất kỳ ví dụ nào và bạn có thể nhận được câu trả lời hợp lý (trong đoạn mã Javadoc và đoạn mã). Sinh viên có thể học không chỉ Python (vốn là ngôn ngữ lập trình mặc định) mà còn cả cách viết mã các phương thức thống kê trong Java. Theo quan điểm của tôi, đây là một thế mạnh đáng kể: sinh viên không cần phải học ngôn ngữ "thống kê" rất chuyên biệt, như R-stat. Họ cũng có thể học Java cùng một lúc, điều này có thể mở ra rất nhiều cơ hội nếu họ quyết định đi vào ngành.


-1

Có một phần mềm mới gọi là Rguroo, một ứng dụng web. Nó rất thuận tiện để sử dụng, vì nó không yêu cầu tải xuống hoặc cài đặt. Rguroo có một công cụ R, nhưng việc sử dụng nó không yêu cầu mã hóa R vì nó cho phép bạn sử dụng sức mạnh của R bằng giao diện đồ họa điểm và nhấp. Mỗi phân tích là có thể cứu được và tái sản xuất. Chúng tôi đã sử dụng phần mềm này cho các khóa học thống kê giới thiệu và trung gian trong ba năm qua. Tại thời điểm này, nó là miễn phí và bạn có thể tạo một tài khoản tại www.Rguroo.com. Dựa trên thông tin mà tôi có, nó sẽ vẫn miễn phí cho tất cả các giảng viên và nó sẽ có phí thuê bao hàng năm hợp lý, khoảng từ 10 đến 20 đô la, cho sinh viên.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.