Tôi đang trong quá trình chuẩn bị để dạy một khóa học giới thiệu về khoa học dữ liệu bằng ngôn ngữ lập trình R. Đối tượng của tôi là sinh viên đại học chuyên ngành kinh doanh. Một sinh viên đại học thông thường không có bất kỳ kinh nghiệm lập trình máy tính nào, nhưng đã học một vài lớp sử dụng Excel.
Cá nhân tôi rất thoải mái với R (hoặc các ngôn ngữ lập trình khác) vì tôi học chuyên ngành khoa học máy tính. Tuy nhiên, tôi có cảm giác rằng nhiều sinh viên của tôi sẽ cảm thấy cảnh giác khi học một ngôn ngữ lập trình bởi vì nó có vẻ khó đối với họ.
Tôi có chút quen thuộc với Excel và tôi tin rằng mặc dù Excel có thể hữu ích cho khoa học dữ liệu đơn giản, nhưng học sinh cần phải học một ngôn ngữ lập trình nghiêm túc cho khoa học dữ liệu (ví dụ: R hoặc Python). Làm thế nào để tôi thuyết phục bản thân và các sinh viên rằng Excel không đủ cho một sinh viên kinh doanh nghiêm túc nghiên cứu khoa học dữ liệu và rằng họ cần phải học một số chương trình?
Chỉnh sửa để trả lời bình luận
Dưới đây là một số chủ đề mà tôi sẽ đề cập:
- Xử lý dữ liệu và làm sạch dữ liệu
- Cách thao tác bảng dữ liệu, ví dụ: chọn tập hợp con của hàng (bộ lọc), thêm biến mới (biến đổi), sắp xếp hàng theo cột
- SQL tham gia bằng cách sử dụng gói dplyr
- Cách vẽ các ô (sơ đồ phân tán, sơ đồ thanh, biểu đồ, v.v.) bằng cách sử dụng gói ggplot2
- Cách ước tính và giải thích các mô hình thống kê như hồi quy tuyến tính, hồi quy logistic, cây phân loại và hàng xóm gần nhất k
Vì tôi không biết rõ về Excel, tôi không biết liệu tất cả các tác vụ này có thể được thực hiện dễ dàng trong Excel hay không.