Ví dụ PCA tốt cho việc giảng dạy


10

Tôi đang dạy đại số tuyến tính cho một lớp kỹ sư, nhà khoa học xã hội và lập trình viên máy tính. Chúng tôi vừa mới thực hiện phân tách giá trị số ít và chúng tôi có thêm một ngày, vì vậy tôi nghĩ tôi đã nói về mối quan hệ giữa phân tách giá trị số ít và phân tích thành phần chính. Tôi có phần lý thuyết của bài giảng được viết tốt, nhưng tôi đang gặp khó khăn trong việc tìm kiếm các ví dụ tốt để sử dụng. Dưới đây là các ràng buộc:

  • Tôi muốn hiển thị hình ảnh. Lý tưởng nhất là đồ họa nên hoạt động tốt: Các trục và điểm dữ liệu trong biểu đồ phân tán phải được dán nhãn. Từ tiếng Anh tốt hơn tên loài Latin.

  • Câu hỏi đang được nghiên cứu nên thú vị. Hình thái của cá Nigeria, trong khi quan trọng, không phải là một cách tốt để thu hút sự chú ý của một lớp.

  • Trái ngược với gạch đầu dòng trước: Không có gì khác biệt về chủng tộc của con người; không có gì về kiểm tra trí thông minh. Điều đó sẽ dẫn đến một cuộc thảo luận sôi nổi không liên quan gì đến các kỹ thuật toán học.

  • Phương pháp phân tích toán học về cơ bản là PCA thuần túy. Dự án DW-NOMINATE, trong khi tuyệt vời, sử dụng PCA làm điểm khởi đầu, theo sau là thuật toán leo đồi phức tạp hơn nhiều.

Tôi nghĩ rằng điều này sẽ dễ dàng. Tôi có thể dễ dàng nghĩ ra hàng tá dự án phân tích thú vị mà tôi có thể làm nếu có thời gian thu thập dữ liệu: Tham gia các cuộc thăm dò của Pew Research và xem liệu PCA có phục hồi trục chính sách xã hội / chính sách tài khóa yêu thích của những người theo chủ nghĩa tự do hay không. Thực hiện một chục phép đo các đặc điểm vật lý giống chó điển hình và xem PCA có thể tìm thấy cụm "chó cừu" không. Etcetera, vân vân ... Tôi đang tìm một người khác đã hoàn thành công việc để tôi có thể thể hiện điều đó.

Tôi sợ dòng thời gian ở đây khá chặt chẽ: Tôi giảng vào chiều mai (Thứ Hai). Tôi đã dành hầu hết các nghiên cứu về PCA vào cuối tuần trong các lĩnh vực thú vị khác nhau và tìm hiểu nhiều lần rằng chúng không phù hợp.


1
Hình thái của cá Nigeria sẽ đủ để thu hút sự chú ý của tôi (tôi không phải là nhà sinh vật học từ xa). Tôi không biết liệu tôi có bất thường hay bạn đánh giá thấp năng lực của mọi người về việc quan tâm đến mọi thứ. Có lẽ đó là một chút của mỗi.
Glen_b -Reinstate Monica

1
@Glen_b Ở đây bạn đi scielo.cl/pdf/ijmorphol/v29n4/art60.pdf !
David E Speyer

Câu trả lời:


4

Có một số hướng dẫn từng bước trong ghi chú của Shalizi tại đây: http://www.stat.cmu.edu/~cshalizi/uADA/12/lectures/ch18.pdf , một trong số đó là dữ liệu xe ô tô được đặt từ R và một người khác bài báo nghệ thuật và âm nhạc từ New York Times. (Suy ra chủ đề của một bài báo từ các từ có trong đó là một lĩnh vực nghiên cứu rất tích cực.) Nếu bạn không biết / không muốn học R thì bạn vẫn có thể sử dụng ghi chú và đồ họa của anh ấy.

Chỉnh sửa: quên nói rằng cũng có một vài ví dụ hay trong một cuốn sách của Everitt và Hothorn, có sẵn trên SpringerLink. Khi tôi nhớ lại, một bộ dữ liệu là máy bay chiến đấu phản lực và cũng có đồ gốm La Mã.


2

Tôi biết rằng đã quá muộn cho bài giảng của bạn, nhưng đây là một ví dụ sử dụng dữ liệu decathlon olympic mà tôi thấy rất hữu ích khi học PCA. Một vài bài viết dựa trên R của nó: http://factominer.free.fr/classical-methods/principal-components-analysis.html http://www.math.vu.nl/sto/onderwijs/multivar/ Cao đẳng2.pdf


Vì không có liên kết nào ở trên hoạt động lâu hơn nữa, nên đây là một thay thế gần gũi: statweb.stanford.edu/~jtaylo/cifts/stats202/olympic.html
MERose
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.