Làm thế nào để chúng tôi giải thích sự khác biệt giữa hồi quy logistic và mạng lưới thần kinh với một đối tượng không có nền tảng về thống kê?
Làm thế nào để chúng tôi giải thích sự khác biệt giữa hồi quy logistic và mạng lưới thần kinh với một đối tượng không có nền tảng về thống kê?
Câu trả lời:
Tôi cho rằng bạn đang nghĩ về những gì đã từng, và có lẽ vẫn được gọi là "tri giác đa lớp" trong câu hỏi của bạn về mạng lưới thần kinh. Nếu vậy thì tôi sẽ giải thích toàn bộ sự linh hoạt về hình thức của ranh giới quyết định như là một hàm của các biến giải thích. Đặc biệt, đối với đối tượng này, tôi sẽ không đề cập đến các chức năng liên kết / tỷ lệ cược đăng nhập, v.v. Chỉ cần lưu ý rằng xác suất của một sự kiện đang được dự đoán dựa trên một số quan sát.
Đây là một chuỗi có thể:
Ưu điểm của phương pháp này là bạn không cần phải thực sự hiểu bất kỳ chi tiết toán học nào để đưa ra ý tưởng chính xác. Trong thực tế, họ không cần phải hiểu hồi quy logistic hoặc mạng lưới thần kinh để hiểu những điểm tương đồng và khác biệt.
Nhược điểm của phương pháp này là bạn phải tạo ra rất nhiều hình ảnh, và mạnh mẽ chống lại sự cám dỗ để thả xuống đại số để giải thích mọi thứ.
Để tóm tắt đơn giản hơn:
Hồi quy logistic: Hình thức đơn giản nhất của Mạng thần kinh, dẫn đến ranh giới quyết định là một đường thẳng
Mạng nơ-ron: Một siêu bộ bao gồm hồi quy Logistic và các phân loại khác có thể tạo ra các ranh giới quyết định phức tạp hơn.
(lưu ý: Tôi đang đề cập đến hồi quy logistic "đơn giản", không có sự trợ giúp của các hạt nhân tích hợp)
(tham khảo: các khóa học deeplearning.ai của Andrew Ng, "Hồi quy logistic như một mạng thần kinh" và "Phân loại dữ liệu hai chiều với một lớp ẩn")
Tôi sẽ đặt câu hỏi theo nghĩa đen: Một người không có nền tảng về thống kê. Và tôi sẽ không cố gắng cung cấp cho người đó một nền tảng về thống kê. Chẳng hạn, giả sử bạn phải giải thích sự khác biệt với CEO của một công ty hoặc đại loại như thế.
Vì vậy: Hồi quy logistic là một công cụ để mô hình hóa một biến phân loại theo các biến khác. Nó cung cấp cho bạn các cách để tìm hiểu làm thế nào thay đổi trong từng biến "khác" ảnh hưởng đến tỷ lệ cược của các kết quả khác nhau trong biến đầu tiên. Đầu ra khá dễ để giải thích.
Mạng lưới thần kinh là một tập hợp các phương pháp để cho phép một máy tính cố gắng học hỏi từ các ví dụ theo cách mơ hồ giống như cách con người tìm hiểu về mọi thứ. Nó có thể dẫn đến các mô hình là các yếu tố dự đoán tốt, nhưng chúng thường mờ hơn nhiều so với các mô hình từ hồi quy logistic.
Tôi được dạy rằng bạn có thể nghĩ về các mạng thần kinh (với các hàm kích hoạt logistic) như là một trung bình trọng số của các hàm logit, với trọng số ước tính. Bằng cách chọn một số lượng lớn các bản ghi, bạn có thể phù hợp với bất kỳ hình thức chức năng. Có một số trực giác đồ họa trong bài viết trên blog Kinh tế lượng .
Các câu trả lời khác là tuyệt vời. Tôi chỉ đơn giản là thêm một số hình ảnh cho thấy bạn có thể nghĩ về hồi quy logistic và hồi quy logistic đa lớp (hay còn gọi là hồi quy logistic đa cực, hồi quy softmax, phân loại entropy tối đa) như một kiến trúc đặc biệt của mạng lưới thần kinh.
Từ Sebastian Raschka, Đại học bang Michigan, trên KDnuggets :
Một vài minh họa cho hồi quy logistic đa lớp:
Một minh họa tương tự được lấy từ http://www.deeplearningbook.org/ chương 1:
Và một thông tin khác từ hướng dẫn của TensorFlow :
Ví dụ, trong Caffe , bạn sẽ thực hiện hồi quy logistic như sau :
Tôi sẽ sử dụng một ví dụ về một vấn đề phức tạp nhưng cụ thể mà khán giả hiểu được. Sử dụng các nút ẩn mà các diễn giải không được đào tạo, nhưng có ý nghĩa cụ thể.
Nếu bạn sử dụng các vị trí cờ vua (dự đoán liệu màu trắng sẽ giành chiến thắng), bạn có thể để các yếu tố đầu vào là một đại diện của bàn cờ (bỏ qua việc bạn có thể chiếm được lâu đài hay bắt được người đi đường hay thậm chí là di chuyển của nó), nói đầu vào nhị phân cho biết liệu có một phần của mỗi loại trên mỗi hình vuông.
Hồi quy tuyến tính xác định mức độ tốt khi có một hiệp sĩ trắng trên h4. Có thể không rõ ràng rằng nó tốt ở tất cả, nhưng nếu nó ở trên h4 thì nó đã không bị bắt, điều này có thể vượt xa các cân nhắc khác. Hồi quy tuyến tính có thể phục hồi các giá trị thô của các mảnh, và tốt hơn là đặt các mảnh của bạn về phía giữa bảng và về phía bảng của đối thủ. Hồi quy tuyến tính không thể định giá các kết hợp, chẳng hạn như nữ hoàng của bạn trên b2 đột nhiên có giá trị hơn nếu vua đối lập ở trên a1.
Một mạng lưới thần kinh có thể có các nút ẩn cho các khái niệm, chẳng hạn như "lợi thế vật chất", "an toàn của vua đen", "kiểm soát trung tâm", "cả hai tân binh trên tập tin d", "cầm đồ nữ hoàng bị cô lập" hoặc "giám mục di động. " Một số trong số này có thể được ước tính chỉ từ các đầu vào bảng, trong khi những cái khác có thể phải ở trong một lớp ẩn thứ hai hoặc sau đó. Mạng lưới thần kinh có thể sử dụng chúng làm đầu vào cho việc đánh giá cuối cùng của vị trí. Những khái niệm này giúp một chuyên gia đánh giá một vị trí, do đó, một mạng lưới thần kinh sẽ có khả năng đánh giá chính xác hơn so với hồi quy tuyến tính. Tuy nhiên, cần nhiều công việc hơn để tạo mạng lưới thần kinh vì bạn phải chọn cấu trúc của nó và nó có nhiều tham số hơn để đào tạo.