Sự khác biệt giữa hồi quy logistic và mạng lưới thần kinh là gì?


32

Làm thế nào để chúng tôi giải thích sự khác biệt giữa hồi quy logistic và mạng lưới thần kinh với một đối tượng không có nền tảng về thống kê?


7
Bất cứ ai không có nền tảng về thống kê thực sự muốn biết? Và, điều gì sẽ tạo nên một lời giải thích chấp nhận được về sự khác biệt? Có lẽ là một phép ẩn dụ. Chắc chắn không có bất kỳ câu trả lời nào dưới đây (cho đến nay), tất cả đều hoàn toàn bỏ lỡ yêu cầu "không có nền tảng".
rolando2

3
Hỏi: "Làm thế nào để chúng tôi giải thích sự khác biệt giữa hồi quy logistic và mạng lưới thần kinh với một đối tượng không có nền tảng về thống kê?" A: Đầu tiên bạn phải cung cấp cho họ một nền tảng về thống kê.
Firebug

2
Tôi thấy không có lý do này không nên mở. Chúng tôi không cần phải "giải thích ... không có nền tảng về thống kê" theo nghĩa đen. Người ta thường yêu cầu những lời giải thích sẽ hoạt động cho 'một đứa trẻ 5 tuổi' hoặc 'bà của bạn'. Đây chỉ là những cách thông tục để yêu cầu các câu trả lời kỹ thuật không (hoặc ít nhất là ít hơn ). Nói một cách rõ ràng hơn, các câu trả lời luôn tìm cách thỏa mãn nhiều ràng buộc đồng thời, chẳng hạn như độ chính xác & ngắn gọn; ở đây chúng tôi thêm tối thiểu hóa như thế nào là kỹ thuật. Không có lý do gì chúng ta không thể có một câu hỏi tìm kiếm một lời giải thích kỹ thuật ít hơn về sự khác biệt của b & t LR & ANN.
gung - Phục hồi Monica

2
@mbq Thật buồn cười là vào tháng 11 năm 2012, có thể mô tả các mạng thần kinh là lỗi thời.
littleO

2
@littleO Điều này khá nhiều vẫn đứng; so sánh NNs18 với NNs12 và bạn sẽ thấy sự tiến bộ đến từ việc loại bỏ sự tương đồng với mạng thực tế và tế bào thần kinh thực tế, thay vào đó đi sâu hơn vào các hoạt động đại số với tối ưu hóa ngẫu nhiên. Nhưng chắc chắn, rõ ràng nhãn hiệu NN đã chứng minh mạnh mẽ đến mức nó sẽ tồn tại lâu dài và thịnh vượng, bất kể ý nghĩa của nó là gì.

Câu trả lời:


27

Tôi cho rằng bạn đang nghĩ về những gì đã từng, và có lẽ vẫn được gọi là "tri giác đa lớp" trong câu hỏi của bạn về mạng lưới thần kinh. Nếu vậy thì tôi sẽ giải thích toàn bộ sự linh hoạt về hình thức của ranh giới quyết định như là một hàm của các biến giải thích. Đặc biệt, đối với đối tượng này, tôi sẽ không đề cập đến các chức năng liên kết / tỷ lệ cược đăng nhập, v.v. Chỉ cần lưu ý rằng xác suất của một sự kiện đang được dự đoán dựa trên một số quan sát.

Đây là một chuỗi có thể:

  • Hãy chắc chắn rằng họ biết xác suất dự đoán là gì, nói theo khái niệm. Hiển thị nó như là một hàm của một biến trong ngữ cảnh của một số dữ liệu quen thuộc. Giải thích bối cảnh quyết định sẽ được chia sẻ bằng hồi quy logistic và mạng lưới thần kinh.
  • Bắt đầu với hồi quy logistic. Nói rằng đó là trường hợp tuyến tính nhưng cho thấy tính tuyến tính của ranh giới quyết định kết quả bằng cách sử dụng biểu đồ nhiệt hoặc đường viền của xác suất đầu ra với hai biến giải thích.
  • Lưu ý rằng hai lớp có thể không được phân tách rõ ràng bởi ranh giới mà chúng nhìn thấy và thúc đẩy một mô hình linh hoạt hơn để tạo ranh giới cong hơn. Nếu cần thiết cho thấy một số dữ liệu sẽ được phân biệt theo cách này. (Đây là lý do tại sao bạn bắt đầu với 2 biến)
  • Lưu ý rằng bạn có thể bắt đầu làm phức tạp mô hình tuyến tính ban đầu bằng các thuật ngữ bổ sung, ví dụ như hình vuông hoặc các phép biến đổi khác và có thể hiển thị các ranh giới mà các mô hình này tạo ra.
  • Nhưng sau đó loại bỏ chúng, quan sát rằng bạn không biết trước dạng hàm nên là gì và bạn muốn tìm hiểu nó từ dữ liệu. Ngay khi họ nhiệt tình về điều này, hãy lưu ý sự bất khả thi của điều này trong tính tổng quát hoàn toàn và đề nghị rằng bạn rất vui khi cho rằng nó ít nhất phải là 'trơn tru' thay vì 'nhảm nhí', nhưng mặt khác được xác định bởi dữ liệu. (Khẳng định rằng có lẽ họ đã nghĩ đến những ranh giới trơn tru, giống như cách họ đã nói văn xuôi cả đời).
  • Hiển thị đầu ra của mô hình phụ gia tổng quát trong đó xác suất đầu ra là hàm chung của cặp biến ban đầu thay vì kết hợp phụ gia thực sự - đây chỉ nhằm mục đích trình diễn. Điều quan trọng, gọi nó là mượt mà hơn bởi vì đó là tốt đẹp và chung chung và mô tả mọi thứ bằng trực giác. Chứng minh ranh giới quyết định phi tuyến tính trong hình như trước đây.
  • Lưu ý rằng điều này (hiện tại ẩn danh) mượt mà hơn có một tham số độ mịn kiểm soát mức độ thực sự của nó, tham khảo điều này giống như một niềm tin trước đó về độ mượt của hàm biến các biến giải thích thành xác suất dự đoán. Có thể cho thấy hậu quả của các cài đặt độ mịn khác nhau trên ranh giới quyết định.
  • Bây giờ giới thiệu mạng lưới thần kinh như một sơ đồ. Chỉ ra rằng lớp thứ hai chỉ là mô hình hồi quy logistic, nhưng cũng chỉ ra sự biến đổi phi tuyến tính xảy ra trong các đơn vị ẩn. Nhắc nhở khán giả rằng đây chỉ là một chức năng khác từ đầu vào đến đầu ra sẽ không tuyến tính trong ranh giới quyết định của nó.
  • Lưu ý rằng nó có rất nhiều tham số và một số trong số chúng cần phải được ràng buộc để đưa ra một ranh giới quyết định trơn tru - giới thiệu lại ý tưởng về một số điều khiển độ mịn như một số (nói theo khái niệm) giữ các tham số gắn liền với nhau Giá trị cực đoan. Cũng lưu ý rằng càng có nhiều đơn vị ẩn, các loại hình chức năng khác nhau càng có thể nhận ra. Để duy trì trực giác, hãy nói về các đơn vị ẩn về tính linh hoạt và ràng buộc tham số về độ mượt mà (mặc dù sự chậm chạp về mặt toán học của đặc tính này)
  • Sau đó làm họ ngạc nhiên bằng cách tuyên bố vì bạn vẫn không biết biểu mẫu chức năng nên bạn muốn linh hoạt vô hạn bằng cách thêm vô số đơn vị ẩn. Hãy để những điều không thể thực tế của bồn rửa này trong một chút. Sau đó quan sát rằng giới hạn này có thể được thực hiện trong toán học, và hỏi (về mặt tu từ) một thứ như vậy sẽ như thế nào.
  • Trả lời rằng nó sẽ trở nên mượt mà hơn một lần nữa (một quá trình Gaussian, như nó xảy ra; Neal, 1996, nhưng chi tiết này không quan trọng), giống như quá trình họ đã thấy trước đây. Quan sát rằng có một lần nữa một đại lượng kiểm soát độ mịn nhưng không có thông số cụ thể nào khác (được tích hợp ngoài, cho những người quan tâm đến loại điều này).
  • Kết luận rằng các mạng thần kinh là đặc biệt, hoàn toàn hạn chế, việc triển khai các bộ làm mịn thông thường, là các phần mở rộng phi tuyến tính, không nhất thiết phải là phụ thuộc của mô hình hồi quy logistic. Sau đó, làm theo cách khác, kết luận rằng hồi quy logistic tương đương với mô hình mạng thần kinh hoặc mượt mà hơn với tham số làm mịn được đặt thành 'thêm cực mịn' tức là tuyến tính.

Ưu điểm của phương pháp này là bạn không cần phải thực sự hiểu bất kỳ chi tiết toán học nào để đưa ra ý tưởng chính xác. Trong thực tế, họ không cần phải hiểu hồi quy logistic hoặc mạng lưới thần kinh để hiểu những điểm tương đồng và khác biệt.

Nhược điểm của phương pháp này là bạn phải tạo ra rất nhiều hình ảnh, và mạnh mẽ chống lại sự cám dỗ để thả xuống đại số để giải thích mọi thứ.


14

Để tóm tắt đơn giản hơn:

Hồi quy logistic: Hình thức đơn giản nhất của Mạng thần kinh, dẫn đến ranh giới quyết định là một đường thẳng

nhập mô tả hình ảnh ở đây

Mạng nơ-ron: Một siêu bộ bao gồm hồi quy Logistic và các phân loại khác có thể tạo ra các ranh giới quyết định phức tạp hơn.

nhập mô tả hình ảnh ở đây

(lưu ý: Tôi đang đề cập đến hồi quy logistic "đơn giản", không có sự trợ giúp của các hạt nhân tích hợp)

(tham khảo: các khóa học deeplearning.ai của Andrew Ng, "Hồi quy logistic như một mạng thần kinh" và "Phân loại dữ liệu hai chiều với một lớp ẩn")


1
Từ tất cả các câu trả lời hiện tại tôi nghĩ rằng đây là cách thực tế nhất để giải thích các khái niệm cho một người không có nền tảng thống kê.
Firebug

1
Vì vậy, một phân loại hồi quy logistic logistic là một mạng lưới thần kinh? Điều đó làm cho rất nhiều ý nghĩa.
Bjorn Lindqvist

8

Tôi sẽ đặt câu hỏi theo nghĩa đen: Một người không có nền tảng về thống kê. Và tôi sẽ không cố gắng cung cấp cho người đó một nền tảng về thống kê. Chẳng hạn, giả sử bạn phải giải thích sự khác biệt với CEO của một công ty hoặc đại loại như thế.

Vì vậy: Hồi quy logistic là một công cụ để mô hình hóa một biến phân loại theo các biến khác. Nó cung cấp cho bạn các cách để tìm hiểu làm thế nào thay đổi trong từng biến "khác" ảnh hưởng đến tỷ lệ cược của các kết quả khác nhau trong biến đầu tiên. Đầu ra khá dễ để giải thích.

Mạng lưới thần kinh là một tập hợp các phương pháp để cho phép một máy tính cố gắng học hỏi từ các ví dụ theo cách mơ hồ giống như cách con người tìm hiểu về mọi thứ. Nó có thể dẫn đến các mô hình là các yếu tố dự đoán tốt, nhưng chúng thường mờ hơn nhiều so với các mô hình từ hồi quy logistic.


5
+1 Đây là một nỗ lực ban đầu tốt để vượt qua thách thức ban đầu là đưa ra một lời giải thích mà một giáo dân có thể hiểu được, nhưng vẫn rõ ràng và chính xác một cách hợp lý.
whuber

2
Bạn sẽ phải giải thích "phân loại", "biến", "tỷ lệ cược" là gì. Ngoài ra, Mạng nơ ron nhân tạo chỉ được lấy cảm hứng từ các mạng thần kinh thực sự. Bộ não của chúng ta không thể học bằng cách truyền lại như chúng ta biết. Vì vậy, yeah, nó chủ yếu là một thuật ngữ tuyệt vời cho một khái niệm tương đối đơn giản. Ngoài ra, hồi quy logistic là một dạng của mạng nơ ron, vì vậy cũng có.
Firebug

7

Tôi được dạy rằng bạn có thể nghĩ về các mạng thần kinh (với các hàm kích hoạt logistic) như là một trung bình trọng số của các hàm logit, với trọng số ước tính. Bằng cách chọn một số lượng lớn các bản ghi, bạn có thể phù hợp với bất kỳ hình thức chức năng. Có một số trực giác đồ họa trong bài viết trên blog Kinh tế lượng .


6

Các câu trả lời khác là tuyệt vời. Tôi chỉ đơn giản là thêm một số hình ảnh cho thấy bạn có thể nghĩ về hồi quy logistic và hồi quy logistic đa lớp (hay còn gọi là hồi quy logistic đa cực, hồi quy softmax, phân loại entropy tối đa) như một kiến ​​trúc đặc biệt của mạng lưới thần kinh.

Từ Sebastian Raschka, Đại học bang Michigan, trên KDnuggets :

nhập mô tả hình ảnh ở đây


Một vài minh họa cho hồi quy logistic đa lớp:

nhập mô tả hình ảnh ở đây

Một minh họa tương tự được lấy từ http://www.deeplearningbook.org/ chương 1:

nhập mô tả hình ảnh ở đây

Và một thông tin khác từ hướng dẫn của TensorFlow :

nhập mô tả hình ảnh ở đây

Ví dụ, trong Caffe , bạn sẽ thực hiện hồi quy logistic như sau :

nhập mô tả hình ảnh ở đây


2
Vì vậy, lan truyền ngược trên một mạng thần kinh như vậy sẽ tính các trọng số tương tự như hồi quy logistic?
Mitch

1
@ Mitch - Tôi có thể quá muộn để trò chơi đóng góp. Một điểm khác biệt chính là đối với một hồi quy logistic, người ta sử dụng mle để lấy các hệ số. Về bản chất đó là sự lựa chọn của một hàm lỗi hoặc mất cụ thể. Đối với một mạng lưới thần kinh, chức năng mất là một trong những lựa chọn. Vì vậy, với tổn thất chính xác fn (tôi nghĩ rằng trên đỉnh đầu của tôi, đó là tiêu chuẩn L ^ 2 tiêu chuẩn), đây là trường hợp.
aginensky

Vì vậy, hồi quy logistic có thể được xây dựng chính xác như ADALINE (mạng nơ ron một lớp sử dụng gốc gradient / stochastic), với sự khác biệt chính duy nhất là hàm kích hoạt được thay đổi thành sigmoid thay vì tuyến tính và hàm dự đoán thay đổi thành> = 0,5 với 0,1 nhãn thay vì> = 0 với -1,1 nhãn. Một sự khác biệt được ưu tiên mạnh mẽ, nhưng sự khác biệt tùy chọn là thay đổi hàm chi phí từ RSS sang hàm chi phí logistic vì kích hoạt sigmoid làm cho RSS không lồi để RSS có thể bị kẹt trong các minimas cục bộ.
Austin

5

Tôi sẽ sử dụng một ví dụ về một vấn đề phức tạp nhưng cụ thể mà khán giả hiểu được. Sử dụng các nút ẩn mà các diễn giải không được đào tạo, nhưng có ý nghĩa cụ thể.

Nếu bạn sử dụng các vị trí cờ vua (dự đoán liệu màu trắng sẽ giành chiến thắng), bạn có thể để các yếu tố đầu vào là một đại diện của bàn cờ (bỏ qua việc bạn có thể chiếm được lâu đài hay bắt được người đi đường hay thậm chí là di chuyển của nó), nói 64×12 đầu vào nhị phân cho biết liệu có một phần của mỗi loại trên mỗi hình vuông.

Hồi quy tuyến tính xác định mức độ tốt khi có một hiệp sĩ trắng trên h4. Có thể không rõ ràng rằng nó tốt ở tất cả, nhưng nếu nó ở trên h4 thì nó đã không bị bắt, điều này có thể vượt xa các cân nhắc khác. Hồi quy tuyến tính có thể phục hồi các giá trị thô của các mảnh, và tốt hơn là đặt các mảnh của bạn về phía giữa bảng và về phía bảng của đối thủ. Hồi quy tuyến tính không thể định giá các kết hợp, chẳng hạn như nữ hoàng của bạn trên b2 đột nhiên có giá trị hơn nếu vua đối lập ở trên a1.

Một mạng lưới thần kinh có thể có các nút ẩn cho các khái niệm, chẳng hạn như "lợi thế vật chất", "an toàn của vua đen", "kiểm soát trung tâm", "cả hai tân binh trên tập tin d", "cầm đồ nữ hoàng bị cô lập" hoặc "giám mục di động. " Một số trong số này có thể được ước tính chỉ từ các đầu vào bảng, trong khi những cái khác có thể phải ở trong một lớp ẩn thứ hai hoặc sau đó. Mạng lưới thần kinh có thể sử dụng chúng làm đầu vào cho việc đánh giá cuối cùng của vị trí. Những khái niệm này giúp một chuyên gia đánh giá một vị trí, do đó, một mạng lưới thần kinh sẽ có khả năng đánh giá chính xác hơn so với hồi quy tuyến tính. Tuy nhiên, cần nhiều công việc hơn để tạo mạng lưới thần kinh vì bạn phải chọn cấu trúc của nó và nó có nhiều tham số hơn để đào tạo.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.