Điều gì đã từng xảy ra với Logic Mờ?


10

Logic mờ dường như là một lĩnh vực nghiên cứu tích cực trong học máy và khai thác dữ liệu khi tôi còn đi học (đầu những năm 2000). Các hệ thống suy luận mờ, phương tiện c mờ, các phiên bản mờ của mạng lưới thần kinh khác nhau và các kiến ​​trúc máy vectơ hỗ trợ đều được giảng dạy trong các khóa học và được thảo luận trong các hội nghị.

Kể từ khi tôi bắt đầu chú ý đến ML một lần nữa (~ 2013), Fuzzy Logic dường như đã hoàn toàn rời khỏi bản đồ và sự vắng mặt của nó trong bối cảnh ML hiện tại là dễ thấy với tất cả sự cường điệu của AI.

Đây có phải là một trường hợp của một chủ đề đơn giản là lỗi thời, hay có một giới hạn cụ thể của logic mờ và suy luận mờ dẫn đến chủ đề bị các nhà nghiên cứu bỏ rơi?


Để làm rõ, dựa trên nhận xét của jbowman: Có một sự kiện hoặc phát hiện nào đó khiến FL bị lỗi mốt, ví dụ như mạng lưới thần kinh trong thập niên 60, khi chúng bị lỗi thời vì chứng minh rằng họ không thể giải quyết XOR ? Hay hệ thống Fuzzy vượt trội hơn so với mô hình cạnh tranh?


Không phải là một câu trả lời mà chỉ là một suy đoán: dường như rất gần với xác suất mà cuối cùng có lẽ các nhà nghiên cứu CS đã quyết định hợp nhất hai khái niệm này?
Vách đá AB

1
Phải thừa nhận rằng điều này sẽ dựa trên nhiều ý kiến ​​và có thể lạc đề, nhưng bây giờ bạn đã hỏi nó, bản thân tôi cũng tò mò.
jbowman

1
@jbowmanTôi không biết nếu nó nhất thiết phải dựa trên ý kiến. Có một câu trả lời khoa học khách quan về lý do tại sao NNets không còn hợp thời trong thập niên 60 (thất bại trong việc giải quyết XOR) - Tôi tự hỏi liệu điều gì đó tương tự đã xảy ra với FL.
Skander H.

1
Nói chung, nó vẫn còn khá nhiều trong phân tích não và lập bản đồ não, chỉ là mọi người không cần nhiều hoạt động logic, nhưng phân công mờ vẫn còn sống và đá.
Firebug

Câu trả lời:


3

Câu trả lời của tôi về mặt kỹ thuật phù hợp hơn với các tập mờ hơn là logic mờ, nhưng hai khái niệm này thực tế không thể tách rời. Tôi đã đào sâu vào các bài báo tạp chí học thuật về logic mờ vài năm trước để viết một loạt bài hướng dẫn về việc thực hiện các tập mờ trong SQL Server . Mặc dù tôi khó có thể được coi là một chuyên gia, tôi khá quen thuộc với tài liệu và sử dụng các kỹ thuật thường xuyên để giải quyết các vấn đề thực tế. Ấn tượng mạnh mẽ mà tôi thu được từ nghiên cứu được công bố là tiềm năng thực tế của các tập mờ vẫn chưa được khai thác, chủ yếu là do một nghiên cứu về hàng chục gia đình kỹ thuật khác có thể giải quyết các câu hỏi bổ sung.

Thị trường đông đúc của các ý tưởng trong Khoa học dữ liệu / Học máy, v.v.

Đã có sự tiến bộ nhanh chóng như vậy trong các máy Vector hỗ trợ, mạng lưới thần kinh, rừng ngẫu nhiên, v.v ... mà các chuyên gia, nhà phân tích, nhà khoa học dữ liệu, lập trình viên hoặc người tiêu dùng sản phẩm của họ không thể theo kịp tất cả. Trong loạt bài viết trên blog của tôi, tôi nói rất nhiều về cách phát triển thuật toán cho các tập mờ và logic nói chung là hơn 20 năm so với phần mềm có sẵn, nhưng có thể nói tương tự về nhiều lĩnh vực liên quan; Tôi đọc chuyên sâu về mạng lưới thần kinh và có thể nghĩ về điểm số của các kiến ​​trúc thần kinh đáng giá đã được phát triển từ nhiều thập kỷ trước nhưng chưa bao giờ được đưa vào thực tế, chứ đừng nói đến việc mã hóa trong phần mềm dễ dàng có sẵn. Điều đó đang được nói, logic mờ và các bộ đang gặp bất lợi kỳ lạ trong thị trường ý tưởng đông đúc này, chủ yếu là do biệt danh của chúng, đã gây tranh cãi trở lại khi Lofti A. Zadeh đặt ra. Điểm quan trọng của các kỹ thuật mờ chỉ đơn giản là ước tính một số loại dữ liệu có giá trị riêng biệt trên các thang đo liên tục, nhưng các thuật ngữ như "logic có giá trị liên tục gần đúng" và các bộ được phân loại chính xác là không bắt mắt. Zadeh thừa nhận rằng anh ta đã sử dụng thuật ngữ "mờ" một phần vì nó gây được sự chú ý, nhưng nhìn lại, nó có thể đã thu hút được sự chú ý sai.

Thuật ngữ "Fuzz" Backfires

Đối với một nhà khoa học dữ liệu, nhà phân tích hoặc lập trình viên, đó là một thuật ngữ có thể gợi lên sự rung cảm của "công nghệ tuyệt vời"; cho những người quan tâm đến AI / khai thác dữ liệu / v.v. vv chỉ trong chừng mực nó có thể giải quyết các vấn đề kinh doanh, "mờ" nghe có vẻ rắc rối không thực tế. Đối với một người quản lý công ty, bác sĩ liên quan đến nghiên cứu y tế, hoặc bất kỳ người tiêu dùng nào khác không biết, nó có thể gợi lên hình ảnh của thú nhồi bông, chương trình cảnh sát thập niên 70 hoặc một cái gì đó từ tủ lạnh của George Carlin. Luôn luôn có một sự căng thẳng trong công nghiệp giữa hai nhóm, với nhóm sau thường thống trị trước đây từ viết mã và thực hiện nghiên cứu chỉ vì sự tò mò trí tuệ hơn là lợi nhuận; trừ khi nhóm đầu tiên có thể giải thích tại sao các kỹ thuật mờ này có lợi nhuận thì sự thận trọng của nhóm đầu tiên sẽ ngăn cản việc áp dụng chúng.

Quản lý không chắc chắn & Gia đình của các ứng dụng mờ

Điểm của các kỹ thuật tập mờ là để loại bỏfuzz vốn đã có sẵn trong dữ liệu, dưới dạng các giá trị rời rạc không chính xác có thể được mô hình hóa tốt hơn trên các thang đo liên tục gần đúng, trái với sự hiểu lầm phổ biến rằng "fuzz" là thứ bạn thêm vào, giống như một chiếc bánh pizza đặc biệt. Sự khác biệt đó có thể đơn giản nhưng nó bao gồm rất nhiều ứng dụng tiềm năng, từ xử lý ngôn ngữ tự nhiên đến Lý thuyết quyết định đến kiểm soát các hệ thống phi tuyến. Xác suất đã không hấp thụ logic mờ như Cliff AB đề xuất chủ yếu vì nó chỉ là một tập hợp con nhỏ của các diễn giải có thể được gắn vào các giá trị mờ. Các hàm thành viên mờ khá đơn giản ở chỗ chúng chỉ phân loại một bản ghi thuộc về một bộ cụ thể bằng cách gán một hoặc nhiều giá trị liên tục, thường theo thang điểm từ 0 đến 1 (mặc dù đối với một số ứng dụng tôi ' đã thấy rằng -1 đến 1 có thể hữu ích hơn). Ý nghĩa chúng ta gán cho những con số đó tùy thuộc vào chúng ta, bởi vì chúng có thể biểu thị bất cứ điều gì chúng ta muốn, chẳng hạn như mức độ tin tưởng của Bayes, tin tưởng vào một quyết định cụ thể, phân phối khả năng, kích hoạt mạng lưới thần kinh, phương sai tỷ lệ, tương quan, v.v., v.v. không chỉ các giá trị PDF, EDF hoặc CDF. Tôi đi sâu vào chi tiết hơn nhiều trong loạt blog của mình và tạibài CV này , phần lớn được tạo ra bằng cách làm việc thông qua tài nguyên mờ yêu thích của tôi, George J. Klir, và Bộ mờ và Logic mờ của Bo Yuan: Lý thuyết và ứng dụng (1995). Họ đi sâu vào chi tiết hơn nhiều về cách lấy toàn bộ các chương trình của Ban quản lý không chắc chắn từ các bộ mờ.

Nếu logic và bộ mờ là một sản phẩm tiêu dùng, chúng ta có thể nói rằng nó không thành công do thiếu tiếp thị và truyền giáo sản phẩm, cộng với sự lựa chọn nghịch lý của một thương hiệu. Trong khi nghiên cứu về vấn đề này, tôi không thể nhớ lại việc chạy vào một bài báo tạp chí học thuật duy nhất đã cố gắng gỡ lỗi bất kỳ ứng dụng nào trong số này theo cách tương tự với bài báo khét tiếng của Minksy và Papert về tri giác. Ngày nay, có rất nhiều sự cạnh tranh trên thị trường ý tưởng để thu hút sự chú ý của các nhà phát triển, nhà lý thuyết, nhà khoa học dữ liệu và các sản phẩm tương tự cho các vấn đề tương tự, là tác dụng phụ tích cực của tiến bộ kỹ thuật nhanh chóng. Nhược điểm là có rất nhiều trái cây treo ở đây sẽ không bị hỏng, đặc biệt là trong lĩnh vực mô hình hóa dữ liệu nơi chúng được áp dụng nhiều nhất.


2

Lý do tại sao các ý tưởng logic mờ đã bỏ thời trang (trong ML) là không rõ ràng với tôi. Nó cũng có thể là một chút của nhiều lý do, có thể là kỹ thuật, xã hội học, v.v ... Một điều chắc chắn là toán học của ML trong những năm qua đã bị chi phối bởi xác suất / thống kê và tối ưu hóa, hai lĩnh vực trong đó logic mờ (hoặc ý tưởng được đưa ra từ tài liệu mờ) có thể điền vào, nhưng trong đó chúng thường mang lại nhiều câu trả lời hơn câu hỏi. Một ưu điểm khác của xác suất và tối ưu hóa là mặc dù có thể có các xu hướng / diễn giải khác nhau trong đó (ví dụ, Bayesian so với người thường xuyên), khung chính thức / toán học cơ bản khá ổn định đối với những điều đó (theo tôi, nó không rõ ràng đối với logic mờ hiểu theo nghĩa rộng).

  • Hüllermeier, E. (2015). Có học máy cần logic mờ?. Các bộ và hệ thống mờ, 281, 292-299.

Tôi nghĩ một trong những ý tưởng cơ bản của logic mờ, đó là mô hình hóa các khái niệm dần dần và cung cấp các công cụ lý luận (chủ yếu là mở rộng logic, nhưng không chỉ) liên quan đến nó, vẫn còn hiện diện trong một số ý tưởng ML, bao gồm cả những ý tưởng gần đây. Bạn chỉ cần xem xét cẩn thận vì nó khá hiếm. Hai ví dụ bao gồm:

  • Farnadi, G., Bach, SH, Moens, MF, Getoor, L., & De Cock, M. (2017). Định lượng mềm trong học tập quan hệ thống kê. Học máy, 106 (12), 1971-1991. (trong đó các tài liệu tham khảo bao gồm những cái logic mờ, bao gồm cả giấy bán nguyệt Zadeh)
  • Cheng, W., Rademaker, M., De Baets, B., & Hüllermeier, E. (2010, tháng 9). Dự đoán đơn đặt hàng một phần: xếp hạng với sự kiêng. Trong hội nghị chung châu Âu về học máy và khám phá kiến ​​thức trong cơ sở dữ liệu (trang 215-230). Springer, Berlin, Heidelberg.

Nhìn chung, để trả lời câu hỏi của bạn trên một nền tảng cá nhân hơn, tôi cảm thấy rằng không có nhận thức rõ ràng về những gì logic mờ có thể thực hiện (theo quan điểm gần đây của ML) mà xác suất không thể, và vì cái sau cũ hơn nhiều và phù hợp rõ ràng tốt hơn với khung ML nhìn thấy dữ liệu được phát ra từ một quần thể xác suất, việc đi theo xác suất và thống kê sẽ tự nhiên hơn so với logic mờ. Điều này cũng có nghĩa là nếu bạn muốn sử dụng logic mờ trong ML, bạn phải đưa ra một lý do thuyết phục, hợp lý để làm như vậy (ví dụ: sử dụng thực tế là chúng mở rộng logic bằng cách cung cấp các hàm khác biệt để bạn có thể đưa các quy tắc logic vào học sâu kỹ thuật).

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.