Như các ý kiến cho câu hỏi của bạn chỉ ra, có rất nhiều người làm việc để tìm kiếm một cái gì đó tốt hơn. Mặc dù tôi muốn trả lời câu hỏi này bằng cách mở rộng nhận xét để lại bởi @josh
Tất cả các mô hình đều sai nhưng một số hữu ích (Wiki)
Tuyên bố trên là một sự thật chung được sử dụng để mô tả bản chất của các mô hình thống kê. Sử dụng dữ liệu mà chúng tôi có sẵn, chúng tôi có thể tạo các mô hình cho phép chúng tôi thực hiện những việc hữu ích như xấp xỉ giá trị dự đoán.
Lấy ví dụ Hồi quy tuyến tính
Sử dụng một số quan sát, chúng ta có thể điều chỉnh một mô hình để cung cấp cho chúng ta một giá trị gần đúng cho một biến phụ thuộc với bất kỳ giá trị nào cho (các) biến độc lập.
Burnham, KP; Anderson, DR (2002), Lựa chọn mô hình và Đa phương thức> Suy luận: Phương pháp tiếp cận lý thuyết thông tin thực tế (tái bản lần 2):
"Một mô hình là sự đơn giản hóa hoặc gần đúng của thực tế và do đó sẽ không phản ánh tất cả thực tế. ... Box lưu ý rằng tất cả các mô hình đều sai, nhưng một số mô hình là hữu ích. được xếp hạng từ rất hữu ích, hữu ích, đến phần nào hữu ích, cuối cùng, về cơ bản là vô dụng. "
Các sai lệch so với mô hình của chúng tôi (như có thể thấy trong hình trên) xuất hiện ngẫu nhiên, một số quan sát ở dưới đường kẻ và một số ở trên, nhưng đường hồi quy của chúng tôi cho thấy mối tương quan chung. Trong khi độ lệch trong mô hình của chúng tôi xuất hiện ngẫu nhiên, trong các tình huống thực tế sẽ có các yếu tố khác gây ra sự sai lệch này. Ví dụ, hãy tưởng tượng xem những chiếc ô tô khi chúng lái xe qua ngã ba, nơi chúng phải rẽ trái hoặc phải để tiếp tục, những chiếc xe không có mô hình cụ thể. Trong khi chúng ta có thể nói rằng hướng xe ô tô rẽ là hoàn toàn ngẫu nhiên, liệu mọi lái xe có đến ngã ba và tại thời điểm đó đưa ra quyết định ngẫu nhiên về hướng rẽ nào? Trong thực tế, có lẽ họ đang hướng đến một nơi cụ thể vì một lý do cụ thể và không cố gắng dừng mỗi chiếc xe để hỏi họ về lý do của họ, chúng tôi chỉ có thể mô tả hành động của họ là ngẫu nhiên.
Trường hợp chúng ta có thể điều chỉnh một mô hình với độ lệch tối thiểu, làm thế nào chắc chắn chúng ta có thể là một biến số không xác định, không được chú ý hoặc không thể đo lường được tại một số điểm sẽ ném mô hình của chúng ta? Có phải cánh của một con bướm ở Brazil đã tạo ra một cơn lốc xoáy ở Texas?
Vấn đề với việc sử dụng các mô hình Tuyến tính và SVN mà bạn đề cập một mình là chúng tôi phần nào được yêu cầu phải quan sát thủ công các biến của chúng tôi và cách chúng biến chúng ảnh hưởng lẫn nhau. Sau đó chúng ta cần quyết định biến nào là quan trọng và viết một thuật toán dành riêng cho nhiệm vụ. Điều này có thể đơn giản nếu chúng ta chỉ có một vài biến, nhưng nếu chúng ta có hàng ngàn thì sao? Điều gì sẽ xảy ra nếu chúng ta muốn tạo ra một mô hình nhận dạng hình ảnh tổng quát, liệu điều này có thể đạt được một cách thực tế với phương pháp này không?
Mạng học sâu và mạng nơ ron nhân tạo (ANN) có thể giúp chúng ta tạo ra các mô hình hữu ích cho các tập dữ liệu khổng lồ chứa một lượng lớn các biến (ví dụ: thư viện hình ảnh). Như bạn đã đề cập, có một số giải pháp không thể hiểu được có thể phù hợp với dữ liệu bằng ANN, nhưng con số này có thực sự khác biệt với số lượng giải pháp chúng ta sẽ cần để phát triển bản thân thông qua thử và sai không?
Việc áp dụng ANN thực hiện rất nhiều công việc cho chúng tôi, chúng tôi có thể chỉ định đầu vào và đầu ra mong muốn của mình (và điều chỉnh chúng sau để cải thiện) và để ANN tìm ra giải pháp. Đây là lý do tại sao ANN thường được mô tả là "hộp đen" . Từ một đầu vào nhất định, họ đưa ra một xấp xỉ, tuy nhiên (nói chung) các xấp xỉ này không bao gồm các chi tiết về cách chúng được xấp xỉ.
Và do đó, nó thực sự đi đến vấn đề mà bạn đang cố gắng giải quyết, vì vấn đề sẽ chỉ ra cách tiếp cận mô hình nào hữu ích hơn. Các mô hình không hoàn toàn chính xác và do đó luôn có yếu tố 'sai', tuy nhiên kết quả của bạn càng chính xác thì chúng càng hữu ích. Có nhiều chi tiết hơn trong các kết quả về cách thực hiện xấp xỉ cũng có thể hữu ích, tùy thuộc vào vấn đề, nó thậm chí có thể hữu ích hơn là tăng độ chính xác.
Ví dụ, nếu bạn đang tính điểm tín dụng của một người, sử dụng hồi quy và SVM cung cấp các tính toán có thể được khám phá tốt hơn. Có thể điều chỉnh trực tiếp mô hình và giải thích cho khách hàng về hiệu ứng của các biến độc lập riêng biệt đối với điểm số chung của chúng là rất hữu ích. Một ANN có thể hỗ trợ xử lý số lượng biến lớn hơn để đạt được điểm chính xác hơn, nhưng liệu độ chính xác này có hữu ích hơn không?