Tại sao quá mức xấu?


27

Tôi đã nghiên cứu rất nhiều điều này và họ nói rằng việc thực hiện quá mức các hành động trong học máy là điều tồi tệ, nhưng các tế bào thần kinh của chúng ta trở nên rất mạnh mẽ và tìm ra những hành động / giác quan tốt nhất mà chúng ta đi qua hoặc tránh, cộng với có thể bị giảm / tăng từ xấu / tốt bởi các tác nhân xấu hoặc tốt, có nghĩa là các hành động sẽ tăng cấp và kết thúc bằng các hành động tự tin siêu mạnh (phải), tốt nhất. Làm thế nào điều này thất bại? Nó sử dụng các kích hoạt ý nghĩa tích cực và tiêu cực để giảm / tăng lại các hành động nói từ 44pose. đến 22neg.


4
Câu hỏi này rộng hơn nhiều so với chỉ học máy, mạng nơ ron, v.v ... Nó áp dụng cho các ví dụ đơn giản như lắp một đa thức.
gerrit


7
@ FriendlyPerson44 Sau khi đọc lại câu hỏi của bạn, tôi nghĩ rằng có một sự mất kết nối lớn giữa tiêu đề của bạn và câu hỏi thực tế của bạn. Bạn dường như đang hỏi về những lỗ hổng trong AI của bạn ( điều này chỉ được giải thích một cách mơ hồ ) - trong khi mọi người đang trả lời " Tại sao lại quá tệ? "
DoubleDouble

3
@DoubleDouble Tôi đồng ý. Ngoài ra, mối liên hệ giữa học máy và tế bào thần kinh là không rõ ràng. Học máy không liên quan gì đến 'hành động giống như não', mô phỏng tế bào thần kinh hoặc mô phỏng trí thông minh. Có vẻ như có rất nhiều câu trả lời khác nhau có thể giúp OP vào thời điểm này.
Shaz

2
Bạn nên làm sắc nét câu hỏi của bạn và tiêu đề. Có thể: "Tại sao chúng ta phải bảo vệ một bộ não ảo chống lại quá mức trong khi bộ não của con người hoạt động tuyệt vời mà không có bất kỳ biện pháp đối phó chống lại quá mức?"
Falco

Câu trả lời:


44

Giải thích tốt nhất mà tôi đã nghe là đây:

Khi bạn đang học máy, bạn cho rằng bạn đang cố gắng học từ dữ liệu tuân theo một số phân phối xác suất.

Điều này có nghĩa là trong bất kỳ tập dữ liệu nào, do tính ngẫu nhiên, sẽ có một số nhiễu : dữ liệu sẽ thay đổi ngẫu nhiên.

Khi bạn tập luyện quá sức, bạn sẽ học được từ tiếng ồn của mình và đưa nó vào mô hình của bạn.

Sau đó, khi đến lúc đưa ra dự đoán từ dữ liệu khác, độ chính xác của bạn sẽ giảm: tiếng ồn xuất hiện trong mô hình của bạn, nhưng nó đặc trưng cho dữ liệu đào tạo của bạn, vì vậy nó làm tổn hại đến độ chính xác của mô hình của bạn. Mô hình của bạn không khái quát hóa: nó quá cụ thể đối với tập dữ liệu bạn đã chọn để đào tạo.


1
"Học từ tiếng ồn" nghe có vẻ mơ hồ đối với tôi. Chính xác thì chuyện gì xảy ra? Bạn có thể đưa ra một ví dụ không?
Raphael

ngay cả khi dữ liệu của bạn rất sạch sẽ và nằm ngoài các ngoại lệ (cả ngoại lệ tự nhiên và không tự nhiên) vẫn "quá mức" là một thực tiễn xấu và cần được loại bỏ khỏi mô hình của bạn. khi mô hình của bạn bị "quá mức", điều đó có nghĩa là mô hình của bạn không khái quát hóa kiến ​​thức ẩn trong dữ liệu và không thể dự đoán bất kỳ điểm dữ liệu nào khác. Đơn giản là khi bạn phù hợp với mô hình của bạn, bạn chỉ phù hợp với mô hình tập dữ liệu thử nghiệm / xe lửa của bạn.
Aboelnour

2
@Raphael Hệ thống bắt đầu thấy tiếng ồn trong tập huấn luyện là các tính năng. Nếu sau đó bạn chạy mạng trên dữ liệu thực, nơi thiếu tiếng ồn cụ thể đó, bạn sẽ có xác suất thấp hơn vì có các tính năng (= tiếng ồn được bao gồm) bị thiếu.
Drainke7707

2
@Raphael Ví dụ về điều gì: Tôi có một bộ sưu tập hình ảnh từ camera giao thông. Chúng ta hãy đào tạo một mạng lưới phát hiện xem có xe ô tô hay không. Sau một số khóa đào tạo, tôi có một bộ có ô tô và không có ô tô, thật tuyệt! Chúng ta hãy áp dụng mạng trên một bộ mới để phát hiện xem đường có trống không có người hay không, tại sao nó không phát hiện ra đường trống của tôi với xác suất cao? Nhìn lại bộ mẫu và tôi nhận thấy rằng trong mỗi bức ảnh đều có người ở trong nền của hình ảnh khi không có bất kỳ chiếc xe nào. Do trang bị quá nhiều mạng, nó đặt trọng tâm vào những người có mặt
Drainke7707

1
Hãy xem xét một hệ thống có tiếng ồn được thêm vào bằng cách lật đồng xu. Trên đầu, bạn thêm 1 vào giá trị và trên đuôi bạn thêm 0. Để làm cho kết quả rõ ràng, chúng tôi sẽ chọn một tập dữ liệu nhỏ vô lý gồm hai điểm: (2, 5) và (2.1, 8). Đồng xu lật đổ đầu cho điểm đầu tiên, đuôi thứ hai, giới thiệu tiếng ồn, tạo ra tập dữ liệu (3, 5), (2.1, 8). Bây giờ, mạng lưới thần kinh đang học từ một tập dữ liệu có vẻ như có một mối tương quan đáng kể giữa các giá trị x và y, mặc dù hầu như tất cả đều là nhiễu. Nếu sau đó bạn gửi 'mạng này ra dữ liệu thực, nó sẽ tạo ra rất nhiều kết quả sai
Cort Ammon - Phục hồi lại

39

Phiên bản ELI5

Về cơ bản, đây là cách tôi giải thích cho đứa con 6 tuổi của mình.

Khi đã có một cô gái tên Mel ( "Hiểu không? ML?" "Bố, con thật khập khiễng." ). Và mỗi ngày Mel chơi với một người bạn khác, và mỗi ngày cô chơi là một ngày nắng đẹp, tuyệt vời.

Mel chơi với Jordan vào thứ hai, Lily vào thứ ba, Mimi vào thứ tư, Olive vào thứ năm .. và sau đó vào thứ sáu Mel chơi với Brianna, và trời mưa. Đó là một cơn giông bão khủng khiếp!

Nhiều ngày hơn, nhiều bạn bè hơn! Mel chơi với Kwan vào thứ bảy, Grayson vào Chủ nhật, Asa vào thứ hai ... và sau đó vào thứ ba Mel chơi với Brooke và trời lại mưa, thậm chí còn tồi tệ hơn trước!

Bây giờ mẹ của Mel đã tạo ra tất cả các vở kịch, vì vậy đêm đó trong bữa tối, cô ấy bắt đầu kể cho Mel tất cả về những vở kịch mới mà cô ấy đã xếp hàng. "Luis vào thứ Tư, Ryan vào thứ năm, Jemini vào thứ sáu, Bianca vào thứ bảy -"

Mel nhíu mày.

Mẹ của Mel hỏi, "Có chuyện gì vậy, Mel, con không thích Bianca à?"

Mel trả lời: "Ồ, chắc chắn, cô ấy rất tuyệt, nhưng mỗi khi tôi chơi với một người bạn có tên bắt đầu bằng B thì trời mưa!"


Có gì sai với câu trả lời của Mel?

Vâng, nó có thể không mưa vào thứ bảy.

Chà, tôi không biết, ý tôi là, Brianna đến và trời mưa, Brooke đến và trời mưa ...

Vâng, tôi biết, nhưng mưa không phụ thuộc vào bạn bè của bạn.


10
Và với câu hỏi khác, đây là "học từ tiếng ồn" nghĩa là gì.
Kyle Hale

Để bình luận về mưa - Nhưng chúng tôi làm điều đó, sau đó chúng tôi tiếp tục làm việc theo cách đó và tìm hiểu thêm sau này.
Người thân thiện 44

13
@ FriendlyPerson44 Bạn đã đúng, mọi người mắc lỗi và làm những điều xấu như quá sức. Câu hỏi của bạn hỏi tại sao quá mức là xấu, không phải là mọi người có làm điều đó hay không.
Kyle Hale

1
Vấn đề này không chỉ áp dụng cho những robot học kém mà cả những người học kém.
Tomáš Zato - Phục hồi Monica

Tôi không hoàn toàn làm theo: Mưa không nên là một biến dự đoán ở nơi đầu tiên, nó có liên quan gì đến việc thừa chất lượng?
mucaho

14

NN


Nhưng các hành động quá mức của nó được liên kết với các giác quan cụ thể và chỉ khi nó nhìn thấy các giác quan tương tự một lần nữa, nó sẽ khớp với bộ nhớ và liên kết với các hành động này, nó sẽ không thực hiện chúng khi nhìn thấy những thứ khác. Khái quát hóa là hai điều - tất cả những hình ảnh cây này là cây, và sử dụng kiến ​​thức từ quá khứ để tìm ra điều mới mẻ này. Để AI của tôi giải quyết điều này, nó nhìn thấy một cái cây và nghe thấy "cái cây", và nó khớp với bộ nhớ và đưa nó ra phía trước, sau đó nó nhìn thấy những cái cây mới và tên của chúng và tất cả đều liên kết với các giác quan trong bộ nhớ mới nhất - hình ảnh cây đầu tiên & âm thanh. Tìm ra điều mới ít liên quan bằng knwldge là Actio mới
Người thân thiện 44

2
@ FriendlyPerson44 Trong học máy có giám sát, kết quả của khóa đào tạo không cần phải thay đổi thêm nữa. Đây là lúc "quá mức" phát huy tác dụng. Sẽ như thể cỗ máy đã học cách nhận ra một cái cây - đầu tiên là màu sắc, sau đó là hình dạng chung, sau đó là hình dạng cụ thể ( nơi cần dừng lại ), nhưng sau đó nó bắt đầu phân biệt cây bằng các mẫu ngẫu nhiên bổ sung mà nó chỉ tìm thấy trong bạn tập huấn luyện. Khi bạn cho nó nhìn thấy những bức ảnh ngẫu nhiên mới về cây, nó sẽ quyết định những cái đó không phải là cây. Tại thời điểm đó, trường hợp xấu nhất là nó đang được sử dụng và không ai giám sát nó!
DoubleDouble

Nhưng tôi nhận ra một cái cây bằng cách lưu hình ảnh cây và âm thanh "cây" và liên kết hai giác quan lại với nhau, và khi cây được nói nó khớp với những gì trong bộ nhớ và đưa trận đấu và bất kỳ liên kết nào đến nó trước bộ nhớ và sau đó hiển thị khác cây và được gọi tên mới những hình ảnh và âm thanh như những người đầu tiên học được. Cây cối không phải là tác nhân mặc dù, thực phẩm là vậy, nó sẽ không lưu hành động khi nhìn thấy màu sắc hoặc hoa văn. Tôi thực sự học được các hành động.
Người thân 44

1
@ FriendlyPerson44 Điều đó có liên quan gì đến việc tại sao quá mức là xấu?
DoubleDouble

9

Nói một cách đơn giản, sự phù hợp quá mức thường xảy ra khi tỷ lệ

nhập mô tả hình ảnh ở đây

là quá cao.

Hãy nghĩ về sự phù hợp quá mức như một tình huống trong đó mô hình của bạn học thuộc dữ liệu huấn luyện thay vì học những bức tranh lớn khiến nó không thể khái quát hóa dữ liệu thử nghiệm: điều này xảy ra khi mô hình quá phức tạp đối với kích thước của dữ liệu đào tạo, nghĩa là khi kích thước của dữ liệu đào tạo nhỏ so với độ phức tạp của mô hình.

Ví dụ:

  • nếu dữ liệu của bạn theo hai chiều, bạn có 10000 điểm trong tập huấn luyện và mô hình là một dòng, bạn có khả năng dưới -fit.
  • nếu dữ liệu của bạn có hai chiều, bạn có 10 điểm trong tập huấn luyện và mô hình là đa thức 100 độ, bạn có khả năng quá phù hợp.

nhập mô tả hình ảnh ở đây

Từ quan điểm lý thuyết, lượng dữ liệu bạn cần để đào tạo đúng mô hình của bạn là một câu hỏi quan trọng nhưng vẫn chưa được trả lời trong học máy. Một cách tiếp cận như vậy để trả lời câu hỏi này là kích thước VC . Một cái khác là sự đánh đổi sai lệch .

Từ quan điểm thực nghiệm, mọi người thường vẽ lỗi đào tạo và lỗi kiểm tra trên cùng một âm mưu và đảm bảo rằng họ không giảm lỗi đào tạo với chi phí của lỗi kiểm tra:

nhập mô tả hình ảnh ở đây

Tôi sẽ khuyên bạn nên xem khóa học về Machine Learning của Coursera , phần "10: Lời khuyên cho việc áp dụng Machine Learning".


1
Tôi thích dòng "học thuộc lòng" bởi vì con người có khả năng (và làm) làm điều này ở một mức độ nào đó. Hãy tưởng tượng làm một bài kiểm tra cực kỳ khó trong đó các câu hỏi và câu trả lời không bao giờ thay đổi nhưng bạn được cho biết câu trả lời khi bạn trả lời sai. Giả sử phương trình (2 + 2) rất khó, bạn nhận ra phương trình và nói '4' - nhưng sau đó (2 + 3) xuất hiện, nhưng bạn chưa học cách thêm, bạn vừa học cách nói '4' khi bạn có '2 + 2'
DoubleDouble

lời giải thích hay
Nikos M.

4

Tôi nghĩ chúng ta nên xem xét hai tình huống:

Đào tạo hữu hạn

Có một lượng dữ liệu hữu hạn mà chúng tôi sử dụng để đào tạo mô hình của chúng tôi. Sau đó chúng tôi muốn sử dụng mô hình.

Trong trường hợp này, nếu bạn quá phù hợp, bạn sẽ không tạo ra một mô hình của hiện tượng mang lại dữ liệu, nhưng bạn sẽ tạo một mô hình của tập dữ liệu của mình. Nếu bộ dữ liệu của bạn không hoàn hảo - tôi gặp khó khăn khi tưởng tượng một bộ dữ liệu hoàn hảo - mô hình của bạn sẽ không hoạt động tốt trong nhiều hoặc một số tình huống, tùy thuộc vào chất lượng dữ liệu bạn sử dụng để đào tạo. Vì vậy, quá mức sẽ dẫn đến chuyên môn hóa trên tập dữ liệu của bạn, khi bạn muốn khái quát hóa để mô hình hóa hiện tượng cơ bản.

Học hỏi không ngừng

Mô hình của chúng tôi sẽ nhận được dữ liệu mới mọi lúc và tiếp tục học hỏi. Có thể có một giai đoạn ban đầu của độ co giãn tăng để có được điểm bắt đầu chấp nhận được.

Trường hợp thứ hai này giống với cách mà bộ não con người được đào tạo. Khi một con người còn rất trẻ, những ví dụ mới về những gì bạn muốn học có ảnh hưởng rõ rệt hơn so với khi bạn già đi.

Trong trường hợp này, quá mức cung cấp một vấn đề hơi khác nhưng tương tự: các hệ thống thuộc trường hợp này thường là các hệ thống được dự kiến ​​sẽ thực hiện một chức năng trong khi học. Xem xét làm thế nào một con người không chỉ ngồi ở đâu đó trong khi dữ liệu mới được trình bày cho nó để học hỏi. Một con người đang tương tác và tồn tại trên thế giới mọi lúc.

Bạn có thể lập luận rằng vì dữ liệu tiếp tục đến, kết quả cuối cùng sẽ hoạt động tốt, nhưng trong khoảng thời gian này, những gì đã học cần phải được sử dụng! Quá mức sẽ cung cấp các hiệu ứng thời gian ngắn giống như trong trường hợp 1, làm cho mô hình của bạn hoạt động kém hơn. Nhưng bạn phụ thuộc vào hiệu suất của mô hình của bạn để hoạt động!

Hãy nhìn theo cách này, nếu bạn tập luyện quá sức, bạn có thể nhận ra rằng kẻ săn mồi đang cố gắng ăn thịt bạn trong tương lai sau nhiều ví dụ khác, nhưng khi kẻ săn mồi ăn thịt bạn thì đó là moot.


Câu trả lời tốt cho câu hỏi mà op ngụ ý: "Tại sao chúng ta phải ngăn chặn quá mức trong bộ não ảo, khi bộ não của chúng ta có vẻ hoạt động tốt, mà không có bất kỳ sự bù đắp quá mức nào" - vì con người được đào tạo, trong khi con người tự học.
Falco

3

Giả sử bạn muốn dạy máy tính xác định giữa các sản phẩm tốt và xấu và cung cấp cho nó bộ dữ liệu sau để tìm hiểu: sơ đồ với tập dữ liệu.  0 đến 50 là 0. 52 và 74 là 0. Giá trị còn lại từ 51 đến 100 là 1

0 có nghĩa là sản phẩm bị lỗi, 1 có nghĩa là nó ổn. Như bạn có thể thấy, có một mối tương quan mạnh mẽ giữa trục X và Y. Nếu giá trị đo được dưới hoặc bằng 50 thì rất có thể (~ 98%) rằng sản phẩm bị lỗi và ở trên nó rất giống (~ 98%) thì không sao. 52 và 74 là các ngoại lệ (có thể đo sai hoặc không đo các yếu tố đóng vai trò; còn được gọi là nhiễu). Giá trị đo có thể là độ dày, nhiệt độ, độ cứng hoặc thứ gì khác và đơn vị của nó không quan trọng trong ví dụ này Vì vậy, thuật toán chung sẽ là

if(I<=50)
    return faulty;
else
    return OK;

Nó sẽ có cơ hội 2% phân loại sai.

Một thuật toán quá mức sẽ là:

if(I<50)
    return faulty;
else if(I==52)
    return faulty;
else if(I==74)
    return faulty;
else
    return OK;

Vì vậy, thuật toán quá mức sẽ phân loại sai tất cả các sản phẩm đo 52 hoặc 74 là lỗi mặc dù có khả năng cao là chúng ổn khi được cung cấp bộ dữ liệu mới / được sử dụng trong sản xuất. Nó sẽ có cơ hội 3,92% phân loại sai. Đối với một người quan sát bên ngoài, việc phân loại sai này sẽ là lạ nhưng có thể giải thích được khi biết bộ dữ liệu gốc đã bị quá mức.

Đối với tập dữ liệu gốc, thuật toán quá mức là tốt nhất, đối với các tập dữ liệu mới, thuật toán chung (không quá mức) rất có thể là tốt nhất. Câu cuối cùng mô tả về ý nghĩa cơ bản của quá mức.


2

Trong khóa học AI ở trường đại học của tôi, người hướng dẫn của chúng tôi đã đưa ra một ví dụ tương tự như của Kyle Hale:

Một cô gái và mẹ cô đang ra ngoài đi bộ trong rừng cùng nhau thì bất ngờ một con hổ nhảy ra khỏi bàn chải và nuốt chửng mẹ cô. Ngày hôm sau cô đang đi bộ trong rừng với cha mình, và một lần nữa con hổ nhảy ra khỏi bàn chải. Bố cô la mắng cô chạy đi, nhưng cô trả lời "Ồ, không sao đâu bố, hổ chỉ ăn mẹ thôi."

Nhưng mặt khác:

Một cô gái và mẹ cô đang ra ngoài đi bộ trong rừng cùng nhau thì bất ngờ một con hổ nhảy ra khỏi bàn chải và nuốt chửng mẹ cô. Ngày hôm sau, cha cô thấy cô thu mình lại trong phòng và hỏi cô tại sao cô không ra ngoài chơi với bạn bè. Cô trả lời "Không! Nếu tôi đi ra ngoài một con hổ chắc chắn sẽ ăn tôi!"

Cả quá mức và thiếu cân nhắc đều có thể xấu, nhưng tôi sẽ nói rằng nó phụ thuộc vào bối cảnh của vấn đề mà bạn đang cố gắng giải quyết vấn đề nào làm bạn lo lắng hơn.



2

Một cái mà tôi đã thực sự gặp phải là một cái gì đó như thế này. Đầu tiên, tôi đo lường một cái gì đó mà tôi mong đợi tỷ lệ đầu vào / đầu ra là gần như tuyến tính. Đây là dữ liệu thô của tôi:

Input   Expected Result
1.045   0.268333453
2.095   0.435332226
3.14    0.671001483
4.19    0.870664399
5.235   1.073669373
6.285   1.305996464
7.33    1.476337174
8.38    1.741328368
9.425   1.879004941
10.47   2.040661489

Và đây là một biểu đồ:

nhập mô tả hình ảnh ở đây

Chắc chắn xuất hiện để phù hợp với kỳ vọng của tôi về dữ liệu tuyến tính. Nên khá đơn giản để suy ra phương trình, phải không? Vì vậy, bạn để chương trình của mình phân tích dữ liệu này một chút và cuối cùng nó báo cáo rằng nó đã tìm thấy phương trình đạt tất cả các điểm dữ liệu này, với độ chính xác như 99,99%! Tuyệt vời! Và phương trình đó là ... 9 giây (x) + x / 5. Trông như thế này: nhập mô tả hình ảnh ở đây

Chà, phương trình chắc chắn dự đoán dữ liệu đầu vào với độ chính xác gần như hoàn hảo, nhưng vì nó quá phù hợp với dữ liệu đầu vào, nên nó khá vô dụng để làm bất cứ điều gì khác.


Tôi nghĩ rằng quá mức là một câu hỏi về những gì bạn làm không chính xác một khi bạn có dữ liệu đầu vào. Ở đây không có gì bạn có thể làm; các yếu tố đầu vào không đầy đủ vì có sự nhấp nháy.
Emre

1
@Emre: Tôi không có ý định lấy mẫu, tôi dự định đầu vào / đầu ra là tuyến tính, nhưng sự phù hợp quá mức tạo ra một phương trình rõ ràng là phi tuyến tính. Tôi sẽ chỉnh sửa để làm rõ.
Vịt Mooing

1

Hãy xem bài viết này, nó giải thích quá mức và thiếu hụt khá tốt.

http://scikit-learn.org/urdy/auto_examples/model_selection/plot_underfitting_overfitting.html

Bài báo xem xét một ví dụ về dữ liệu tín hiệu từ hàm cosine. Mô hình quá mức dự đoán tín hiệu có chức năng phức tạp hơn một chút (điều này cũng dựa trên chức năng cosine). Tuy nhiên, mô hình quá mức kết luận điều này không dựa trên khái quát hóa mà dựa trên việc ghi nhớ nhiễu trong dữ liệu tín hiệu.


4
Nếu liên kết đó bị phá vỡ, câu trả lời của bạn sẽ là vô giá trị. Vui lòng cung cấp ít nhất một bản tóm tắt (tất nhiên là có ghi công) để câu trả lời có giá trị độc lập với liên kết đó.
Raphael

1

Không có kinh nghiệm về học máy và đánh giá từ câu trả lời của @ jmite ở đây là một hình dung về những gì tôi nghĩ rằng anh ấy có nghĩa là:

Biểu đồ ngẫu nhiên của hình bên phải gần đúng để trình diễn

Giả sử các thanh riêng lẻ trong biểu đồ trên là dữ liệu của bạn, trong đó bạn cố gắng tìm ra các xu hướng chung để áp dụng cho các bộ dữ liệu lớn hơn. Mục tiêu của bạn là tìm đường cong. Nếu bạn quá phù hợp - thay vì đường cong được hiển thị, bạn kết nối đỉnh của mỗi thanh riêng lẻ với nhau, sau đó áp dụng điều đó cho tập dữ liệu của bạn - và nhận được phản hồi nhọn không chính xác kỳ lạ khi tiếng ồn (biến thể từ dự kiến) bị phóng đại vào bộ dữ liệu thực hành của bạn.

Hy vọng tôi đã giúp phần nào ...


0

Quá sức trong cuộc sống thực:

Người da trắng thấy tin tức về người da đen phạm tội. Người da trắng nhìn thấy một câu chuyện tin tức khác về người da đen phạm tội. Người da trắng nhìn thấy một câu chuyện tin tức thứ ba về người da đen phạm tội. Người da trắng thấy tin tức về người da trắng mặc áo đỏ, cha mẹ giàu có và tiền sử bệnh tâm thần phạm tội. Người da trắng kết luận rằng tất cả những người da đen phạm tội, và chỉ những người da trắng mặc áo đỏ, cha mẹ giàu có và có tiền sử bệnh tâm thần phạm tội.

Nếu bạn muốn hiểu lý do tại sao loại quá mức này là "xấu", chỉ cần thay thế "màu đen" ở trên bằng một số thuộc tính mà ít nhiều xác định duy nhất bạn.


Sự rập khuôn là điều mà các cư dân gọi là quá mức.
Emre

3
Đó không phải là quá mức. Quá mức sẽ là hệ thống quyết định rằng những người duy nhất là tội phạm là những người có màu da, màu áo, thu nhập của cha mẹ và tiền sử bệnh tâm thần là một trong những tội phạm trong các báo cáo tin tức.
David Richerby

8
@Emre Không, rập khuôn là hoàn toàn ngược lại với quá mức. Việc rập khuôn đang đi đến kết luận mà bỏ qua hầu hết các thuộc tính của dữ liệu đào tạo. Quá mức đang đi đến kết luận rằng chỉ có dữ liệu mà mọi điểm trong dữ liệu đào tạo mô tả hoàn hảo một phần của điều bạn đang cố gắng nhận ra.
David Richerby

Người điều hành lưu ý: đã xóa các chủ đề ngoài chủ đề / ngoài ngữ cảnh. Để thảo luận chung, vui lòng truy cập Trò chuyện Khoa học Máy tính . Nếu bạn có câu hỏi về một chương trình cụ thể có thể hoặc không sử dụng quá mức một cách hữu ích, vui lòng đặt câu hỏi mới.
Gilles 'SO- ngừng trở thành ác quỷ'

2
@ArnabDatta Quá mức phù hợp với một mô hình quá phức tạp quá chính xác với dữ liệu đào tạo; rập khuôn là việc sử dụng một mô hình đơn giản hóa quá mức.
David Richerby

0

Bất kỳ dữ liệu nào bạn kiểm tra sẽ có các thuộc tính bạn muốn nó tìm hiểu và một số thuộc tính không liên quan mà bạn KHÔNG muốn nó học.

John 11 tuổi
Jack là 19 tuổi
Kate Kate 31 tuổi
Lana 39 tuổi

Phù hợp đúng cách: Độ tuổi xấp xỉ tuyến tính, trải qua ~ tuổi 20
Overfit: Hai người không thể cách nhau 10 năm (tính chất của tiếng ồn trong dữ liệu)
Underfit: 1/4 của tất cả mọi người là 19 (rập khuôn)


Chào mừng bạn Chúng tôi đã có rất nhiều ví dụ không chính thức nên tôi không chắc điều này sẽ bổ sung nhiều. Và có vẻ khó để làm cho ví dụ này chính thức hơn. Ví dụ, hàm tuyến tính bạn đề cập là gì? Đầu vào của hàm dường như là tên của người đó, không phải là số. Trong khi đó, "hai người không thể cách nhau mười năm" và "1/4 con người là 19" không phải là ví dụ về các chức năng được học từ dữ liệu.
David Richerby
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.