Có một lớp người trong ImageNet? Có lớp học nào liên quan đến con người không?


14

Nếu tôi nhìn vào một trong nhiều nguồn cho các lớp Imagenet trên Internet, tôi không thể tìm thấy một lớp nào liên quan đến con người (và không, người thu hoạch không phải là người thu hoạch, nhưng đó là những gì tôi biết với tư cách là một ông bố dài, một loại nhện :-). Làm thế nào là có thể? Tôi sẽ có ít nhất mong đợi một personlớp, và thậm chí một cái gì đó cụ thể hơn như man, woman, toddler, vv Không có gì của phân loại. Tại sao? Có phải Fei-Fei Li và nhóm của cô đã đưa ra một lựa chọn tỉnh táo để không có hình ảnh người trong cơ sở dữ liệu? Tôi đang nhìn vào tập tin sai? Vì mục đích của câu hỏi, chúng tôi có thể xem xét các ImageNetphiên bản từ năm 2014 trở đi.

Câu trả lời:


7

Bạn cũng có thể xem ở đây cho các nhãn trong hình ảnh. Tôi đoán bạn đúng, không có nhãn cho con người trong tập dữ liệu nhưng có một cái gì đó cần chú ý. Có những nhãn trong tưởng tượng như cao bồi hoặc một số mũ cụ thể và những thứ liên quan khác đến con người như áo sơ mi và áo phông. Bạn có thể xem tại đây và cũng ở đây. Trong liên kết sau Yosinski et al, đã cố gắng chỉ ra rằng AlexNet nổi tiếng đã học cách nhận diện khuôn mặt người mặc dù không có nhãn là khuôn mặt người trong tập dữ liệu của hình ảnh. Trong bài báo của mình, họ đã điều tra rằng các mạng thần kinh Convolutional có thể cố gắng học những thứ được phân phối giữa các lớp hoặc có thể không và chúng có thể không có nhãn đặc biệt trong dữ liệu đào tạo. Ví dụ, khuôn mặt của mèo và người có thể được nhắc đến. Hơn nữa, như bạn có thể thấy ở đây có lẽ mục tiêu là học thuộc tính trong các bộ dữ liệu quy mô lớn , như được trích dẫn trong dòng cuối cùng của trang, làm tài liệu tham khảo.


Tôi thích câu trả lời, nhưng tôi không hiểu câu cuối cùng của bạn. Bạn có ý nghĩa gì khi học thuộc tính, nó khác (nếu nó khác) với phân loại hình ảnh như thế nào và điều này có liên quan đến câu hỏi của tôi (có personcác lớp trong ImageNet) không?
DeltaIV

@DeltaIV Ý tôi là trong liên kết cuối cùng mà tôi đã cung cấp, có một tài liệu tham khảo mà trong công việc đó, họ thảo luận về vấn đề này. Những gì tôi nói giống như khuôn mặt học tập, không phải là nhãn hiệu nhưng có thể cần thiết để hiểu áo phông.
Truyền thông

Ok, các NN học các tính năng trông giống như khuôn mặt vì chúng giúp nhận biết (hoặc phân biệt giữa các nhãn). Vâng, tôi mong đợi điều đó. Cảm ơn
DeltaIV

@DeltaIV Tôi đoán đây có thể là những gì chúng ta gọi là học tập
Truyền thông

2
Tôi nghĩ rằng học tập cho các mạng lưới thần kinh có rất ít liên quan đến quá trình học tập của con người. Xem những ảo giác này . Một lần nữa, cùng một ý tưởng rằng những hình ảnh được tối ưu hóa này sẽ cho thấy những gì Mạng nơ-ron đã học được, rất thiếu sót và dựa trên sự hiểu lầm về phân phối xác suất chiều cao là gì. Chủ đề rất tế nhị: câu hỏi của tôi đã sơ đẳng hơn nhiều.
DeltaIV

6

Tôi tìm thấy lớp 7846 (name = "n00007846") dành cho người. Để truy cập vào mô tả lớp, hãy đọc http://image-net.org/doad-API . Thậm chí tốt hơn, các tệp văn bản sau chứa mọi thứ bạn cần để hiểu các lớp trong tập dữ liệu ImageNet (class = WordNet ID):

n00007846 ánh xạ tới người, cá nhân, ai đó, ai đó, phàm nhân, linh hồn . Độ bóng tương ứng là: một con người; "Có quá nhiều cho một người làm" .


Bạn có thể liên kết đến một nguồn? Điều đó sẽ hữu ích cho những người dùng khác.
Elias Stroundle

Các mô hình Imagenet dường như được đánh giá thấp trên con người của các nền tảng khác nhau. Trong dữ liệu của tôi có những người mặc trang phục chạy bộ và họ chủ yếu được xác định là bóng bầu dục và bóng chuyền.
levesque

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.