Sự khác biệt giữa đối tượng địa lý và nhãn là gì?


100

Tôi đang theo dõi một hướng dẫn về kiến ​​thức cơ bản về học máy và có đề cập rằng một cái gì đó có thể là một tính năng hoặc một nhãn .

Theo những gì tôi biết, một tính năng là một thuộc tính của dữ liệu đang được sử dụng. Tôi không thể hiểu nhãn là gì, tôi biết nghĩa của từ này, nhưng tôi muốn biết nó có nghĩa gì trong ngữ cảnh của máy học.


Các tính năng là các trường được sử dụng làm đầu vào và nhãn được sử dụng làm đầu ra. Ví dụ đơn giản, hãy xem xét cách dự đoán liệu một người có nên bán một chiếc ô tô hay không dựa trên số km xe chạy, năm, v.v. Có / không là nhãn trong khi số km và năm sẽ là các đặc điểm.
amcneil206 Ngày

Câu trả lời:


199

Tóm lại, tính năng là đầu vào; nhãn là đầu ra. Điều này áp dụng cho cả vấn đề phân loại và hồi quy.

Đối tượng địa lý là một cột dữ liệu trong bộ dữ liệu đầu vào của bạn. Ví dụ: nếu bạn đang cố gắng dự đoán loại vật nuôi mà ai đó sẽ chọn, các đặc điểm đầu vào của bạn có thể bao gồm tuổi, khu vực nhà, thu nhập gia đình, v.v. Nhãn là lựa chọn cuối cùng, chẳng hạn như chó, cá, kỳ nhông, đá, Vân vân.

Khi bạn đã đào tạo mô hình của mình, bạn sẽ cung cấp cho nó các tập hợp đầu vào mới chứa các tính năng đó; nó sẽ trả về "nhãn" dự đoán (loại vật nuôi) cho người đó.


1
Vì vậy, [tuổi, vùng quê, thu nhập gia đình] sẽ là "3 vectơ đặc trưng". Và trong Keras, mảng NumPy cho mạng LSTM của bạn sẽ là [mẫu, bước thời gian, 3]?
naisanza

1
@naisanza: đó chắc chắn là một khả năng. Tôi không quen thuộc với Keras, nhưng tổ chức cấp cao này chắc chắn có thể là bước khởi đầu cho việc triển khai hợp lệ.
Tỉa

Tính năng và biến có giống nhau không?
Debadatta

Tôi muốn nói rằng "nhãn" cũng phụ thuộc vào ngữ cảnh; ví dụ, để đào tạo một mô hình, bạn sẽ sử dụng dữ liệu "có nhãn". Trong trường hợp này, nhãn là sự thật cơ bản mà dữ liệu đầu ra của bạn được so sánh với.
N.Atanasov 29/07/18

ồ. câu trả lời tuyệt vời, cảm ơn bạn, điều này giải quyết rất nhiều câu hỏi còn tồn tại về không gian chủ đề này.
Andrew Ray

31

Đặc tính:

Trong tính năng Học máy có nghĩa là thuộc tính dữ liệu đào tạo của bạn. Hoặc bạn có thể nói tên cột trong tập dữ liệu đào tạo của mình.

Giả sử đây là tập dữ liệu đào tạo của bạn

Height   Sex   Age
 61.5     M     20
 55.5     F     30
 64.5     M     41
 55.5     F     51
 .     .     .
 .     .     .
 .     .     .
 .     .     .

Sau đó, đây Height, SexAgelà các tính năng.

nhãn:

Đầu ra bạn nhận được từ mô hình của mình sau khi đào tạo nó được gọi là nhãn.

Giả sử bạn đã cung cấp tập dữ liệu trên cho một số thuật toán và tạo mô hình để dự đoán giới tính là Nam hoặc Nữ, Trong mô hình trên, bạn chuyển các tính năng như age, heightv.v.

Vì vậy sau khi tính toán sẽ trả về giới tính là Nam hoặc Nữ. Đó được gọi là Nhãn


5

Đây là một cách tiếp cận trực quan hơn để giải thích khái niệm. Hãy tưởng tượng bạn muốn phân loại động vật được hiển thị trong một bức ảnh.

Các loại động vật có thể có là mèo hoặc chim. Trong trường hợp đó, nhãn sẽ là các liên kết lớp có thể có, ví dụ như mèo hoặc chim, mà thuật toán học máy của bạn sẽ dự đoán.

Các tính năng là mẫu, màu sắc, hình thức là một phần của hình ảnh của bạn, ví dụ như lông, lông vũ, hoặc giải thích cấp thấp hơn, giá trị pixel.

Chim Nhãn:
Đặc điểm chim : Lông vũ

Con mèo

Nhãn:
Đặc điểm của mèo : Furr


5

Hãy lấy một ví dụ mà chúng tôi muốn phát hiện bảng chữ cái bằng cách sử dụng ảnh viết tay. Chúng tôi cung cấp những hình ảnh mẫu này trong chương trình và chương trình sẽ phân loại những hình ảnh này trên cơ sở các tính năng mà chúng có được.

Ví dụ về một đặc điểm trong ngữ cảnh này là: chữ cái 'C'có thể được coi như một mặt lõm hướng về bên phải.

Một câu hỏi đặt ra bây giờ là làm thế nào để lưu trữ các tính năng này. Chúng ta cần đặt tên cho chúng. Đây là vai trò của nhãn xuất hiện. Một nhãn được cấp cho các tính năng đó để phân biệt chúng với các tính năng khác.

Do đó, chúng tôi có được nhãn dưới dạng đầu ra khi được cung cấp các tính năng làm đầu vào .

Các nhãn không liên quan đến việc học không có giám sát.


4

Điều kiện tiên quyết: Thống kê cơ bản và tiếp xúc với ML (Hồi quy tuyến tính)

Nó có thể được trả lời trong một câu -

Chúng giống nhau nhưng định nghĩa của chúng thay đổi theo nhu cầu.

Giải trình

Hãy để tôi giải thích tuyên bố của tôi. Giả sử rằng bạn có một tập dữ liệu, hãy xem xét mục đích này exercise.csv. Mỗi cột trong tập dữ liệu được gọi là các đặc trưng. Giới tính, Tuổi, Chiều cao, Nhịp tim, Body_temp và Calo có thể là một trong các cột khác nhau. Mỗi cột đại diện cho các tính năng hoặc thuộc tính riêng biệt.

tập thể dục.csv

User_ID  Gender Age  Height  Weight Duration    Heart_Rate  Body_Temp   Calories
14733363 male   68  190.0   94.0    29.0           105.0    40.8        231.0
14861698 female 20  166.0   60.0    14.0            94.0    40.3        66.0
11179863 male   69  179.0   79.0    5.0             88.0    38.7        26.0

Để củng cố sự hiểu biết và giải đáp thắc mắc, chúng ta hãy lấy hai bài toán khác nhau (trường hợp dự đoán).

CASE1: Trong trường hợp này, chúng tôi có thể cân nhắc sử dụng - Giới tính, Chiều cao và Cân nặng để dự đoán lượng calo bị đốt cháy trong quá trình tập luyện. Dự đoán đó (Y) Calo ở đây là một Nhãn . Calo là cột mà bạn muốn dự đoán bằng cách sử dụng các tính năng khác nhau như - x1: Giới tính, x2: Chiều cao và x3: Cân nặng .

CASE2: Trong trường hợp thứ hai ở đây, chúng tôi có thể muốn dự đoán Heart_rate bằng cách sử dụng Giới tính và Cân nặng làm đối tượng địa lý. Ở đây Heart_Rate là một Nhãn được dự đoán bằng cách sử dụng các tính năng - x1: Giới tính và x2: Cân nặng .

Khi bạn đã hiểu giải thích ở trên, bạn sẽ không thực sự nhầm lẫn với Nhãn và Tính năng nữa.


3

Một tính năng được giải thích ngắn gọn sẽ là đầu vào bạn đã cung cấp cho hệ thống và nhãn sẽ là đầu ra mà bạn mong đợi. Ví dụ, bạn đã cho ăn nhiều đặc điểm của một con chó như chiều cao, màu lông, v.v., vì vậy sau khi tính toán, nó sẽ trả về giống chó mà bạn muốn biết.


0

Giả sử bạn muốn dự đoán khí hậu thì các tính năng được cung cấp cho bạn sẽ là dữ liệu khí hậu lịch sử, thời tiết hiện tại, nhiệt độ, tốc độ gió, v.v. và nhãn sẽ là tháng. Sự kết hợp trên có thể giúp bạn đưa ra dự đoán.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.