Điều kiện tiên quyết: Thống kê cơ bản và tiếp xúc với ML (Hồi quy tuyến tính)
Nó có thể được trả lời trong một câu -
Chúng giống nhau nhưng định nghĩa của chúng thay đổi theo nhu cầu.
Giải trình
Hãy để tôi giải thích tuyên bố của tôi. Giả sử rằng bạn có một tập dữ liệu, hãy xem xét mục đích này exercise.csv
. Mỗi cột trong tập dữ liệu được gọi là các đặc trưng. Giới tính, Tuổi, Chiều cao, Nhịp tim, Body_temp và Calo có thể là một trong các cột khác nhau. Mỗi cột đại diện cho các tính năng hoặc thuộc tính riêng biệt.
tập thể dục.csv
User_ID Gender Age Height Weight Duration Heart_Rate Body_Temp Calories
14733363 male 68 190.0 94.0 29.0 105.0 40.8 231.0
14861698 female 20 166.0 60.0 14.0 94.0 40.3 66.0
11179863 male 69 179.0 79.0 5.0 88.0 38.7 26.0
Để củng cố sự hiểu biết và giải đáp thắc mắc, chúng ta hãy lấy hai bài toán khác nhau (trường hợp dự đoán).
CASE1: Trong trường hợp này, chúng tôi có thể cân nhắc sử dụng - Giới tính, Chiều cao và Cân nặng để dự đoán lượng calo bị đốt cháy trong quá trình tập luyện. Dự đoán đó (Y) Calo ở đây là một Nhãn . Calo là cột mà bạn muốn dự đoán bằng cách sử dụng các tính năng khác nhau như - x1: Giới tính, x2: Chiều cao và x3: Cân nặng .
CASE2: Trong trường hợp thứ hai ở đây, chúng tôi có thể muốn dự đoán Heart_rate bằng cách sử dụng Giới tính và Cân nặng làm đối tượng địa lý. Ở đây Heart_Rate là một Nhãn được dự đoán bằng cách sử dụng các tính năng - x1: Giới tính và x2: Cân nặng .
Khi bạn đã hiểu giải thích ở trên, bạn sẽ không thực sự nhầm lẫn với Nhãn và Tính năng nữa.