Tên của toán tử lấy một vectơ phân loại và biến nó thành biểu diễn nhị phân sử dụng mã hóa một nóng là gì? Tôi tự hỏi vì tôi đang viết một bài báo khoa học và cần một cái tên thích hợp cho điều đó.
Tên của toán tử lấy một vectơ phân loại và biến nó thành biểu diễn nhị phân sử dụng mã hóa một nóng là gì? Tôi tự hỏi vì tôi đang viết một bài báo khoa học và cần một cái tên thích hợp cho điều đó.
Câu trả lời:
Các nhà thống kê gọi mã hóa một nóng là mã hóa giả . Như những người khác đã đề xuất (bao gồm Scortchi trong các bình luận), đây không phải là từ đồng nghĩa chính xác, nhưng đây là thuật ngữ thường được sử dụng cho các biến phân loại được mã hóa 0-1.
Xem thêm: "Biến giả" so với "biến chỉ báo" cho dữ liệu danh nghĩa / phân loại
Nó phụ thuộc vào đối tượng mục tiêu của bạn.
Như Tim đã nói, các nhà thống kê gọi nó là mã hóa giả, và đó là những gì tôi sẽ thấy khi mô tả một cái gì đó giống như mô hình hồi quy. "Các biến được mã hóa giả được đưa vào để điều chỉnh vị trí của cửa hàng." Tôi nghĩ rằng gọi nó là một mã hóa nóng có vẻ hơi lạ ở đây.
Tuy nhiên, như một Tim khác cũng đã nói, mã hóa một nóng là khá phổ biến trong máy học văn học. Nó ngụ ý một cách mờ nhạt sự tồn tại của các nút (như trong một mạng lưới thần kinh), các dây vật lý (trong một thiết bị) hoặc một cái gì đó tương tự, ít nhất là với tôi.
Chính thức, tôi đoán bạn đang áp dụng một tập hợp các hàm chỉ thị , nhưng điều đó có lẽ quá chính thức bên ngoài một bằng chứng.
Thuật ngữ này xuất phát từ kỹ thuật điện tử. Chỉ cần nghĩ rằng ai sẽ gọi 1 "nóng"? Chỉ những người làm việc với điện, nơi "nóng" hoặc "sống" có nghĩa là có tiềm năng điện trên dây . "Một nóng" đề cập đến thiết kế mạch trong đó mức tín hiệu điện rời rạc trên một dây sẽ được giải mã thành nóng / lạnh trên một bộ dây. Tôi cho rằng một số người học máy với nền EE đã tìm thấy sự hấp dẫn tương tự.
Trong kinh tế lượng và thống kê bạn có thể gặp phải dummy
hoặc indicator
các biến, khá giống nhau vì chúng được sử dụng để thể hiện các danh mục riêng biệt với các chỉ số riêng biệt của chúng. Có một sự khác biệt tinh tế mặc dù. Chẳng hạn, bạn tạo các hình nộm K-1 cho các loại K, vì loại cơ sở tương ứng với tất cả các hình nộm được đặt thành 0. Ngược lại, tôi nghĩ rằng trong một mã hóa nóng, bạn có dây K, trong đó loại cơ sở sẽ có dây riêng ( Biến đổi).
Tôi được đào tạo thống kê và gần đây đã nghe nói về "mã hóa một nóng" trong học máy / comp sci lit. Tôi thường chỉ gọi ma trận một góc là ma trận thiết kế / ma trận dữ liệu / khung thiết kế.
Trong khoa học vật lý và kỹ thuật, nó được gọi là đồng bằng Kronecker (tổng quát) .
Ở dạng đơn giản nhất, đồng bằng Kroneker được định nghĩa là started mặc dù điều này được khái quát hóa một cách tầm thường thành
Vì vậy, " " sẽ có xu hướng được đọc là hầu hết các tác giả sẽ có xu hướng cắt ngắn thành " ", nếu danh mục rõ ràng từ ngữ cảnh.
Đồng bằng Kronecker thực sự hữu ích trong Sigma / Pi / Einstein / v.v. ký hiệu vì nó cho phép các điều khoản được chỉ định có điều kiện.
Chỉ cần liên hệ điều này với các cấu trúc lập trình phổ biến, đồng bằng Kronecker condition?1:0
, ?:
là toán tử có điều kiện .
Là một lưu ý tiếp tuyến, tôi khuyến khích các tác giả từ bỏ để ủng hộ tương đương tổng quát, . Không có lợi thế cho ký hiệu thời trang cũ, trong khi ký hiệu tổng quát thì rõ ràng và mở rộng hơn.
Pattern Recognition và Machine Learning bởi Christopher ĐGM sử dụng thuật ngữ -of- đề án.K
Đây là một trích dẫn từ cuốn sách,
Biến nhị phân có thể được sử dụng để mô tả các đại lượng có thể lấy một trong hai giá trị có thể. Tuy nhiên, thông thường, chúng ta gặp phải các biến rời rạc có thể đảm nhận một trong những trạng thái loại trừ lẫn nhau có thể có củaMặc dù có nhiều cách khác nhau để biểu thị các biến như vậy, nhưng chúng ta sẽ sớm thấy rằng một biểu diễn đặc biệt thuận tiện là sơ đồ - trong đó biến được biểu thị bằng một vectơ -chiều trong đó một trong các các phần tử bằng và tất cả các phần tử còn lại bằng . Vì vậy, ví dụ nếu chúng ta có một biến có thể lấy1 K K x x k 1 0 K = 6 x 3 = 1 xtrạng thái và một quan sát cụ thể của biến xảy ra tương ứng với trạng thái trong đó , sau đó sẽ được biểu diễn bởi,