"Biến giả" và "biến chỉ báo" là các thuật ngữ được sử dụng thường xuyên để mô tả tư cách thành viên trong danh mục có mã hóa 0/1; thường là 0: Không phải là thành viên của thể loại, 1: Thành viên của thể loại.
Vào ngày 26/11/2014, một tìm kiếm nhanh trên scholar.google.com (có dấu ngoặc kép kèm theo) cho thấy "biến giả" được sử dụng trong khoảng 318.000 bài viết và "biến chỉ báo" được sử dụng trong khoảng 112.000 bài viết. Thuật ngữ "biến giả" cũng có ý nghĩa trong toán học phi thống kê về " biến bị ràng buộc " có khả năng góp phần vào việc sử dụng nhiều hơn "biến giả" trong các bài viết được lập chỉ mục.
Các câu hỏi liên quan đến chủ đề của tôi:
- Có phải những thuật ngữ này luôn đồng nghĩa (trong số liệu thống kê)?
- Các thuật ngữ này có bao giờ được chấp nhận áp dụng cho các hình thức mã hóa phân loại khác (ví dụ mã hóa hiệu ứng , mã hóa Helmert, v.v. ) không?
- Những lý do thống kê hoặc kỷ luật là có để thích một thuật ngữ khác?
sex
.
male
, trong đó 1 có nghĩa là đúng (trong trường hợp này là nam) và 0 có nghĩa là sai (trong trường hợp này là nữ). Nếu tôi sử dụng tên biến sex
tôi sẽ phải tìm cách tôi mã hóa biến đó mỗi khi tôi trở lại tập dữ liệu đó.
male
với các giá trị1
hoặc0
. Nếu có một biến phân loại có nhiều hơn 2 loại sau đó được mở rộng thành các biến chỉ báo cho tư cách thành viên ở mỗi cấp, tôi sẽ sử dụng "biến giả" để mô tả tập hợp các biến chỉ báo đó.