Những kiểu chữ này có thể dễ dàng nhầm lẫn nhiều như họ giải thích.
Ví dụ: dữ liệu nhị phân, như được giới thiệu trong nhiều văn bản giới thiệu hoặc khóa học, chắc chắn nghe có vẻ định tính: có hoặc không, sống sót hay chết, hiện tại hay vắng mặt, nam hay nữ, bất cứ điều gì. Nhưng điểm số hai khả năng 1 hoặc 0 và mọi thứ sau đó hoàn toàn định lượng. Việc tính điểm như vậy là cơ sở của tất cả các loại phân tích: tỷ lệ nữ chỉ là trung bình của một số 0 đối với nam và 1 đối với nữ. Nếu tôi gặp 7 nữ và 3 nam, tôi chỉ có thể trung bình 1, 1, 1, 1, 1, 1, 1, 0, 0, 0 để có tỷ lệ 0,7. Với phản hồi nhị phân, bạn có một con đường rộng mở sau đó để hồi quy logit và probit, v.v., tập trung vào sự thay đổi trong tỷ lệ, phân số hoặc xác suất sống sót, hoặc một cái gì đó tương tự, với bất kỳ điều gì khác kiểm soát hoặc ảnh hưởng đến nó. Không ai cần phải lo lắng bởi việc mã hóa là tùy ý. Tỷ lệ nam chỉ bằng 1 trừ tỷ lệ nữ
Hầu như điều tương tự cũng đúng khi dữ liệu danh nghĩa hoặc thứ tự đang được xem xét, vì bất kỳ phân tích nào về bản lề dữ liệu đó trước tiên, đếm số lượng rơi vào mỗi loại và sau đó bạn có thể định lượng như bạn muốn. Biểu đồ hình tròn và biểu đồ thanh, như lần đầu tiên bắt gặp trong những năm đầu tiên, cho thấy rằng, thật khó hiểu khi có bao nhiêu tài khoản bỏ lỡ điều này trong các giải thích.
Nói cách khác, bạn có thể phân loại dữ liệu thô hoặc dữ liệu gốc như báo cáo đầu tiên và như xuất hiện trong ô của bảng tính hoặc cơ sở dữ liệu. Nhưng hình thức ban đầu của nó không phải là bất biến. Hãy tưởng tượng một cái gì đó khắc nghiệt như một cái chết vì bối rối vì đọc quá nhiều sách giáo khoa hời hợt. Điều đó có thể được viết trên một chứng chỉ, nhưng phân tích thống kê không bao giờ dừng lại ở đó. Có một tổng hợp để đếm (có bao nhiêu cái chết như vậy trong một khu vực và một khoảng thời gian), giảm tỷ lệ (bao nhiêu so với dân số có nguy cơ), v.v.
Vì vậy, làm thế nào dữ liệu được mã hóa đầu tiên hiếm khi ức chế việc sử dụng chúng theo những cách khác và chuyển đổi sang các hình thức khác. Từ nguyên của dữ liệu ở đây tiết lộ: dịch tiếng Latin gốc theo nghĩa đen, chúng được trao cho bạn, nhưng không có quy tắc chống lại việc chuyển đổi chúng sang nhiều hình thức khác.