Tên: đầu tiên, có thể là tên đệm và họ.
Tôi tò mò về bao nhiêu thông tin bạn có thể khai thác từ một cái tên, sử dụng các bộ dữ liệu có sẵn công khai. Tôi biết rằng bạn có thể nhận được những điều sau với bất kỳ nơi nào có xác suất thấp (tùy thuộc vào đầu vào) bằng dữ liệu điều tra dân số Hoa Kỳ: 1) Giới tính. 2) Chủng tộc.
Chẳng hạn, Facebook đã sử dụng chính xác điều đó để tìm hiểu, với mức độ chính xác khá cao, phân phối chủng tộc người dùng trang web của họ (https://www.facebook.com/note.php?note_id=205925658858).
Những gì khác có thể được khai thác? Tôi không tìm kiếm bất cứ điều gì cụ thể, đây là một câu hỏi rất cởi mở để xoa dịu sự tò mò của tôi.
Ví dụ của tôi là cụ thể của Hoa Kỳ, vì vậy chúng tôi sẽ cho rằng tên đó là tên của một người nào đó ở Hoa Kỳ; nhưng, nếu ai đó biết về các bộ dữ liệu có sẵn công khai cho các quốc gia khác, tôi cũng sẽ cởi mở hơn với họ.
Tôi không chắc đây có phải là nơi thích hợp cho việc này không, nếu không, tôi đánh giá cao nếu ai đó có thể chỉ cho tôi một nơi thích hợp hơn.
Tôi hy vọng đây là một câu hỏi thú vị, và đây là nơi thích hợp!