Có bất kỳ lệnh Linux nào người ta có thể sử dụng để lấy mẫu tập hợp con của một tập tin không? Chẳng hạn, một tệp chứa một triệu dòng và chúng tôi muốn lấy mẫu ngẫu nhiên chỉ một nghìn dòng từ tệp đó.
Đối với ngẫu nhiên, tôi có nghĩa là mọi dòng đều có cùng xác suất được chọn và không có dòng nào được chọn là lặp đi lặp lại.
head
và tail
có thể chọn một tập hợp con của tệp nhưng không ngẫu nhiên. Tôi biết tôi luôn có thể viết một kịch bản python để làm như vậy nhưng chỉ cần tự hỏi là có một lệnh cho việc sử dụng này.