Theo truyền thống, suy luận thống kê được dạy trong bối cảnh mẫu xác suất và bản chất của lỗi lấy mẫu. Mô hình này là cơ sở để kiểm tra ý nghĩa. Tuy nhiên, có nhiều cách khác để mô hình hóa các lần khởi hành có hệ thống từ tình cờ và hóa ra các xét nghiệm tham số (dựa trên lấy mẫu) của chúng tôi có xu hướng gần đúng với các phương án này.
Các thử nghiệm tham số của các giả thuyết dựa trên lý thuyết lấy mẫu để đưa ra các ước tính về khả năng lỗi. Nếu một mẫu có kích thước nhất định được lấy từ dân số, kiến thức về bản chất hệ thống của lấy mẫu làm cho việc kiểm tra và khoảng tin cậy có ý nghĩa. Với dân số, lý thuyết lấy mẫu đơn giản là không liên quan và các bài kiểm tra không có ý nghĩa theo nghĩa truyền thống. Suy luận là vô ích, không có gì để suy luận, chỉ có điều ... chính tham số.
Một số người khắc phục điều này bằng cách kêu gọi các siêu dân số mà điều tra dân số hiện nay đại diện. Tôi thấy những lời kêu gọi này không thuyết phục - các xét nghiệm tham số được đặt ra trước khi lấy mẫu xác suất và các đặc điểm của nó. Một dân số tại một thời điểm nhất định có thể là một mẫu của dân số lớn hơn theo thời gian và địa điểm. Tuy nhiên, tôi không thấy bất kỳ cách nào mà người ta có thể lập luận một cách hợp pháp rằng đây là mẫu ngẫu nhiên (hay nói chung là bất kỳ dạng mẫu nào của xác suất). Không có mẫu xác suất, lý thuyết lấy mẫu và logic truyền thống của kiểm tra đơn giản là không áp dụng. Bạn cũng có thể kiểm tra trên cơ sở mẫu thuận tiện.
Rõ ràng, để chấp nhận thử nghiệm khi sử dụng dân số, chúng ta cần phân phối với cơ sở của các thử nghiệm đó trong quy trình lấy mẫu. Một cách để làm điều này là nhận ra mối liên hệ chặt chẽ giữa các thử nghiệm lý thuyết mẫu của chúng tôi - chẳng hạn như t, Z và F - và các thủ tục ngẫu nhiên. Các xét nghiệm ngẫu nhiên dựa trên mẫu trong tay. Nếu tôi thu thập dữ liệu về thu nhập của nam và nữ, mô hình xác suất và cơ sở cho các ước tính lỗi của chúng tôi được lặp lại phân bổ ngẫu nhiên của các giá trị dữ liệu thực tế. Tôi có thể so sánh sự khác biệt quan sát giữa các nhóm với một phân phối dựa trên sự ngẫu nhiên này. (Nhân tiện, chúng tôi làm điều này mọi lúc trong các thí nghiệm, trong đó, việc lấy mẫu ngẫu nhiên từ mô hình dân số hiếm khi thích hợp).
Bây giờ, nó chỉ ra rằng các thử nghiệm lý thuyết mẫu thường là xấp xỉ tốt các thử nghiệm ngẫu nhiên. Vì vậy, cuối cùng, tôi nghĩ rằng các thử nghiệm từ các quần thể là hữu ích và có ý nghĩa trong khuôn khổ này và có thể giúp phân biệt hệ thống với biến đổi cơ hội - giống như với các thử nghiệm dựa trên mẫu. Logic được sử dụng để đạt được một chút khác biệt, nhưng nó không ảnh hưởng nhiều đến ý nghĩa thực tế và việc sử dụng các bài kiểm tra. Tất nhiên, có thể tốt hơn nếu chỉ sử dụng các thử nghiệm ngẫu nhiên và hoán vị trực tiếp nếu chúng có sẵn dễ dàng với tất cả sức mạnh tính toán hiện đại của chúng tôi.