Cả hai thử nghiệm đều mô hình hóa mối quan hệ đáp ứng tuổi tác, nhưng họ làm như vậy theo những cách khác nhau. Chọn cái nào tùy thuộc vào cách bạn chọn để mô hình hóa mối quan hệ đó. Sự lựa chọn của bạn phải phụ thuộc vào một lý thuyết cơ bản, nếu có một lý thuyết; về loại thông tin bạn muốn trích xuất từ kết quả; và về cách mẫu được chọn. Câu trả lời này thảo luận về ba khía cạnh theo thứ tự.
Tôi sẽ mô tả kiểm tra t-test và hồi quy logistic bằng ngôn ngữ cho rằng bạn đang nghiên cứu một dân số được xác định rõ và muốn đưa ra các kết luận từ mẫu đến dân số này.
Để hỗ trợ bất kỳ loại suy luận thống kê nào, chúng ta phải giả sử mẫu là ngẫu nhiên.
Một thử nghiệm t giả định rằng những người trong mẫu trả lời "không" là một mẫu ngẫu nhiên đơn giản của tất cả những người không trả lời trong dân số và những người trong mẫu trả lời "có" là một mẫu ngẫu nhiên đơn giản của tất cả những người trả lời có trong dân số.
Một bài kiểm tra t đưa ra các giả định kỹ thuật bổ sung về sự phân bố của các lứa tuổi trong mỗi hai nhóm trong dân số. Các phiên bản khác nhau của thử nghiệm t tồn tại để xử lý các khả năng có thể xảy ra.
Hồi quy logistic giả định tất cả mọi người ở bất kỳ độ tuổi nào đều là một mẫu ngẫu nhiên đơn giản của những người trong độ tuổi đó trong dân số. Các nhóm tuổi riêng biệt có thể thể hiện tỷ lệ phản ứng "có" khác nhau. Các tỷ lệ này, khi được biểu thị bằng tỷ lệ cược log (chứ không phải là tỷ lệ thẳng), được giả định là có liên quan tuyến tính với tuổi (hoặc với một số chức năng xác định theo tuổi).
Hồi quy logistic dễ dàng được mở rộng để phù hợp với các mối quan hệ phi tuyến tính giữa tuổi tác và phản ứng. Một phần mở rộng như vậy có thể được sử dụng để đánh giá tính hợp lý của giả định tuyến tính ban đầu. Có thể thực hiện được với các bộ dữ liệu lớn, có đủ chi tiết để hiển thị phi tuyến tính, nhưng dường như không được sử dụng nhiều với các bộ dữ liệu nhỏ. Một nguyên tắc chung - các mô hình hồi quy nên có số lần quan sát gấp 10 lần so với tham số - cho thấy cần có hơn 20 quan sát để phát hiện phi tuyến (cần tham số thứ ba ngoài chức năng chặn và độ dốc của hàm tuyến tính ).
Một thử nghiệm t phát hiện xem độ tuổi trung bình có khác nhau giữa không và có - người trả lời trong dân số. Hồi quy logistic ước tính tỷ lệ đáp ứng thay đổi theo độ tuổi. Do đó, nó linh hoạt hơn và có khả năng cung cấp thông tin chi tiết hơn so với thử nghiệm t. Mặt khác, nó có xu hướng kém mạnh mẽ hơn bài kiểm tra t cho mục đích cơ bản là phát hiện sự khác biệt giữa các độ tuổi trung bình trong các nhóm.
Có thể cho các cặp thử nghiệm để thể hiện tất cả bốn kết hợp có ý nghĩa và không quan trọng. Hai trong số này là có vấn đề:
Kiểm tra t không đáng kể nhưng hồi quy logistic là. Khi các giả định của cả hai thử nghiệm đều hợp lý, thì kết quả như vậy thực tế là không thể, bởi vì thử nghiệm t không cố gắng phát hiện mối quan hệ cụ thể như được đưa ra bằng hồi quy logistic. Tuy nhiên, khi mối quan hệ đó đủ phi tuyến để khiến các đối tượng già nhất và trẻ nhất chia sẻ một ý kiến và các đối tượng trung niên khác, thì việc mở rộng hồi quy logistic sang các mối quan hệ phi tuyến có thể phát hiện và định lượng tình huống đó, mà không có thử nghiệm t nào có thể phát hiện được .
Bài kiểm tra t có ý nghĩa nhưng hồi quy logistic thì không, như trong câu hỏi. Điều này thường xảy ra, đặc biệt là khi có một nhóm người trả lời trẻ hơn, một nhóm người trả lời lớn tuổi và ít người ở giữa. Điều này có thể tạo ra một sự tách biệt lớn giữa tỷ lệ phản hồi của người trả lời không và có. Nó dễ dàng được phát hiện bằng thử nghiệm t. Tuy nhiên, hồi quy logistic sẽ có thông tin chi tiết tương đối ít về cách tốc độ phản hồi thực sự thay đổi theo tuổi hoặc nếu không nó sẽ có thông tin không thể kết luận: trường hợp "tách hoàn toàn" trong đó tất cả người già phản ứng theo một cách và tất cả những người trẻ tuổi khác theo cách khác-- nhưng trong trường hợp đó, cả hai thử nghiệm thường có giá trị p rất thấp.
Lưu ý rằng thiết kế thử nghiệm có thể làm mất hiệu lực một số giả định thử nghiệm. Chẳng hạn, nếu bạn chọn người theo độ tuổi của họ trong thiết kế phân tầng, thì giả định của bài kiểm tra t (rằng mỗi nhóm phản ánh một mẫu tuổi ngẫu nhiên đơn giản) sẽ trở thành nghi vấn. Thiết kế này sẽ đề nghị dựa vào hồi quy logistic. Nếu thay vào đó, bạn có hai nhóm, một trong số những người không trả lời và một trong số những người trả lời có, và được chọn ngẫu nhiên từ những người đó để xác định tuổi của họ, thì các giả định lấy mẫu của hồi quy logistic sẽ bị nghi ngờ trong khi những người kiểm tra t sẽ giữ. Thiết kế đó sẽ đề nghị sử dụng một số hình thức kiểm tra t.
(Thiết kế thứ hai có vẻ ngớ ngẩn ở đây, nhưng trong trường hợp "tuổi" được thay thế bằng một số đặc điểm khó khăn, tốn kém hoặc mất thời gian để đo lường nó có thể hấp dẫn.)