Tôi sẽ đặt nó đơn giản là thử nghiệm giả thuyết null thực sự chỉ là về giả thuyết null. Và nói chung, giả thuyết khống thường không phải là điều đáng quan tâm, và thậm chí có thể không phải là "hiện trạng" - đặc biệt là trong loại thử nghiệm giả thuyết hồi quy. Thông thường trong khoa học xã hội không có hiện trạng, vì vậy giả thuyết null có thể khá độc đoán. Điều này tạo ra sự khác biệt lớn cho phân tích, vì điểm khởi đầu không được xác định, vì vậy các nghiên cứu khác nhau đang bắt đầu với giả thuyết null khác nhau, rất có thể dựa trên bất kỳ dữ liệu nào họ có sẵn. So sánh điều này với một cái gì đó giống như định luật chuyển động của Newton - thật hợp lý khi coi đây là giả thuyết khống, và cố gắng tìm ra những lý thuyết tốt hơn từ điểm xuất phát này.
Ngoài ra, giá trị p không tính toán xác suất chính xác - chúng tôi không muốn biết về xác suất đuôi, trừ khi giả thuyết thay thế có nhiều khả năng khi bạn di chuyển xa hơn vào đuôi. Những gì bạn thực sự muốn là lý thuyết dự đoán những gì thực sự được nhìn thấy. Ví dụ: giả sử tôi dự đoán rằng có 50% cơ hội "tắm nhẹ" và đối thủ cạnh tranh của tôi dự đoán rằng có 75% cơ hội. Điều này hóa ra là chính xác, và chúng tôi quan sát một vòi hoa sen nhẹ. Bây giờ khi quyết định người thời tiết nào là chính xác, bạn không nên cho tín dụng bổ sung dự đoán của tôi vì cũng cho 40% cơ hội "giông bão" hoặc lấy tín dụng từ đối thủ cạnh tranh của tôi để cho "giông bão" có cơ hội 0%.
Một chút suy nghĩ về điều này sẽ cho bạn thấy rằng nó không phải là một lý thuyết nhất định phù hợp với dữ liệu đến mức nào, mà nhiều hơn về bất kỳ lời giải thích thay thế nào phù hợp với dữ liệu. Nếu bạn làm việc theo các yếu tố Bayes, bạn có thông tin trước , dữ liệu và một số giả thuyết , yếu tố bay được đưa ra bởi:IDH
BF=P(D|HI)P(D|H¯¯¯¯¯I)
Nếu dữ liệu là không thể được trao cho chứ là sai, sau đó và chúng ta trở nên nhất định . Giá trị p thường cung cấp cho bạn tử số (hoặc một số phép tính gần đúng / biến đổi của chúng). Nhưng cũng lưu ý rằng một giá trị p nhỏ chỉ tạo thành bằng chứng chống lại null nếu có một giả thuyết thay thế phù hợp với dữ liệu. Bạn có thể phát minh ra các tình huống trong đó giá trị p là thực sự cung cấp hỗ trợ cho giả thuyết null - nó thực sự phụ thuộc vào phương án thay thế là gì.HBF=∞H0.001
Có một ví dụ thực nghiệm nổi tiếng và dễ bị hiểu lầm về điều này khi một đồng xu được ném lần và số lượng đầu là - giảm một nửa. Mô hình null là và mô hình thay thế là và cho mô hình cận biên của (DU = đồng phục rời rạc). Giá trị p cho giả thuyết null rất nhỏ , vậy từ chối null và xuất bản phải không? Nhưng hãy nhìn vào yếu tố vịnh, được đưa ra bởi:104,490,00052,263,471y∼Bin(n,0.5)y|θ∼Bin(n,θ)θ∼U(0,1)p = 0,00015y∼BetaBin(n,1,1)∼DU(0,…,n)p=0.00015
BF=(ny)2−n1n+1=(n+1)!2ny!(n−y)!=11.90
Làm sao có thể? Yếu tố Bayes ủng hộ giả thuyết null bất chấp giá trị p nhỏ? Chà, nhìn vào giải pháp thay thế - nó đưa ra xác suất cho giá trị quan sát của - giải pháp thay thế không cung cấp một lời giải thích tốt cho các sự kiện - vì vậy null có nhiều khả năng, nhưng chỉ liên quan đến sự thay thế . Lưu ý rằng null chỉ làm tốt hơn một chút so với mức này - . Nhưng điều này vẫn tốt hơn so với giải pháp thay thế.1n+1=0.00000000960.00000011
Điều này đặc biệt đúng với ví dụ mà Gelman chỉ trích - thực sự chỉ có một giả thuyết được thử nghiệm và không có nhiều suy nghĩ đi vào a) những giải thích thay thế là gì (đặc biệt là gây nhiễu và hiệu ứng không được kiểm soát), b) bao nhiêu các lựa chọn thay thế được hỗ trợ bởi nghiên cứu trước đó và quan trọng nhất là c) họ dự đoán gì (nếu có) khác biệt đáng kể so với null?
Nhưng lưu ý rằng không được xác định và về cơ bản đại diện cho tất cả các giả thuyết khác phù hợp với thông tin trước đó. Cách duy nhất bạn thực sự có thể thực hiện kiểm tra giả thuyết đúng là bằng cách chỉ định một loạt các lựa chọn thay thế mà bạn sẽ so sánh. Và ngay cả khi bạn làm điều đó, giả sử bạn có , bạn chỉ có thể báo cáo về thực tế là dữ liệu hỗ trợ liên quan đến những gì bạn đã chỉ định. Nếu bạn bỏ qua giả thuyết quan trọng từ tập hợp các lựa chọn thay thế, bạn có thể mong đợi nhận được kết quả vô nghĩa. Ngoài ra, một sự thay thế nhất định có thể chứng minh là phù hợp hơn nhiều so với những cái khác, nhưng vẫn không có khả năng. Nếu bạn có một bài kiểm tra trong đó giá trị p làH¯¯¯¯¯H1,…,HKHk0.01nhưng một trăm thử nghiệm khác nhau trong đó giá trị p là thì nhiều khả năng "giả thuyết tốt nhất" (tốt nhất có ý nghĩa tốt hơn so với thực tế) thực sự đến từ nhóm kết quả "gần như có ý nghĩa".0.1
Điểm chính để nhấn mạnh là một giả thuyết không bao giờ có thể tồn tại trong sự cô lập với các chất thay thế. Vì, sau khi chỉ định các lý thuyết / mô hình , bạn luôn có thể thêm một giả thuyết mới
Thực tế, loại giả thuyết này về cơ bản là tiến bộ khoa học - ai đó có ý tưởng mới / giải thích cho một số loại hiệu ứng, và sau đó kiểm tra lý thuyết mới này chống lại tập hợp thay thế hiện tại . Đó là so với và không chỉ đơn giản là so với . Phiên bản đơn giản hóa chỉ áp dụng khi có giả thuyết được hỗ trợ rất mạnh trongK
HK+1=Something else not yet thought of
HK+1H1,…,HKH0HAH1,…,HK- tức là, trong tất cả các ý tưởng và giải thích chúng tôi hiện đang có, có một lý thuyết nổi bật. Điều này chắc chắn không đúng với hầu hết các lĩnh vực khoa học xã hội / chính trị, kinh tế và tâm lý học.