Tôi biết rằng có rất nhiều tài liệu giải thích giá trị p. Tuy nhiên, khái niệm này không dễ nắm bắt mà không cần làm rõ thêm.
Dưới đây là định nghĩa về giá trị p từ Wikipedia:
Giá trị p là xác suất để có được một thống kê kiểm tra ít nhất là cực trị như giá trị thực tế đã được quan sát, giả sử rằng giả thuyết null là đúng. ( http://en.wikipedia.org/wiki/P-value )
Câu hỏi đầu tiên của tôi liên quan đến biểu thức "ít nhất là cực đoan như câu hỏi thực sự được quan sát." Sự hiểu biết của tôi về logic dựa trên việc sử dụng giá trị p là như sau: Nếu giá trị p nhỏ, việc quan sát xảy ra không có khả năng giả định null và chúng ta có thể cần một giả thuyết thay thế để giải thích quan sát. Nếu giá trị p không quá nhỏ, có khả năng quan sát xảy ra chỉ giả định giả thuyết khống và giả thuyết thay thế là không cần thiết để giải thích quan sát. Vì vậy, nếu ai đó muốn nhấn mạnh vào một giả thuyết, anh ấy / cô ấy phải chỉ ra rằng giá trị p của giả thuyết null là rất nhỏ. Với quan điểm này, sự hiểu biết của tôi về biểu thức mơ hồ là giá trị p là, nếu PDF của thống kê là không chính thống, trong đó là thống kê kiểm tra và là giá trị của nó thu được từ quan sát. Thê nay đung không? Nếu nó đúng, nó vẫn được áp dụng để sử dụng PDF bimodal của thống kê? Nếu hai đỉnh của PDF được phân tách tốt và giá trị quan sát nằm ở đâu đó trong vùng mật độ xác suất thấp giữa hai đỉnh, thì giá trị p sẽ đưa ra xác suất?
Câu hỏi thứ hai là về một định nghĩa khác về giá trị p từ Wolfram MathWorld:
Xác suất mà một phương sai sẽ giả sử một giá trị lớn hơn hoặc bằng giá trị quan sát một cách nghiêm túc. ( http://mathworld.wolfram.com/P-Value.html )
Tôi hiểu rằng cụm từ "hoàn toàn tình cờ" nên được hiểu là "giả sử không có giả thuyết". Có đúng không?
Câu hỏi thứ ba liên quan đến việc sử dụng "giả thuyết null". Chúng ta hãy giả sử rằng ai đó muốn nhấn mạnh rằng một đồng tiền là công bằng. Ông đưa ra giả thuyết khi tần số tương đối của đầu là 0,5. Thì giả thuyết khống là "tần số tương đối của các đầu không phải là 0,5". Trong trường hợp này, trong khi việc tính toán giá trị p của giả thuyết null là khó khăn, việc tính toán dễ dàng cho giả thuyết thay thế. Tất nhiên vấn đề có thể được giải quyết bằng cách hoán đổi vai trò của hai giả thuyết. Câu hỏi của tôi là sự từ chối hoặc chấp nhận dựa trên giá trị p của giả thuyết thay thế ban đầu (không đưa ra giả thuyết null) là liệu nó có ổn hay không. Nếu nó không ổn, cách giải quyết thông thường cho những khó khăn như vậy khi tính giá trị p của một giả thuyết null là gì?
Tôi đã đăng một câu hỏi mới được làm rõ hơn dựa trên các cuộc thảo luận trong chủ đề này.