Câu trả lời này gồm hai phần chính: thứ nhất, sử dụng phép nội suy tuyến tính và thứ hai là sử dụng các phép biến đổi để nội suy chính xác hơn. Các cách tiếp cận được thảo luận ở đây phù hợp để tính toán tay khi bạn có sẵn các bảng giới hạn, nhưng nếu bạn đang thực hiện một thói quen máy tính để tạo ra các giá trị p, thì nên sử dụng các cách tiếp cận tốt hơn (nếu tẻ nhạt khi thực hiện bằng tay).
Nếu bạn biết rằng giá trị tới hạn 10% (một đuôi) cho phép thử z là 1,28 và giá trị tới hạn 20% là 0,84, thì dự đoán sơ bộ về giá trị tới hạn 15% sẽ nằm ở giữa - (1,28 + 0,84) / 2 = 1.06 (giá trị thực tế là 1.0364) và giá trị 12,5% có thể được đoán ở giữa chừng và giá trị 10% (1.28 + 1.06) / 2 = 1.17 (giá trị thực tế 1.15+). Đây chính xác là những gì nội suy tuyến tính thực hiện - nhưng thay vì 'nửa chừng giữa', nó xem xét bất kỳ phần nào của hai giá trị.
Nội suy tuyến tính đơn biến
Hãy xem xét trường hợp nội suy tuyến tính đơn giản.
Vì vậy, chúng ta có một số hàm (giả sử là ) mà chúng ta nghĩ là xấp xỉ tuyến tính gần giá trị mà chúng ta đang cố gắng xấp xỉ và chúng ta có một giá trị của hàm ở hai bên của giá trị mà chúng ta muốn, ví dụ như vậy:x
x81620y9.3y1615.6
Hai giá trị mà y là chúng ta đã biết là 12 (20-8) ngoài. Xem cách giá trị x (giá trị mà chúng ta muốn có giá trị y gần đúng ) chia sự khác biệt đó lên 12 theo tỷ lệ 8: 4 (16-8 và 20-16)? Đó là, đó là 2/3 khoảng cách từ giá trị x đầu tiên đến giá trị cuối cùng. Nếu mối quan hệ là tuyến tính, phạm vi giá trị y tương ứng sẽ có cùng tỷ lệ.xyxyx
Vì vậy, nên tương đương với16-8y16−9.315.6−9.3 .16−820−8
Đó là y16−9.315.6−9.3≈16−820−8
sắp xếp lại:
y16≈9.3+(15.6−9.3)16−820−8=13.5
Một ví dụ với các bảng thống kê: nếu chúng ta có một bảng t với các giá trị quan trọng sau cho 12 df:
(2-tail)α0.010.020.050.10t3.052.682.181.78
Chúng tôi muốn giá trị tới hạn của t với 12 df và alpha hai đuôi là 0,025. Đó là, chúng tôi nội suy giữa hàng 0,02 và 0,05 của bảng đó:
α0.020.0250.05t2.68?2.18
Giá trị tại " " Là giá trị t 0,025 mà chúng tôi muốn sử dụng phép nội suy tuyến tính để tính gần đúng. (Theo t 0,025 tôi thực sự có nghĩa là 1 - 0,025 / 2 điểm của cdf nghịch đảo của phân phối t 12. )?t0.025t0.0251−0.025/2t12
Như trước đây, chia khoảng từ 0,02 đến 0,05 theo tỷ lệ ( 0,025 - 0,02 ) thành ( 0,05 - 0,025 ) (tức là 1 : 5 ) và giá trị t chưa biết nên chia phạm vi t 2,68 đến 2,18 theo cùng tỷ lệ; tương đương, 0,025 xảy ra ( 0,025 - 0,02 ) / ( 0,05 - 0,02 ) = 1 /0.0250.020.05(0.025−0.02)(0.05−0.025)1:5tt2.682.180.025 tháng của cách dọc theo x trung cấp, do đó chưa biết t -giá trị nên xảy ra 1 / 6 thứ của con đường dọc theo t trung cấp.(0.025−0.02)/(0.05−0.02)=1/6xt1/6t
Đó là hoặc tương đươngt0.025−2.682.18−2.68≈0.025−0.020.05−0.02
t0.025≈2.68+(2.18−2.68)0.025−0.020.05−0.02=2.68−0.516≈2.60
Câu trả lời thực tế là ... không đặc biệt gần bởi vì hàm chúng ta xấp xỉ không gần với tuyến tính trong phạm vi đó (gần α = 0,5 ).2.56α=0.5
Xấp xỉ tốt hơn thông qua chuyển đổi
Chúng ta có thể thay thế nội suy tuyến tính bằng các hình thức chức năng khác; thực tế, chúng tôi chuyển đổi sang một thang đo trong đó phép nội suy tuyến tính hoạt động tốt hơn. Trong trường hợp này, ở phần đuôi, nhiều giá trị tới hạn được lập bảng gần như là tuyến tính của của mức ý nghĩa. Sau khi chúng ta lấy log s, chúng ta chỉ cần áp dụng phép nội suy tuyến tính như trước. Hãy thử làm điều đó với ví dụ trên:loglog
α0.020.0250.05log(α)−3.912−3.689−2.996t2.68t0.0252.18
Hiện nay
t0.025−2.682.18−2.68≈=log(0.025)−log(0.02)log(0.05)−log(0.02)−3.689−−3.912−2.996−−3.912
hoặc tương đương
t0.025≈=2.68+(2.18−2.68)−3.689−−3.912−2.996−−3.9122.68−0.5⋅0.243≈2.56
Điều này đúng với số lượng trích dẫn của số liệu. Điều này là do - khi chúng ta biến đổi logarit theo tỷ lệ x - mối quan hệ gần như tuyến tính:
Thật vậy, trực quan đường cong (màu xám) nằm ngay ngắn trên đỉnh của đường thẳng (màu xanh).
logit(α)=log(α1−α)=log(11−α−1)αlog
Nội suy qua các mức độ tự do khác nhau
tFν†1/ν
120/ν120/ν
F4,νν=601201/νν=80F
F4 , 80 , .95≈ F4 , 60 , .95+ 1 / 80 - 1 / 601 / 120 - 1 / 60⋅ ( F4 , 120 , .95- F4 , 60 , .95)
(So sánh với sơ đồ ở đây )
†
Đây là một phần của một bảng chi bình phương
Probability less than the critical value
df 0.90 0.95 0.975 0.99 0.999
______ __________________________________________________
40 51.805 55.758 59.342 63.691 73.402
50 63.167 67.505 71.420 76.154 86.661
60 74.397 79.082 83.298 88.379 99.607
70 85.527 90.531 95.023 100.425 112.317
Hãy tưởng tượng chúng tôi muốn tìm giá trị tới hạn 5% (phần trăm thứ 95) cho 57 độ tự do.
Nhìn kỹ, chúng ta thấy rằng 5% giá trị tới hạn trong bảng tiến triển gần như tuyến tính ở đây:
(đường màu xanh lục nối các giá trị cho 50 và 60 df; bạn có thể thấy nó chạm vào các dấu chấm cho 40 và 70)
Vì vậy nội suy tuyến tính sẽ làm rất tốt. Nhưng tất nhiên chúng ta không có thời gian để vẽ biểu đồ; Làm thế nào để quyết định khi nào nên sử dụng phép nội suy tuyến tính và khi nào nên thử một cái gì đó phức tạp hơn?
( x50 , 0,95+ x70 , 0,95) / 2x60 , 0,95
( 67.505 + 90.531 ) / 2 = 79.018
x - 67.50579.082 - 67.505≈ 57 - 50 60 - 50 hoặc là
x ≈ 67,505 + ( 79,082 - 67,505 ) ⋅ 57 - 50 60 - 50 ≈ 75,61.
Giá trị thực tế là 75,62375, vì vậy chúng tôi thực sự có 3 con số chính xác và chỉ bằng 1 trong hình thứ tư.
Nội suy chính xác hơn vẫn có thể có được bằng cách sử dụng các phương pháp khác biệt hữu hạn (đặc biệt, thông qua các khác biệt được chia), nhưng điều này có thể là quá mức cần thiết cho hầu hết các vấn đề kiểm tra giả thuyết.
Nếu mức độ tự do của bạn đi qua cuối bảng của bạn, câu hỏi này thảo luận về vấn đề đó.