Làm cách nào để tìm các giá trị không được đưa ra trong (bảng nội suy) trong các bảng thống kê?


19

Thông thường mọi người sử dụng các chương trình để có được giá trị p, nhưng đôi khi - vì bất kỳ lý do gì - có thể cần phải có được một giá trị quan trọng từ một tập hợp các bảng.

Đưa ra một bảng thống kê với số lượng mức ý nghĩa hạn chế và số bậc tự do có giới hạn, làm cách nào tôi có được các giá trị quan trọng gần đúng ở các mức ý nghĩa hoặc mức độ tự do khác (chẳng hạn như với các bảng t , chi bình phương hoặc F ) ?

Đó là, làm thế nào để tôi tìm thấy các giá trị "ở giữa" các giá trị trong một bảng?

Câu trả lời:


26

Câu trả lời này gồm hai phần chính: thứ nhất, sử dụng phép nội suy tuyến tính và thứ hai là sử dụng các phép biến đổi để nội suy chính xác hơn. Các cách tiếp cận được thảo luận ở đây phù hợp để tính toán tay khi bạn có sẵn các bảng giới hạn, nhưng nếu bạn đang thực hiện một thói quen máy tính để tạo ra các giá trị p, thì nên sử dụng các cách tiếp cận tốt hơn (nếu tẻ nhạt khi thực hiện bằng tay).

Nếu bạn biết rằng giá trị tới hạn 10% (một đuôi) cho phép thử z là 1,28 và giá trị tới hạn 20% là 0,84, thì dự đoán sơ bộ về giá trị tới hạn 15% sẽ nằm ở giữa - (1,28 + 0,84) / 2 = 1.06 (giá trị thực tế là 1.0364) và giá trị 12,5% có thể được đoán ở giữa chừng và giá trị 10% (1.28 + 1.06) / 2 = 1.17 (giá trị thực tế 1.15+). Đây chính xác là những gì nội suy tuyến tính thực hiện - nhưng thay vì 'nửa chừng giữa', nó xem xét bất kỳ phần nào của hai giá trị.

Nội suy tuyến tính đơn biến

Hãy xem xét trường hợp nội suy tuyến tính đơn giản.

Vì vậy, chúng ta có một số hàm (giả sử là ) mà chúng ta nghĩ là xấp xỉ tuyến tính gần giá trị mà chúng ta đang cố gắng xấp xỉ và chúng ta có một giá trị của hàm ở hai bên của giá trị mà chúng ta muốn, ví dụ như vậy:x

xy89.316y162015.6

Hai giá trị mà y là chúng ta đã biết là 12 (20-8) ngoài. Xem cách giá trị x (giá trị mà chúng ta muốn có giá trị y gần đúng ) chia sự khác biệt đó lên 12 theo tỷ lệ 8: 4 (16-8 và 20-16)? Đó là, đó là 2/3 khoảng cách từ giá trị x đầu tiên đến giá trị cuối cùng. Nếu mối quan hệ là tuyến tính, phạm vi giá trị y tương ứng sẽ có cùng tỷ lệ.xyxyx

phép nội suy tuyến tính

Vì vậy, nên tương đương với16-8y169.315.69.3 .168208

Đó là y169.315.69.3168208

sắp xếp lại:

y169.3+(15.69.3)168208=13.5

Một ví dụ với các bảng thống kê: nếu chúng ta có một bảng t với các giá trị quan trọng sau cho 12 df:

(2-tail)αt0.013.050.022.680.052.180.101.78

Chúng tôi muốn giá trị tới hạn của t với 12 df và alpha hai đuôi là 0,025. Đó là, chúng tôi nội suy giữa hàng 0,02 và 0,05 của bảng đó:

αt0.022.680.025?0.052.18

Giá trị tại " " Là giá trị t 0,025 mà chúng tôi muốn sử dụng phép nội suy tuyến tính để tính gần đúng. (Theo t 0,025 tôi thực sự có nghĩa là 1 - 0,025 / 2 điểm của cdf nghịch đảo của phân phối t 12. )?t0.025t0.02510.025/2t12

Như trước đây, chia khoảng từ 0,02 đến 0,05 theo tỷ lệ ( 0,025 - 0,02 ) thành ( 0,05 - 0,025 ) (tức là 1 : 5 ) và giá trị t chưa biết nên chia phạm vi t 2,68 đến 2,18 theo cùng tỷ lệ; tương đương, 0,025 xảy ra ( 0,025 - 0,02 ) / ( 0,05 - 0,02 ) = 1 /0.0250.020.05(0.0250.02)(0.050.025)1:5tt2.682.180.025 tháng của cách dọc theo x trung cấp, do đó chưa biết t -giá trị nên xảy ra 1 / 6 thứ của con đường dọc theo t trung cấp.(0.0250.02)/(0.050.02)=1/6xt1/6t

Đó là hoặc tương đươngt0.0252.682.182.680.0250.020.050.02

t0.0252.68+(2.182.68)0.0250.020.050.02=2.680.5162.60

Câu trả lời thực tế là ... không đặc biệt gần bởi vì hàm chúng ta xấp xỉ không gần với tuyến tính trong phạm vi đó (gần α = 0,5 ).2.56α=0.5

nội suy tuyến tính của giá trị tới hạn trong các bảng t

Xấp xỉ tốt hơn thông qua chuyển đổi

Chúng ta có thể thay thế nội suy tuyến tính bằng các hình thức chức năng khác; thực tế, chúng tôi chuyển đổi sang một thang đo trong đó phép nội suy tuyến tính hoạt động tốt hơn. Trong trường hợp này, ở phần đuôi, nhiều giá trị tới hạn được lập bảng gần như là tuyến tính của của mức ý nghĩa. Sau khi chúng ta lấy log s, chúng ta chỉ cần áp dụng phép nội suy tuyến tính như trước. Hãy thử làm điều đó với ví dụ trên:loglog

αlog(α)t0.023.9122.680.0253.689t0.0250.052.9962.18

Hiện nay

t0.0252.682.182.68log(0.025)log(0.02)log(0.05)log(0.02)=3.6893.9122.9963.912

hoặc tương đương

t0.0252.68+(2.182.68)3.6893.9122.9963.912=2.680.50.2432.56

Điều này đúng với số lượng trích dẫn của số liệu. Điều này là do - khi chúng ta biến đổi logarit theo tỷ lệ x - mối quan hệ gần như tuyến tính:

nội suy tuyến tính trong log alpha
Thật vậy, trực quan đường cong (màu xám) nằm ngay ngắn trên đỉnh của đường thẳng (màu xanh).

logit(α)=log(α1α)=log(11α1)αlog

Nội suy qua các mức độ tự do khác nhau

tFν1/ν

120/ν120/ν

F4,νν=601201/νν=80F

F4,80,.95F4,60,.95+1/80-1/601/120-1/60(F4,120,.95-F4,60,.95)

nghịch đảo trong df

(So ​​sánh với sơ đồ ở đây )


Đây là một phần của một bảng chi bình phương

            Probability less than the critical value
 df           0.90      0.95     0.975      0.99     0.999
______   __________________________________________________

 40         51.805    55.758    59.342    63.691    73.402
 50         63.167    67.505    71.420    76.154    86.661
 60         74.397    79.082    83.298    88.379    99.607
 70         85.527    90.531    95.023   100.425   112.317

Hãy tưởng tượng chúng tôi muốn tìm giá trị tới hạn 5% (phần trăm thứ 95) cho 57 độ tự do.

Nhìn kỹ, chúng ta thấy rằng 5% giá trị tới hạn trong bảng tiến triển gần như tuyến tính ở đây:

nhập mô tả hình ảnh ở đây

(đường màu xanh lục nối các giá trị cho 50 và 60 df; bạn có thể thấy nó chạm vào các dấu chấm cho 40 và 70)

Vì vậy nội suy tuyến tính sẽ làm rất tốt. Nhưng tất nhiên chúng ta không có thời gian để vẽ biểu đồ; Làm thế nào để quyết định khi nào nên sử dụng phép nội suy tuyến tính và khi nào nên thử một cái gì đó phức tạp hơn?

(x50,0,95+x70,0,95)/2x60,0,95

(67.505+90,531)/2= =79.018

x-67.50579.082-67.50557-5060-50 hoặc là

x67.505+(79.082-67.505)57-5060-5075,61.

Giá trị thực tế là 75,62375, vì vậy chúng tôi thực sự có 3 con số chính xác và chỉ bằng 1 trong hình thứ tư.

Nội suy chính xác hơn vẫn có thể có được bằng cách sử dụng các phương pháp khác biệt hữu hạn (đặc biệt, thông qua các khác biệt được chia), nhưng điều này có thể là quá mức cần thiết cho hầu hết các vấn đề kiểm tra giả thuyết.

Nếu mức độ tự do của bạn đi qua cuối bảng của bạn, câu hỏi này thảo luận về vấn đề đó.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.