Dữ liệu được liên kết trong bối cảnh của một hệ số tương quan xếp hạng là gì?


16

Tôi không thuộc lĩnh vực thống kê.

Tôi đã thấy từ "dữ liệu bị ràng buộc" trong khi đọc về Hệ số tương quan xếp hạng.

  • Dữ liệu gắn liền là gì?
  • Một ví dụ về dữ liệu bị ràng buộc là gì?

Câu trả lời:


5

Nó có nghĩa là dữ liệu có cùng giá trị; ví dụ: nếu bạn có 1,2,3,3,4 làm tập dữ liệu thì hai số 3 được liên kết dữ liệu. Nếu bạn có 1,2,3,4,5,5,5,6,7,7 làm tập dữ liệu thì 5 và 7 là dữ liệu được gắn.


14

"Dữ liệu bị trói" xuất hiện trong bối cảnh các bài kiểm tra thống kê phi tham số dựa trên xếp hạng.

Các thử nghiệm không tham số : thử nghiệm không giả định phân phối xác suất cụ thể, ví dụ: nó không giả định đường cong hình chuông.

dựa trên xếp hạng : một nhóm lớn các bài kiểm tra không tham số bắt đầu bằng cách chuyển đổi các số (ví dụ: "3 ngày", "5 ngày" và "4 ngày") thành các cấp bậc (ví dụ: "thời gian ngắn nhất (thứ 3)", "thời lượng dài nhất (1) "," thời lượng dài thứ hai (thứ 2) "). Một phương pháp thử nghiệm tham số truyền thống sau đó được áp dụng cho các cấp bậc này.

Dữ liệu bị ràng buộc là một vấn đề vì các số giống hệt nhau bây giờ cần phải được chuyển đổi thành thứ hạng. Đôi khi các cấp được gán ngẫu nhiên, đôi khi một thứ hạng trung bình được sử dụng. Quan trọng nhất, một giao thức để phá vỡ các cấp bậc bị ràng buộc cần phải được mô tả cho độ tái lập của kết quả.


5

Nó chỉ đơn giản là hai giá trị dữ liệu giống hệt nhau, chẳng hạn như quan sát 7 lần trong cùng một tập dữ liệu.

Điều này xuất hiện trong bối cảnh các phương pháp thống kê cho rằng dữ liệu có các phép đo liên tục và do đó không thể thực hiện được các phép đo giống hệt nhau (hoặc về mặt kỹ thuật, các giá trị giống hệt xác suất bằng 0). Các biến chứng thực tế phát sinh khi các phương pháp này được áp dụng cho dữ liệu được làm tròn hoặc cắt bớt để các phép đo giống hệt nhau không chỉ có thể mà còn khá phổ biến.


1
Tôi không đồng ý lý do này vì bạn không thể nói rằng vì xác suất bằng không của nó rằng sự kiện này có thể không bao giờ xảy ra. Đây không phải là một lý do tốt.
Henry.L

2

Câu hỏi có tầm quan trọng cơ bản:

Một quan sát / dữ liệu / cặp gắn là gì?

T+

(Vì vậy, tôi không nghĩ câu trả lời của @ Ming-Chih Kao là phù hợp bằng cách giới thiệu các bài kiểm tra không tham số trước tiên.

ZTôi= =XTôi-YTôi

(XTôi,YTôi)

ZTôi

ZTôi

|ZTôi|

{(1,-1)(1,-1)},{(1,2)(1,2)(2,1)(2,1)(2,3)(2,3)(3,2)},{(3,0)}

Chúng ta hãy thử cách rất dễ dàng để làm điều này, chúng ta xếp hạng từ trái sang phải và đưa ra:

RTôi

|ZTôi|

RTôi

|ZTôi|

RTôi

|ZTôi|= =1|ZTôi|= =2

1++77= =4số 8+92= =8,5

RTôi

Điều này đã sửa đổi thứ hạng và làm cho mỗi quan sát bị ràng buộc có cùng ảnh hưởng trong việc tính toán các số liệu thống kê xếp hạng, do đó trong bài kiểm tra xếp hạng.

Các giải pháp để gắn quan sát / dữ liệu / cặp là gì?

(1) Chỉ định thứ hạng trung bình. Đây chỉ là những gì chúng tôi đã làm ở trên. Bằng cách gán cùng một thứ hạng cho dữ liệu bị ràng buộc trong cùng một nhóm, chúng tôi làm cho ảnh hưởng của chúng trong bài kiểm tra xếp hạng giống nhau và do đó loại bỏ sự không chính xác có thể gây ra bởi các quan sát bị ràng buộc.

MmộtxRmộtnkfTôirStgrobạnp<MTôinRmộtnkSecondgrobạnpMmộtxRmộtnkfTôirStgrobạnp>MTôinRmộtnkSecondgrobạnpMmộtxRmộtnkfTôirStgrobạnp= =MTôinRmộtnkSecondgrobạnp, sau đó chúng ta phải hợp nhất hai nhóm gắn liền thành một.

ε

PX= =x= =0

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.