Tìm kiếm 'Khuỷu tay' trong dữ liệu


8

Subitization là phép liệt kê nhanh, chính xác của màn hình số lượng thấp, được phân biệt với việc đếm bằng một phi tuyến sắc nét trong biểu đồ thời gian đáp ứng. Dưới đây là một âm mưu đại diện, từ Watson, DG, Maylor, EA, & Bruce, LAM (2007). Lưu ý rằng thời gian liệt kê trung bình cho hiển thị 1-3 tăng gần như tuyến tính, nhưng thời gian liệt kê trung bình cho 4 không theo xu hướng tuyến tính. Một số nghiên cứu cho thấy rằng 'giới hạn' phụ thuộc vào điều kiện nhiệm vụ và bộ nhớ làm việc của người tham gia.

nhập mô tả hình ảnh ở đây

Tôi đang tìm cách để kiểm tra khuỷu tay ở đâu, với mục tiêu cuối cùng là xác định giới hạn thu nhỏ của người tham gia là gì. Hiện tại, ý tưởng tốt nhất của tôi là làm một cái gì đó giống như sự tương phản đa thức lặp đi lặp lại. Về cơ bản, tôi sẽ kiểm tra xu hướng bậc hai theo số 1-3, sau đó bằng số 1-4, v.v. Tôi muốn nói rằng tôi đã vượt qua giới hạn phụ khi xu hướng bậc hai trở nên quan trọng (điều chỉnh cho các bài kiểm tra lặp lại).

Tuy nhiên, đó là về giới hạn của sự hiểu biết thống kê của tôi, vì vậy tôi không thể đánh giá ý tưởng này quá tốt. Suy nghĩ?

Cảm ơn trước.

Câu trả lời:


3

Tùy thuộc vào định nghĩa của bạn về "khuỷu tay", có nhiều bài kiểm tra thống kê theo ý của bạn. Với toàn bộ gói R dành riêng cho chủ đề này.

Cá nhân tôi có xu hướng tránh chúng, vì bạn không bao giờ biết trước những gì chúng sẽ coi là "khuỷu tay" và liệu ý kiến ​​của bạn và chúng có trùng nhau không. (nhưng điều này có thể được coi là một vị trí cực đoan) Nó cũng phụ thuộc vào việc bạn muốn biết liệu có "khuỷu tay" ở một vị trí cụ thể hay không, nếu bạn muốn hỏi liệu có chung chung không.

Đối với trường hợp của một vị trí cụ thể, tất nhiên bạn có thể phù hợp với hồi quy cục bộ, so sánh các hệ số và khai báo một khuỷu tay theo quy tắc riêng của bạn về sự khác biệt về độ dốc.

Vấn đề thực sự xảy ra trong trường hợp sau. Nếu bạn chỉ có một vài điểm, bạn có thể thử tất cả. Nếu không, tôi sẽ phù hợp với một cái gì đó không tham số như LOESS, tính toán độ dốc của đường theo các khoảng đều đặn (với mật độ đủ), chẳng hạn như được hiển thị ở đây: /programming/12183137/calculate-min-max- độ dốc của hoàng thổ được trang bị đường cong-với-r

và sử dụng lại một số quy tắc mà bạn thấy thuận tiện để khai báo một cái gì đó "khuỷu tay". Tôi xem "khuỷu tay" là trường hợp khi sự thay đổi độ dốc đủ lớn của hàm xảy ra trong một khoảng thời gian đủ ngắn. Tất nhiên các ngưỡng cho các quy tắc trên là một vấn đề của sở thích cá nhân, đó là lý do tại sao không có thử nghiệm.

Nói chung, tôi cho rằng điều này sẽ khá vô dụng nếu dữ liệu bị lung lay (vì sẽ có rất nhiều thay đổi trong gradient).


Tôi xin khác biệt: có rất nhiều bài kiểm tra thống kê cho "khuỷu tay", miễn là nó được xác định đủ rõ ràng. Đây là một ví dụ về vấn đề thay đổi điểm hoặc thay đổi cấu trúc .
whuber

1
Tôi có lẽ nên viết lại, câu trả lời sau đó. Quan điểm của tôi là chính xác rằng mấu chốt nằm trong định nghĩa của "khuỷu tay". Ngoài ra, tôi có xu hướng không tin tưởng việc áp dụng một số quy trình điểm thay đổi cho dữ liệu (chuỗi thời gian), vì tôi không bao giờ biết định nghĩa của tác giả về "khuỷu tay" khác với tôi như thế nào. Do đó, tôi ủng hộ việc tạo ra một quy tắc cá nhân để xác định "khuỷu tay", thay vì sử dụng một số công cụ kệ. Bạn có thể không có kiểm tra thống kê, nhưng ít nhất nếu bạn tạo ra nó, bạn sẽ biết nó làm gì và nó có xu hướng gắn nhãn đường cong như thế nào.
có nghĩa là

+1 Đó là một điểm rất tốt.
whuber

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.