Làm thế nào để đối phó với hiệu ứng trần do công cụ đo lường?


12

Tôi đã thu thập dữ liệu tâm sinh lý đo khả năng nhận biết rung động của các đối tượng (hai nhóm). Một đầu dò rung động di chuyển trên da ở các chuyển vị nhỏ hơn và nhỏ hơn, và đối tượng chỉ ra khi họ cảm thấy rung. Thật không may, ở tần số cao, đầu dò chỉ có thể di chuyển một khoảng cách ngắn và đôi khi khoảng cách lớn nhất mà đầu dò có thể di chuyển vẫn không đủ lớn để các đối tượng nhận thức được. Do đó, tôi có các giá trị ngưỡng chính xác cho một số đối tượng, nhưng đối với một số người không bao giờ cảm thấy rung động, tôi chỉ đơn giản có một giá trị mà tôi biết ngưỡng của họ lớn hơn. Có cách nào để tôi vẫn bao gồm dữ liệu này không? Và cách tốt nhất để phân tích nó là gì?


5
Chúng được gọi là quan sát kiểm duyệt . Làm thế nào để bao gồm nó phụ thuộc vào loại phân tích thống kê bạn đang tiến hành.

Tôi đồng ý với Procrastinator ngoại trừ việc tôi sẽ sử dụng thuật ngữ cắt ngắn. Cách tiếp cận vấn đề mô phỏng gọi là kiểm duyệt đúng xảy ra trong phân tích sinh tồn, ở đó bạn giữ giá trị cắt ngắn nhưng có một biến chỉ báo để cho bạn biết giá trị đó là giá trị hoàn chỉnh hay giá trị kiểm duyệt. Trong phân tích sinh tồn có một cách đơn giản để đối phó với điều này nhưng đó là bởi vì bạn đang ước tính một đường cong sinh tồn. Ở đây bạn có thể muốn tính trung bình. Nếu bạn bỏ qua những lời khuyên bạn đánh giá thấp mức trung bình. Nếu bạn ném ra các điểm bị cắt, bạn đánh giá thấp mức trung bình.
Michael R. Chernick

Để kết hợp chính xác các giá trị bị cắt, bạn sẽ cần phải có một mô hình xác suất cho khoảng cách thăm dò cho rằng nó lớn hơn ngưỡng. Sau đó, bạn có thể lấy giá trị trung bình của phân phối đó và tính trung bình có trọng số bằng cách sử dụng trung bình cho các giá trị không được kết hợp với trung bình cho phân phối bị cắt cụt trong đó trọng số theo tỷ lệ của các trường hợp bị cắt bớt.
Michael R. Chernick

4
Cắt ngắn là những gì sẽ xảy ra nếu bạn vứt bỏ dữ liệu không đủ điều kiện. Bạn không muốn làm điều đó! Bạn đã đúng, Cale, rằng có thông tin trong các giá trị bị kiểm duyệt này và nghi ngờ rằng có một số cách tiêu chuẩn để phân tích chúng (và cạm bẫy cho người không sẵn sàng). Nhưng để cung cấp một câu trả lời tốt, chúng tôi sẽ cần biết loại phân tích bạn tìm kiếm. Cụ thể, việc xử lý các dữ liệu này về cơ bản là khác nhau tùy thuộc vào việc chúng xuất hiện dưới dạng các biến phụ thuộc hay độc lập trong hồi quy. Có lẽ bạn có thể giải thích về điều này?
whuber

1
Chi tiết nhỏ không liên quan đến câu hỏi thống kê trong tay nhưng có thể hữu ích khi biết: Dữ liệu thuộc loại này thường được gọi là dữ liệu tâm lý học tâm lý, không phải dữ liệu tâm lý học tâm lý (bao gồm những thứ như đo nhịp tim hoặc đo độ dẫn của da nhưng không phán đoán chủ quan về cảm giác ). Điều này cũng có thể giúp bạn tìm kiếm tài liệu về cách mọi người thường xử lý loại dữ liệu này.
Gala

Câu trả lời:


2

Tôi thích sử dụng Mô hình hỗn hợp không đồng nhất để mô tả các hiệu ứng kết hợp từ các nguồn khác nhau cơ bản.

Bạn có thể nhìn vào một cái gì đó giống như một mô hình "Zero Inflated Poisson" theo phong cách của Diane Lambert. " Hồi quy Poisson bằng không, với một ứng dụng cho các khuyết tật trong sản xuất ", Diane Lambert, Technometrics, Vol. 34, Vấn đề. 1 năm 1992

Tôi thấy ý tưởng này đặc biệt thú vị bởi vì nó dường như mâu thuẫn với quan niệm rằng việc áp dụng thiết kế thống kê các thí nghiệm vào y học không thể chữa khỏi hoàn toàn bệnh. Đằng sau khái niệm này là ý tưởng rằng phương pháp khoa học không thể hoàn thành mục đích của nó trong y học xuất phát từ ý tưởng rằng không có dữ liệu bệnh từ một cá nhân khỏe mạnh "hoàn hảo" và do đó dữ liệu không thể đưa ra phương pháp chữa bệnh. Không có đo lường thì không có chỗ để cải thiện.

Sử dụng một cái gì đó giống như một mô hình không phồng cho phép người ta trích xuất thông tin hữu ích từ dữ liệu một phần "không có lỗi". Nó đang sử dụng cái nhìn sâu sắc vào quá trình để lấy thông tin có thể được coi là "im lặng" và làm cho nó nói. Đối với tôi đây là loại việc bạn đang cố gắng làm.

Bây giờ tôi không thể bắt đầu khẳng định nên sử dụng kết hợp các mô hình nào. Tôi nghi ngờ rằng bạn có thể sử dụng Mô hình hỗn hợp Gaussian không thổi phồng (GMM) cho người mới bắt đầu. GMM là một phần của một xấp xỉ phổ quát thực nghiệm cho các tệp PDF liên tục - như anh em họ PDF của xấp xỉ Sê-ri Fourier, nhưng với sự hỗ trợ của định lý giới hạn trung tâm để cải thiện khả năng ứng dụng toàn cầu và cho phép thường có ít thành phần hơn để tạo ra một " tốt "gần đúng.

May mắn nhất.

BIÊN TẬP:

Thông tin thêm về các mô hình không tăng cao:


0

Phân cụm kết quả và xác định thang đo có thể là một giải pháp.

Tạo một biến danh mục như vậy (hoặc khác nhau):

  1. Độ nhạy cao
  2. Độ nhạy bình thường
  3. Độ nhạy thấp
  4. Không nhạy cảm (những người không theo quy mô trong trường hợp của bạn)

Bạn có thể sử dụng biến này để thực hiện phân tích, nhưng liệu kết quả có ý nghĩa hay không phụ thuộc vào mức độ bạn xác định danh mục.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.