Những tiêu chí nào phải được đáp ứng để kết luận "hiệu ứng trần" đang xảy ra?


13

Theo Các SAGE Bách khoa toàn thư Khoa học Phương pháp nghiên cứu xã hội ...

[a] hiệu ứng trần xảy ra khi một biện pháp sở hữu giới hạn trên rõ rệt cho các phản ứng tiềm năng và sự tập trung lớn của người tham gia đạt điểm ở hoặc gần giới hạn này. Suy giảm tỷ lệ là một vấn đề phương pháp luận xảy ra bất cứ khi nào phương sai bị hạn chế theo cách này. Ví dụ, hiệu ứng trần có thể xảy ra với thước đo thái độ trong đó điểm cao cho thấy thái độ thuận lợi và phản ứng cao nhất không thể đánh giá tích cực nhất có thể. Giải pháp tốt nhất cho vấn đề hiệu ứng trần là thử nghiệm thí điểm, cho phép xác định sớm vấn đề . Nếu tìm thấy hiệu ứng trần , [và] thước đo kết quả là hiệu suất của nhiệm vụ, nhiệm vụ có thể trở nên khó khăn hơn để tăng phạm vi phản ứng tiềm năng. 1 [nhấn mạnh thêm]

Dường như có rất nhiều các lời khuyêncâu hỏi ( và ở đây ) đối phó với việc phân tích dữ liệu mà hiển thị các hiệu ứng trần tương tự như mô tả trong đoạn trích trên.

Câu hỏi của tôi có thể đơn giản hoặc ngây thơ, nhưng làm thế nào để người ta thực sự phát hiện ra rằng hiệu ứng trần có trong dữ liệu? Cụ thể hơn, giả sử một bài kiểm tra tâm lý được tạo ra và bị nghi ngờ dẫn đến hiệu ứng trần (chỉ kiểm tra trực quan) và sau đó bài kiểm tra được sửa đổi để tạo ra một phạm vi giá trị lớn hơn. Làm thế nào có thể chỉ ra rằng thử nghiệm sửa đổi đã loại bỏ hiệu ứng trần khỏi dữ liệu mà nó tạo ra? Có thử nghiệm nào cho thấy có hiệu ứng trần trong tập dữ liệu a nhưng không có hiệu ứng trần trong tập dữ liệu b ?

Cách tiếp cận ngây thơ của tôi sẽ chỉ là kiểm tra độ lệch phân phối và nếu nó không bị lệch, kết luận rằng không có hiệu ứng trần. Đó có phải là quá đơn giản?

Biên tập

Để thêm một ví dụ cụ thể hơn, giả sử tôi phát triển một công cụ đo lường một số đặc điểm tiềm ẩn x tăng theo tuổi tác nhưng cuối cùng giảm dần và bắt đầu suy giảm ở tuổi già. Tôi tạo phiên bản đầu tiên, có phạm vi 1 1, 14, thực hiện một số thử nghiệm và thấy rằng dường như có thể có hiệu ứng trần (rất nhiều phản hồi ở mức gần 14 nhìn vào dữ liệu. Nhưng tại sao? Có phương pháp nghiêm ngặt nào hỗ trợ cho yêu sách đó không?

Sau đó, tôi sửa lại số đo để có phạm vi 12020 và thu thập thêm dữ liệu. Tôi thấy rằng xu hướng phù hợp hơn với mong đợi của tôi, nhưng làm thế nào để tôi biết rằng phạm vi đo lường đủ lớn. Tôi có cần sửa lại lần nữa không? Trực quan, nó có vẻ ổn, nhưng có cách nào để kiểm tra nó để xác nhận sự nghi ngờ của tôi không?

nhập mô tả hình ảnh ở đây

Tôi muốn biết làm thế nào tôi có thể phát hiện hiệu ứng trần này trong dữ liệu thay vì chỉ nhìn vào nó. Các biểu đồ đại diện cho dữ liệu thực tế, không phải là lý thuyết. Mở rộng phạm vi của công cụ tạo ra sự lan truyền dữ liệu tốt hơn, nhưng liệu đã đủ? Làm thế nào tôi có thể kiểm tra điều đó?


1 Hessling, R., Traxel, N., & Schmidt, T. (2004). Hiệu ứng trần. Trong Michael S. Lewis-Beck, A. Bryman, & Tim Futing Liao (Eds.), Bách khoa toàn thư SAGE về phương pháp nghiên cứu khoa học xã hội . (trang 107). Ngàn Bàu, CA: Sage Publications, Inc. doi: 10,4135 / xà12950589.n102


4
Để đạt được tiến bộ, người ta sẽ phải đưa ra một định nghĩa hoạt động về "hiệu ứng trần". Làm điều đó nói chung có thể có vấn đề: xét cho cùng, hầu như mọi đại lượng đo được thực tế không thể vượt quá một số giá trị, chẳng hạn như 100% trong điểm kiểm tra hoặc nồng độ hóa học, giới hạn trên của những gì một công cụ có thể đọc, v.v. tất cả dữ liệu phải tuân theo một số giới hạn trên vốn có. Vì vậy, mặc dù ý nghĩa dự định của "hiệu ứng trần" rõ ràng bằng trực giác từ các ví dụ hay của bạn, bạn có thể giúp chúng tôi bằng cách làm rõ chính xác những gì cần được "xóa" khỏi dữ liệu của bạn và tại sao.
whuber

1
@whuber bạn nói đúng rằng thuật ngữ này được sử dụng theo nhiều cách khác nhau, nhưng trong trường hợp này, tôi đang nói về việc làm một cây thước đủ dài để vượt quá tất cả những điều tôi muốn đo. Khi tạo bài kiểm tra, bạn chắc chắn muốn bao gồm đủ các mục của một loạt các khó khăn để không ai nhận được 100%, nếu không bạn sẽ không biết liệu khả năng của người đó có thực sự là giới hạn của bài kiểm tra hay cao hơn không. Không có gì cần phải xóa khỏi dữ liệu, nhưng công cụ cần được sửa đổi cho đến khi nó không mang lại các điểm dữ liệu bị kiểm duyệt.
trần

Cảm ơn bạn. Mặc dù vậy, tôi vẫn không chắc ý của bạn về "hiệu ứng trần" là gì, bởi vì cả hai hình minh họa của bạn đều không cho thấy bằng chứng về bất kỳ loại kiểm duyệt nào - ít nhất là không có giới hạn kiểm duyệt cố định của loại thử nghiệm đạt được. Trong thực tế, sự thay đổi từ bảng điều khiển bên trái sang bên phải trông giống như biểu thức tái tuyến tính một-một của trục dọc, điều này sẽ không ảnh hưởng đến bất kỳ mức trần nào trong dữ liệu. Điều này khiến tôi tự hỏi liệu bạn có thực sự quan tâm đến một cái gì đó hoàn toàn khác, chẳng hạn như sự bất đối xứng của phần dư hồi quy.
whuber

1
@whuber jitter đã được thêm vào vì hầu hết các điểm trùng nhau. Nếu các biểu đồ không xuất hiện liên quan đến câu hỏi của tôi, thì rõ ràng tôi không biết tôi đang nói về cái gì. Đối với tôi, có vẻ như có một hiệu ứng trần như được mô tả bởi Hessling, Traxel, & Schmidt, nhưng dựa trên ý kiến ​​của bạn và hoàn toàn không quan tâm đến câu hỏi này, có lẽ tôi đang gặp vấn đề không có gì. Cảm ơn đề xuất và hiểu biết của bạn mặc dù. Tôi rât cảm kich.
trần

1
@Johan tôi thấy. Theo tinh thần của câu hỏi của bạn, tôi nhận ra rằng một sửa đổi nhỏ trong ý tưởng của bạn có thể là một ý tưởng tốt. Trừ khi chúng ta có lý do để cho rằng phần dư phải được phân phối bình thường, chúng ta có thể tìm cách chuyển đổi một cách đơn điệu của phản ứng trong đó các phân phối dư là homoscedastic khi đáp ứng thấp và có thể bị cắt ở nơi phản hồi cao. Nói cách khác, có lẽ bài kiểm tra không nên dành cho sự bình thường mà nên tìm kiếm một hình dạng và tỷ lệ nhất quán cho câu trả lời.
whuber

Câu trả lời:


3

Trước hết, tôi muốn nói rằng cả hai biểu đồ cung cấp bằng chứng rõ ràng cho tôi rằng có một hiệu ứng trần. Làm thế nào tôi sẽ cố gắng đo lường hiệu ứng đó thay vì chỉ trực quan sẽ quan sát chừng nào một phần không quan trọng của các quan sát nằm gần giới hạn trên của phạm vi của thiết bị. Thông thường, hiệu ứng trần sẽ luôn tồn tại miễn là có một phần không nhỏ trong số những người làm bài kiểm tra đạt được điểm tối đa trong bài kiểm tra.

Tuy nhiên, điều đó nói rằng, công nghệ phân tích kiểm tra đã tiến bộ một chặng đường dài vì chúng ta cần trực tiếp giải thích điểm số trên một công cụ dựa trên điểm chính xác. Bây giờ chúng ta có thể sử dụng Lý thuyết phản hồi vật phẩm để ước tính các tham số vật phẩm của từng vật phẩm và sử dụng các vật phẩm đó để xác định khả năng của chủ thể. Tất nhiên có thể vẫn có hiệu ứng trần trong một bài kiểm tra nếu chúng ta làm bài kiểm tra quá dễ dàng. Tuy nhiên, do sức mạnh của lý thuyết phản hồi vật phẩm, chúng tôi có thể đặt ít nhất một vài vật phẩm có độ khó đủ cao trong thiết bị để chỉ ngăn chặn một phần nhỏ trong dân số chạm trần.

Cảm ơn câu hỏi. Nó rất thú vị!


2

Tôi đoán một cách thô và sẵn sàng sẽ chỉ là đo lường phương sai khi quy mô tăng lên. Nếu điều này cho thấy giảm thì đây là bằng chứng cho hiệu ứng trần và nếu không thì không có hiệu ứng trần. Bạn có thể tạo sự đồng nhất của âm mưu phương sai. Thử nghiệm của Levene có thể hữu ích để xác định xem phương sai có khác nhau ở các điểm khác nhau trên thang đo hay không.


2
cảm ơn vì ý tưởng Tôi sẽ thử nó, nhưng tôi hy vọng phương sai sẽ giảm tự nhiên theo tuổi trong trường hợp này.
trần

Trần, cả câu trả lời này và bình luận của bạn dường như làm lẫn lộn hai khái niệm khác biệt. Phương sai tỷ lệ sẽ phản ánh sự phân tán của các phép đo độc lập lặp lại của một đối tượng; nó được cho là không phụ thuộc vào chủ đề nhưng có thể thay đổi theo phản ứng trung bình của chủ thể. Phương sai mà bạn và câu trả lời này đề cập đến là phương sai của phần dư hồi quy. Mặc dù chúng có liên quan, nhưng chúng không giống nhau.
whuber

@whuber cảm ơn đã chỉ ra rằng. Nhân tiện, bạn vẫn không thấy bất kỳ bằng chứng nào về hiệu ứng trần với biểu đồ và thông tin cập nhật? Tôi khá ngạc nhiên khi câu hỏi này đã thu hút hầu như không có hứng thú với nhiều câu hỏi và câu trả lời về việc phân tích dữ liệu với hiệu ứng trần.
trần

Chào. Chừng nào bạn còn âm mưu chênh lệch giữa các đối tượng khi tăng quy mô, thay vì trong các đối tượng, điều này sẽ không cho bạn biết điều gì về hiệu ứng trần? - bạn vẫn có thể sử dụng thử nghiệm của Levene để kiểm tra sự thay đổi đáng kể về phương sai khi tăng quy mô chứ? hoặc điều này chỉ được thiết kế để kiểm tra trong phạm vi thay đổi chủ đề? Chúng ta có nên sử dụng một thuật ngữ khác để mô tả sự thay đổi điểm số của những người khác nhau khi thang đo tăng lên ngoài "phương sai tỷ lệ", chẳng hạn như "Phương sai của số dư"? Thử nghiệm của levene có thể được sử dụng để chỉ ra rằng "phương sai của phần dư" là đồng nhất trên toàn thang đo
dùng45114

0

Vấn đề quan trọng trong việc quyết định liệu một cụm xung quanh điểm cao nhất hoặc thấp nhất là do hiệu ứng trần / sàn là liệu các giá trị của các trường hợp có thực sự "đại diện" cho giá trị hay không. Khi hiệu ứng trần / sàn xảy ra, một số trường hợp, mặc dù giả sử giá trị tối đa hoặc tối thiểu, thực sự cao hơn / thấp hơn giá trị tối đa hoặc tối thiểu (hãy tưởng tượng cả người lớn và trẻ em đều hoàn thành bài kiểm tra toán cực kỳ đơn giản để đo lường khả năng toán học của một người, và cả hai đều đạt 100%). Ở đây, dữ liệu được kiểm duyệt.

Một kịch bản khác cũng có thể xảy ra khi chúng ta sử dụng các thang đo giới hạn như thang đo giống Likert có giới hạn trên và dưới vốn có. Hoàn toàn có khả năng những người đạt điểm cao nhất thực sự đáng giá điểm đó và không có sự khác biệt (ví dụ như ví dụ toán học ở trên) tồn tại trong số tất cả những người đạt điểm cao nhất. Trong trường hợp như vậy, dữ liệu bị cắt ở giới hạn, không bị kiểm duyệt.

Dựa trên lý do trên, tôi nghĩ người ta nên nghĩ ra một quy trình để phù hợp với bất kỳ tập dữ liệu đã cho nào với việc cắt dữ liệu và kiểm duyệt dữ liệu. Nếu mô hình kiểm duyệt phù hợp nhất với dữ liệu, tôi nghĩ người ta có thể kết luận rằng có hiệu ứng trần / sàn.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.