Kỹ thuật giảm kích thước cho cỡ mẫu rất nhỏ


8

Tôi có 21 biến số vĩ mô kinh tế xã hội và thái độ (như tỷ lệ bà mẹ trong độ tuổi 24-54 không có việc làm, tỷ lệ trẻ em 3-5 tuổi ở trường mẫu giáo, v.v.). Tôi cũng có dữ liệu về tỷ lệ ông bà cung cấp dịch vụ chăm sóc trẻ chuyên sâu. Hầu hết các biến số kinh tế xã hội mà tôi chọn có mối tương quan cao với việc cung cấp dịch vụ chăm sóc trẻ em (ví dụ, có một mối tương quan nghịch giữa tỷ lệ bà mẹ làm việc bán thời gian và cung cấp dịch vụ chăm sóc ông bà).

Lý tưởng nhất, tôi muốn tạo ra một kiểu chữ của các loại quốc gia khác nhau. Hy vọng của tôi sẽ là sử dụng một số loại kỹ thuật giảm kích thước mà các thành phần hoặc yếu tố của nó sẽ có ý nghĩa trực quan (ví dụ: thái độ đối với gia đình và giới tính, cấu trúc thị trường lao động, chính sách gia đình). Hoặc, thay vào đó, đánh giá trong số 21 chỉ số cấp vĩ mô giải thích rõ nhất sự thay đổi trong cung cấp chăm sóc trẻ em giữa các quốc gia.

Vấn đề chính của tôi là tôi chỉ có 12 nước châu Âu. Tôi cho rằng PCA và phân tích nhân tố không phải là kỹ thuật phù hợp với rất ít trường hợp. Tôi có đúng không? Tôi được yêu cầu thử sử dụng phân tích so sánh định tính hoặc phân tích tương ứng, mặc dù theo hiểu biết của tôi, các kỹ thuật sau phù hợp hơn với các chỉ số cấp vĩ mô nhị phân (hoặc phân loại) (trong khi của tôi là tỷ lệ phần trăm hoặc biến liên tục).


2
Bởi vì bạn muốn một kiểu chữ, điều này nghe giống như một vấn đề phân tích cụm hơn là giảm kích thước. Với dữ liệu hạn chế của bạn, bạn có thể sử dụng điều đó và một vài cốt truyện cơ bản để kể câu chuyện - nhưng bạn gần như tham gia vào các phương pháp nghiên cứu định tính hơn là định lượng ở đây.
Peter Ellis

Cảm ơn. Tôi đã nghĩ về phân tích cụm là tốt mặc dù vấn đề có rất nhiều biến và rất ít trường hợp vẫn còn. Tôi đoán tôi sẽ bám vào những âm mưu cơ bản sau đó và thuyết phục sếp rằng không có gì thú vị hơn để thực hiện (như tôi luôn nghi ngờ bí mật).
Giorgio

1
Tôi nghĩ @PeterEllis nói đúng về những điều bạn muốn làm. Tuy nhiên, bạn có thể thực hiện PCA và FA trên các tập dữ liệu nhỏ. Cả hai phương pháp này phụ thuộc vào mối tương quan và mối tương quan là hợp lệ, thậm chí với 12 quan sát. Tuy nhiên, mối tương quan có thể không được ước tính rất tốt.
Peter Flom

Câu trả lời:


5

Như nhận xét / câu trả lời của Peter Ellis cho thấy bạn đang nói về việc giảm kích thước và không giảm dữ liệu. Bạn đã thay đổi số lượng điểm dữ liệu chỉ bằng kích thước của không gian của hiệp phương sai. Bây giờ Peter Flom đã đúng rằng các phương pháp PCA và FA có thể được thử với các cỡ mẫu nhỏ nhưng nó không chỉ là mối tương quan có thể được ước tính kém mà còn có thể bạn bị lừa rơi vào kích thước quá thấp vì các tính năng có thể xuất hiện nhiều hơn tương quan cao hơn so với họ hóa ra là với một mẫu lớn hơn. Tôi sẽ không khuyên bạn nên nó.


1
Cảm ơn. Xin lỗi, tôi có nghĩa là thực sự giảm kích thước! Ngoài ra, tôi đồng ý rằng PCA và FA là tốt nhất nên tránh chỉ với 12 trường hợp.
Giorgio

1
+1 để chỉ ra rằng, với kích thước mẫu rất nhỏ, tương quan mẫu thường khá cao. Một ví dụ cực đoan, nếu , bạn có cơ hội rất tốt để có được mối tương quan gần như hoàn hảo. Gõ liên tục trong sẽ tiết lộ rằng. Ngoài ra, tôi nhận thấy bạn đã xem lại một chỉnh sửa ngày hôm nay - cảm ơn vì đã tham gia! n=3cor( rnorm(3), rnorm(3) )R
Macro

@Macro và với n = 2 tương quan +1 hoặc -1 được đảm bảo.
Michael R. Chernick

5

Tôi sẽ đi phân tích đồng quán tính, đó là một biến thể không thể nói của phân tích kinh điển . Điều này sẽ cung cấp cho bạn một tổ hợp tuyến tính gồm 21 biến có quán tính cao nhất với sự kết hợp tuyến tính của dữ liệu chăm sóc trẻ em (hoặc với chăm sóc trẻ em nếu đó là một biến định lượng duy nhất). Thủ thuật làm việc với co-quán tính thay vì tương quan là bạn vẫn có thể thực hiện các tính toán khi có nhiều biến hơn quan sát.

Thật không may, CIA không lan rộng. Nó được phát triển cho hệ sinh thái, nơi thường có nhiều biến hơn các vị trí quan sát. Bạn có thể tìm thấy một số thông tin kỹ thuật trong Dray, Chessel và Thioulouse, Sinh thái 84 (11), 3078-89, 2003 .

Điều đó nói rằng, các ý kiến ​​/ câu trả lời khác đều đúng rằng 12 là một con số tương đối nhỏ và bạn sẽ phải sống với điều đó ...


Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.