Làm thế nào để thiết kế các thí nghiệm cho Nghiên cứu thị trường (với một twist)?


8

Hãy xem xét một loại đấu giá mà bạn được giới thiệu với 1000 khách hàng tiềm năng. Dựa trên thông tin về những khách hàng tiềm năng này - tuổi, giới tính, chủng tộc, thu nhập, thành tích giáo dục và những thứ tương tự - bạn có thể 'trả giá' để đưa sản phẩm của mình đến một số phần trong số đó, nói 250. (Bỏ qua chi phí đấu thầu.) tối đa hóa cơ hội của bạn để chọn tập hợp con phù hợp, tôi có thể sẽ sử dụng một mô hình 'khả năng' được xây dựng bằng phương pháp hồi quy logistic. Tôi có thể tìm đường đi qua phần này đủ tốt.

Tuy nhiên, để xây dựng mô hình khả năng sản phẩm, tôi phải thực hiện một số nghiên cứu thị trường, thử nghiệm độ cao sản phẩm trên các đối tượng mà chúng tôi có thể tuyển dụng từ dân số nói chung. Điều này thực sự khá tốn kém. Hơn nữa, nó có lẽ nên được điều chỉnh theo nhân khẩu học của dân số mà từ đó các khách hàng tiềm năng được rút ra. Ví dụ, một thiết kế giai thừa, có thể yêu cầu chúng tôi tuyển dụng các đối tượng thử nghiệm với tỷ lệ ngang nhau giữa các cấp độ của yếu tố chủng tộc, trong thực tế, chúng ta có thể gặp rất ít người Mỹ bản địa, trong 1000 khách hàng tiềm năng, và có thể chỉ đơn giản là chọn không ném cho họ như một quy luật. (Đáng buồn nhưng là sự thật.)

Làm thế nào một thí nghiệm như vậy nên được thiết kế? Để cụ thể, các biến thiết kế là tất cả các yếu tố phân loại và thứ tự, phần đấu thầu là một tham số đầu vào (1/4 trong ví dụ được trích dẫn ở trên), cũng như số lượng đối tượng tối đa có thể được tuyển dụng. Có vẻ như có thể một số kết hợp của thiết kế thử nghiệm và lấy mẫu ngẫu nhiên có thể phù hợp, nhưng tôi cởi mở với tất cả các đề xuất và gợi ý hợp lý.

Tôi cũng cần lưu ý rằng với các kích cỡ hiệu ứng nhỏ có khả năng và các nhóm tuyển dụng mẫu nhỏ mà chúng tôi có thể đủ khả năng, không có khả năng nghiên cứu thị trường sẽ mang lại hệ số hồi quy có ý nghĩa thống kê. Và vì vậy, việc tối ưu hóa quá mức thiết kế thử nghiệm có lẽ là ngớ ngẩn, và bất kỳ thủ tục hợp lý không điên rồ nào cũng sẽ đủ.


1
Bạn có thể làm rõ các yếu tố của thí nghiệm bạn muốn thiết kế là gì? Tôi hiểu rằng bạn muốn thử nghiệm một sản phẩm trên một mẫu, nhưng cho đến nay tôi không thể thấy các thao tác thử nghiệm, ngoại trừ có thể tuyển dụng phân tầng từ các miền dân số khác nhau.
tomka

1
Vâng, theo 'thí nghiệm', ý tôi là làm thế nào để chọn nhóm tân binh. Chúng tôi có thể chọn tân binh cho (chỉ khoảng) bất kỳ sự kết hợp nào của các biến nhân khẩu học - tuổi, chủng tộc, giới tính, thành tích giáo dục, v.v. - và đây là nhiệm vụ của tôi.
shabbychef

1
Lý do chính của bạn không sử dụng một mẫu xác suất đơn giản từ dân số với n = 1000 là gì?
tomka

1
Do hạn chế về ngân sách, số lượng người được tuyển dụng mà chúng tôi có thể lấy mẫu nhỏ hơn nhiều - theo thứ tự 50. Đối với kích thước và số lượng biến thiết kế này, một mẫu ngẫu nhiên sẽ không 'đại diện' do lỗi lấy mẫu. Tôi hy vọng một thiết kế thử nghiệm sẽ tốt hơn.
shabbychef

2
Tôi nghĩ rằng bạn có thể đang tìm kiếm một mẫu phân tầng cho một số nhóm, nhưng đây không phải là một thử nghiệm. Ý tưởng sẽ là đảm bảo tất cả các nhóm có liên quan đều có mặt trong tập dữ liệu của bạn và sau đó sử dụng trọng số thiết kế cho dân số. Tuy nhiên, n = 50 có lẽ quá nhỏ để phân tầng cho tất cả các nhân khẩu học xã hội mà bạn đề cập. Ngoài ra lỗi lấy mẫu có thể phá vỡ chất lượng dự đoán của bạn, ngay cả khi kích thước liên kết / hiệu ứng sẽ mạnh.
tomka

Câu trả lời:


4

Một cách tiếp cận vấn đề của bạn là sử dụng một mẫu phân tầng. Một mục đích của phân tầng là đảm bảo các miền (nhóm) nhất định của dân số được thể hiện trong mẫu, nếu không sẽ được biểu diễn quá thưa thớt cho suy luận hợp lệ, ví dụ do xác suất lựa chọn nhỏ.

Ví dụ: nếu "Người Mỹ bản địa" là một nhóm quan trọng theo ước tính của bạn từ 'mô hình khả năng', nhưng xác suất lựa chọn của họ là rất nhỏ, một mẫu ngẫu nhiên đơn giản (SRS) có kích thước có thể không chứa hoặc chỉ rất vài đơn vị thuộc loại này. Nếu bạn bao gồm Nat. Là. là một biến chỉ báo trong mô hình, các ước tính có thể sẽ cực kỳ không đáng tin cậy (lỗi tiêu chuẩn lớn) hoặc các tham số không thể ước tính được. Mục tiêu của một mẫu phân tầng là để tránh điều này.n=50

Sự phân tầng có nghĩa là chọn các đơn vị có xác suất cao hơn mức chúng có trong SRS. Khi ước tính hồi quy logistic / đa thức của bạn, bạn sẽ có thể sử dụng trọng số phân tầng (trọng số thiết kế) để điều chỉnh cho xác suất lựa chọn cao hơn. Trọng số sau đó thường được định nghĩa là trong đó là xác suất lựa chọn trong mẫu phân tầng và là xác suất lựa chọn khi sử dụng SRS.πsπpop

wi=πsπpop,
πsπpop

Vấn đề trong ứng dụng cụ thể của bạn là có thể bạn không thể phân tầng cho tất cả các đặc điểm bạn đề cập, với kích thước mẫu nhỏ (giả sử ). Trong phân tầng, bạn thường cần phải vượt qua tất cả các đặc tính và mẫu từ tất cả các ô của bảng dự phòng kết quả. Số lượng tế bào tăng nhanh với số lượng đặc điểm và chủng loại của từng đặc điểm và tại một thời điểm phức tạp, không thể lấp đầy tất cả các ô đủ với cố định .n = 50n=50n=50

Do đó, lời khuyên của tôi là xem xét các đặc điểm của bạn và đưa ra lựa chọn như sau. Trước tiên, hãy lập danh sách tất cả các đặc điểm mà bạn muốn có trong mô hình cuối cùng, bởi vì bạn cho rằng chúng sẽ có sức mạnh dự đoán về 'khả năng' hoặc chúng xác định các nhóm quan trọng trong 'quy trình đặt giá thầu'. Thứ hai, từ những đặc điểm này, phân biệt giữa những đặc điểm có nghĩa là xác suất lựa chọn cao và thấp trong quá trình lấy mẫu. Xác suất lựa chọn thấp là một xác suất có thể sẽ cung cấp cho bạn quá ít quan sát trong một trong các loại được cung cấp mẫu SRS có kích thước .n

Ví dụ: 'giới tính' thường sẽ là một biến được thể hiện tốt với xác suất 50/50 trong pop. Vì vậy, ngay cả khi bạn sẽ có cả nam và nữ 'đủ', nhưng Nat. Là. có thể không phải là một biến của loại này, nhưng vẫn quan trọng đối với mô hình của bạn. Một phân tích công suất có thể cung cấp hướng dẫn thêm nếu cần, nhưng nó phụ thuộc vào mô hình cụ thể và có thể rất phức tạp đối với hồi quy đa hình.n=50

Các đặc điểm với xác suất lựa chọn quá thấp là các ứng cử viên cho phân tầng, trong khi các biến có xác suất lựa chọn đủ cao / cân bằng trong các danh mục của chúng có thể bị bỏ qua trong thiết kế lấy mẫu. Bây giờ bạn đã xác định được các tầng quan trọng cho dân số và mô hình của mình , bạn có thể xây dựng chiến lược thiết kế lấy mẫu trên chúng (tức là lấy mẫu ngẫu nhiên từ tất cả các tầng có liên quan để lấp đầy tất cả các 'ô').

Tôi hy vọng rằng khi làm điều này, bạn sẽ kết thúc với một vài tầng đủ để đi trước với một mẫu có kích thước .n=50


Điều này giúp tôi đi một chặng đường dài tới nơi tôi cần đến. cảm ơn nhiều!
shabbychef
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.