Kỹ thuật khai thác dữ liệu trong chiến dịch của Obama


10

Tôi đã xem qua bài viết này về nhóm khai thác dữ liệu trong chiến dịch tái tranh cử của Obama. Thật không may, bài báo rất mờ về máy móc thực tế của các thuật toán thống kê. Tuy nhiên, nghe có vẻ như các kỹ thuật chung được biết đến trong khoa học xã hội và chính trị. Vì đây không phải là lĩnh vực chuyên môn của tôi, bất cứ ai cũng có thể chỉ cho tôi tài liệu (tổng quan) về các loại kỹ thuật này?

Câu trả lời:


16

Khu vực đó được gọi là microtargeting (nếu bạn muốn google cho nó). Các chiến dịch khá bí mật về các công cụ và quy trình của họ, vì vậy theo hiểu biết của tôi, không có nhiều công việc được công bố ngoại trừ Nhắm mục tiêu chính trị của Hal Malchow (2008) hoặc Green & Gerber (2008) Bỏ phiếu: Cách tăng tỷ lệ bỏ phiếu (các giao dịch sau nhiều hơn với các khía cạnh khoa học xã hội như những gì quảng cáo có hiệu quả và như vậy).

Về các vấn đề kỹ thuật nhiều hơn, tài liệu thậm chí còn hiếm hơn, nhưng hãy xem, ví dụ, Murray & Scime (2010) , bài phân tích chính trị của Imai & Strauss (2011) (bài đăng ) hoặc tờ Biên niên sử về thống kê ứng dụng gần đây của chúng tôi , ông Rusch, Lee, Hornik, Jank & Zeileis (2013) ( dấu ấn ). Những gì họ có đều có điểm chung là họ sử dụng các kỹ thuật khai thác dữ liệu, chủ yếu dựa trên cây.

Murray & Scime sử dụng cây phân loại tiêu chuẩn như GIỎ HÀNG.

Rusch và cộng sự. sử dụng cây phân loại, mô hình logistic và lai cây và hồi quy logistic. Họ cũng sử dụng (trong số những người khác) rừng ngẫu nhiên, mạng lưới thần kinh, máy vectơ hỗ trợ và cây hồi quy phụ gia Bayesian để so sánh với các cây lai của chúng, như được mô tả trong phần giới thiệu với bài báo . Các cây lai của chúng được thực hiện ngang bằng với các phương thức khác trên tập dữ liệu của chúng và tăng khả năng hiểu được (chúng tôi cũng chia sẻ mã và dữ liệu của chúng).

Imai & Strauss rất thú vị khi họ đưa ra một khung lý thuyết quyết định toàn diện để lập kế hoạch chiến dịch tối ưu, không chỉ là công cụ để nhắm mục tiêu vi mô như những người khác làm. Do đó, họ tập trung rất nhiều vào các khía cạnh của nghiên cứu hoạt động về cách tận dụng tối đa mọi đồng đô la được đưa vào một chiến dịch. Trong khía cạnh khuôn khổ của họ, nơi họ sử dụng các kỹ thuật thống kê để nhắm mục tiêu microtargeting và ước tính, họ lại dựa vào cây phân loại.

Vì vậy, dường như có một số sự đồng thuận rằng việc sử dụng các phương pháp dựa trên cây hoạt động tốt trong lĩnh vực này.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.