Tôi đang cố gắng tìm một công thức, phương pháp hoặc mô hình để sử dụng để phân tích khả năng một sự kiện cụ thể ảnh hưởng đến một số dữ liệu theo chiều dọc. Tôi đang gặp khó khăn trong việc tìm ra những gì cần tìm kiếm trên Google.
Đây là một kịch bản ví dụ:
Hình ảnh bạn sở hữu một doanh nghiệp có trung bình 100 khách hàng đi bộ mỗi ngày. Một ngày nọ, bạn quyết định bạn muốn tăng số lượng khách hàng đi bộ đến cửa hàng của bạn mỗi ngày, vì vậy bạn kéo một người đóng thế điên rồ bên ngoài cửa hàng của bạn để gây chú ý. Trong tuần tới, bạn thấy trung bình 125 khách hàng mỗi ngày.
Trong vài tháng tới, một lần nữa bạn quyết định rằng bạn muốn có thêm một số doanh nghiệp và có thể duy trì nó lâu hơn một chút, vì vậy bạn thử một số điều ngẫu nhiên khác để có thêm khách hàng trong cửa hàng của mình. Thật không may, bạn không phải là nhà tiếp thị tốt nhất và một số chiến thuật của bạn có ít hoặc không có tác dụng, và những người khác thậm chí có tác động tiêu cực.
Phương pháp nào tôi có thể sử dụng để xác định xác suất rằng bất kỳ một sự kiện riêng lẻ nào ảnh hưởng tích cực hoặc tiêu cực đến số lượng khách hàng đi bộ? Tôi hoàn toàn biết rằng mối tương quan không nhất thiết là quan hệ nhân quả như nhau, nhưng tôi có thể sử dụng phương pháp nào để xác định khả năng tăng hoặc giảm trong việc đi bộ hàng ngày của doanh nghiệp của bạn trong một sự kiện cụ thể?
Tôi không quan tâm đến việc phân tích xem liệu có sự tương quan giữa các nỗ lực của bạn để tăng số lượng khách hàng đi bộ hay không, mà là liệu có một sự kiện nào, độc lập với tất cả các sự kiện khác hay không, có ảnh hưởng hay không.
Tôi nhận ra rằng ví dụ này khá giả tạo và đơn giản, vì vậy tôi cũng sẽ cung cấp cho bạn một mô tả ngắn gọn về dữ liệu thực tế mà tôi đang sử dụng:
Tôi đang cố gắng xác định tác động của một cơ quan tiếp thị cụ thể đối với trang web của khách hàng của họ khi họ xuất bản nội dung mới, thực hiện các chiến dịch truyền thông xã hội, v.v. Đối với bất kỳ một cơ quan cụ thể nào, họ có thể có từ 1 đến 500 khách hàng. Mỗi khách hàng có các trang web có kích thước từ 5 trang đến hơn 1 triệu. Trong 5 năm qua, mỗi cơ quan đã chú thích tất cả công việc của họ cho từng khách hàng, bao gồm loại công việc đã được thực hiện, số lượng trang web trên một trang web bị ảnh hưởng, số giờ đã sử dụng, v.v.
Sử dụng dữ liệu trên mà tôi đã tập hợp vào một kho dữ liệu (được đặt trong một loạt các lược đồ sao / bông tuyết), tôi cần xác định khả năng một tác phẩm (bất kỳ một sự kiện nào trong thời gian) có ảnh hưởng đến lưu lượng truy cập vào bất kỳ / tất cả các trang bị ảnh hưởng bởi một phần công việc cụ thể. Tôi đã tạo các mô hình cho 40 loại nội dung khác nhau được tìm thấy trên một trang web mô tả mẫu lưu lượng truy cập điển hình mà một trang có loại nội dung nói trên có thể trải nghiệm từ ngày ra mắt cho đến hiện tại. Chuẩn hóa so với mô hình phù hợp, tôi cần xác định số lượng khách truy cập tăng hoặc giảm cao nhất và thấp nhất mà một trang cụ thể nhận được do kết quả của một tác phẩm cụ thể.
Mặc dù tôi có kinh nghiệm về phân tích dữ liệu cơ bản (hồi quy tuyến tính và đa biến, tương quan, v.v.), tôi không biết làm thế nào để tiếp cận giải quyết vấn đề này. Trong khi trước đây tôi thường phân tích dữ liệu bằng nhiều phép đo cho một trục nhất định (ví dụ nhiệt độ so với khát với động vật và xác định tác động đối với cơn khát tăng nhiệt độ ở động vật), tôi cảm thấy rằng ở trên, tôi đang cố gắng phân tích tác động của một sự kiện duy nhất tại một thời điểm nào đó cho một bộ dữ liệu theo chiều dọc, nhưng có thể dự đoán được (hoặc ít nhất là có thể mô hình hóa). Tôi bối rối :(
Bất kỳ trợ giúp, mẹo, gợi ý, khuyến nghị hoặc hướng dẫn sẽ vô cùng hữu ích và tôi sẽ biết ơn mãi mãi!