Nối một dòng vào một biểu đồ log-log

Tôi có một số dữ liệu mà tôi đang chơi xung quanh; Để đơn giản, giả sử dữ liệu chứa thông tin về số lượng bài đăng mà một blogger đã viết so với số người đã đăng ký vào blog của người đó (đây chỉ là một ví dụ trang điểm).

Tôi muốn có được một số mô hình sơ bộ về mối quan hệ giữa # bài đăng so với # người đăng ký và khi xem biểu đồ log-log, tôi thấy như sau:

nhập mô tả hình ảnh ở đây

Điều này trông giống như một mối quan hệ tuyến tính thô (trên thang đo log-log) và nhanh chóng kiểm tra các phần dư dường như đồng ý (không có mẫu rõ ràng, không có độ lệch đáng chú ý so với phân phối bình thường):

nhập mô tả hình ảnh ở đây

Vì vậy, câu hỏi của tôi là: sử dụng mô hình tuyến tính này có ổn không? Tôi mơ hồ biết rằng có những vấn đề khi sử dụng hồi quy tuyến tính trên các lô log-log để ước tính phân phối luật công suất, nhưng dữ liệu của tôi không phải là phân phối xác suất theo luật công suất (đơn giản là thứ gì đó dường như theo dõi model, đặc biệt, không có gì cần tổng hợp thành 1), vì vậy tôi không chắc liệu các bài phê bình tương tự có được áp dụng hay không. (Có lẽ tôi đã sửa quá nhiều khi đề cập đến "log-log" và "hồi quy tuyến tính" trong cùng một câu ...) Ngoài ra, tất cả những gì tôi thực sự cố gắng là: $subscribers = A * (postings) ^ k$

Xem nếu có bất kỳ mẫu nào cho các blog có số dư dương so với các blog có số dư âm
Đề xuất một số mô hình sơ bộ về cách người đăng ký có liên quan đến số lượng bài đăng.

regression power-law

— raegtin
nguồn

bạn nên luôn luôn mệt mỏi với hồi quy tuyến tính trên các lô log-log vì các dao động ở đuôi có ý nghĩa hơn rất nhiều ... bài đăng tôi liên kết nên có một số mã R và Matlab có thể hữu ích.

— Artem Kaznatcheev

Không có gì sai với hồi quy log-log và các nhà kinh tế đã sử dụng chúng từ lâu để ước tính độ co giãn. Tuy nhiên, nếu bạn muốn cho phép hiệu ứng luật điện nhưng không muốn làm phiền quá nhiều, bạn có thể áp dụng cách hiệu chỉnh đơn giản này: http : // vá.ssrn.com / sol3 / con.cfm? Abauge_id = 881759

— Alex
nguồn