Báo cáo kết quả phù hợp với đường cong trong một bài báo khoa học


11

(Tôi hy vọng câu hỏi này phù hợp với trang web này; nếu không, hãy chấp nhận lời xin lỗi của tôi).

Tôi đã chạy một mô phỏng nhất định và có một chuỗi thời gian y (t), t = 0, 1, ... 20. Sau khi thử một số chức năng, tôi thấy rằng:

y(t) =~ 1 / (A t + B)

Trong đó A và B là các hệ số tôi đã tính bằng phương pháp hồi quy tuyến tính, với R ^ 2> 0,99.

Cách tiêu chuẩn để báo cáo kết quả như vậy trong một bài báo khoa học là gì? Đặc biệt:

A. Tôi không có lời giải thích lý thuyết, tại sao đầu ra trông như thế này (tôi biết nó sẽ giảm và nó bị giới hạn từ bên dưới, nhưng không nhiều hơn nữa). Đó chỉ là một phỏng đoán thành công. Tôi có nên mô tả tất cả các dự đoán không thành công khác mà tôi đã thử không?

B. Bất cứ khi nào tôi chạy mô phỏng, tôi nhận được các giá trị hơi khác nhau của A và B. Tôi chỉ nên báo cáo một lần chạy ngẫu nhiên, hay tôi nên chạy mô phỏng nhiều lần và tính trung bình các kết quả? Nếu vậy, bao nhiêu lần là đủ?


Bạn muốn truyền đạt điều gì? Mỗi mô phỏng cá nhân đại diện cho những gì?
Bill Barth

Đó là một mô phỏng của quyền sở hữu đất đai. Có N công dân và N lô đất. Ban đầu, mỗi lô đất được trao cho một công dân ngẫu nhiên. Sau đó, mỗi năm, mỗi vùng đất được bán với xác suất p nhất định và nếu thực sự được bán, người mua được chọn ngẫu nhiên. Sau 50 năm, tôi thực hiện thủ tục "Hân hoan" nơi một số đất được trả lại cho chủ sở hữu ban đầu, nếu những chủ sở hữu này hiện không có đất. Tôi đo số lượng công dân không có đất (y) sau mỗi Năm Thánh (t). Chắc chắn y (t) không tăng. Tôi muốn chứng minh rằng nó đang giảm theo tỷ lệ có thể dự đoán được và nó hội tụ về 0.
Erel Segal-Halevi

AB

2
xnn=0Nn

Bill: bạn có nghĩa là tôi nên tính A và B nhiều lần, sau đó báo cáo trung bình và tiêu chuẩn? Tôi nghĩ rằng một cách tiếp cận tốt hơn là thực hiện một hồi quy tuyến tính duy nhất với tất cả các mẫu từ tất cả các mô phỏng. Nhưng bao nhiêu lần tôi nên chạy mô phỏng?
Erel Segal-Halevi

Câu trả lời:


5

Bạn đang cố gắng để phù hợp với một luật quyền lực để phân phối của bạn. Rất thú vị. Chúng xuất hiện tất cả thời gian trong lý thuyết đồ thị , mạng xã hội và một loạt các nơi khác.

Có một số hướng dẫn về việc phù hợp với dữ liệu của bạn ở đâyở đây .

Ngoài ra, liên quan đến câu hỏi A., xác suất một người mua đất phụ thuộc vào bao nhiêu đất họ đã có? Bạn có thể sử dụng mô hình của Barbasi để giải thích tại sao luật công suất phù hợp với dữ liệu của bạn.

cập nhật: Tôi đã sử dụng cái này và nó hoạt động rất tốt: https://pypi.python.org/pypi/powerlaw


+1 cho tất cả các liên kết! Tôi cũng đã nghĩ về luật công suất, nhưng nó là dạng đơn giản (y = A t ^ k) không đòi hỏi dạng tôi tìm thấy, vì hằng số B (y = (A t + B) ^ - 1). Có một hình thức tổng quát hơn?
Erel Segal-Halevi

Nếu bạn quan tâm đến việc mô tả hình dạng của đường cong thì bạn nên tính và dịch chuyển trước khi phù hợp với một định luật lũy thừa. Thực tế là bạn có B không liên quan đến hình dạng của đường cong.
dranxo

Xin lỗi, tôi không hiểu bạn, ý bạn là gì khi "bạn nên yếu tố và thay đổi"?
Erel Segal-Halevi

Đặt x = t + B / A. Sau đó (At + B) ^ {- 1} = (A * x) ^ {- 1} là hình thức trong các liên kết.
dranxo

1
tuvalu.santafe.edu/~aaronc/cifts/7000/csci7000-001_2011_L3.pdf
dranxo

7

Một vài suy nghĩ về câu hỏi của bạn:

  • Cách bạn báo cáo mô hình phù hợp sẽ phụ thuộc rất nhiều vào đối tượng và lĩnh vực của bạn. Ví dụ, trong lĩnh vực của tôi, số liệu thống kê phù hợp mô hình như R ^ 2 rất hiếm khi được báo cáo - được coi là không ấn tượng cũng không đặc biệt hữu ích. Thay vào đó, một số tiêu chí cho cách bạn đến với mô hình mà bạn đã đến có xu hướng được mô tả và sau đó bạn báo cáo kết quả mô hình của mình - tất cả chúng tôi đều cho rằng bạn thực sự phù hợp với mô hình.
  • "Tôi đã xảy ra trên mẫu này" là một lời giải thích tồi. Một thực sự xấu. Mặc dù rất thích những câu chuyện về thiên tài tình cờ, như việc phát hiện ra penicillin hay quinine, "may mắn câm mù" không phải là một quá trình khoa học đáng tin cậy. Ví dụ, bạn đã chỉ ra rằng hình thức đó phù hợp với dữ liệu của bạn, nhưng bạn chưa thể hiện nó phù hợp nhất với dữ liệu của bạn. Chỉ riêng R ^ 2 không phải là một số liệu đủ để đánh giá mức độ phù hợp với mô hình của bạn. Xem bộ tứ của Anscombe .
  • Như @rcompton đã đề cập, có vẻ như bạn đang cố gắng phù hợp với phân phối luật quyền lực mà không biết, nhưng ngay cả khi bạn quản lý để phù hợp với luật quyền lực, thì thực sự tốt nhất nếu bạn tìm thấy lý do tại sao bạn nghĩ đó là luật quyền lực . Nó có thể đủ để âm mưu Y theo thời gian, đi qua CrossValidated (hoặc một trường đại học / khoa thoải mái hơn với các số liệu thống kê) và đi qua các hệ thống phân phối có thể mang lại cho bạn cái nhìn gần như vậy. Có những người khác ngoài việc phân phối luật quyền lực có thể cung cấp cho bạn một sự phù hợp vượt trội.

+1 cho những hiểu biết. "có hệ thống đi qua các bản phân phối có thể cung cấp cho bạn cái nhìn đại khái." - tôi có thể tìm những thứ này ở đâu?
Erel Segal-Halevi

@ErelSegalHalevi Bạn có thể bắt đầu tại CrossValidated, trang web chị em này liên quan đến thống kê và phân tích dữ liệu.
Fomite
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.