Phân phối lỗi xung quanh dữ liệu tăng trưởng logistic là gì?


10

Trong sinh thái học, chúng ta thường sử dụng phương trình tăng trưởng logistic:

Nt=KN0ertK+N0ert1

hoặc là

Nt=KN0N0+(KN0)ert

Trong đó là khả năng mang (mật độ tối đa đạt được), N 0 là mật độ ban đầu, r là tốc độ tăng trưởng, t là thời gian kể từ ban đầu.KN0rt

Giá trị của có giới hạn trên mềm ( K ) và giới hạn dưới ( N 0 ) , với giới hạn dưới mạnh ở 0 .Nt(K)(N0)0

Hơn nữa, trong bối cảnh cụ thể của tôi, các phép đo được thực hiện bằng mật độ quang hoặc huỳnh quang, cả hai đều có cực đại lý thuyết, và do đó giới hạn trên mạnh mẽ.Nt

Do đó, lỗi xung quanh có lẽ được mô tả tốt nhất bởi phân phối giới hạn.Nt

Ở các giá trị nhỏ của , phân phối có thể có độ lệch dương mạnh, trong khi tại các giá trị của N t tiếp cận K, phân phối có thể có độ lệch âm mạnh. Do đó, phân phối có thể có một tham số hình dạng có thể được liên kết với N t .NtNtNt

Phương sai cũng có thể tăng với .Nt

Dưới đây là một ví dụ đồ họa

nhập mô tả hình ảnh ở đây

với

K<-0.8
r<-1
N0<-0.01
t<-1:10
max<-1

có thể được sản xuất trong r với

library(devtools)
source_url("https://raw.github.com/edielivon/Useful-R-functions/master/Growth%20curves/example%20plot.R")
  • Điều gì sẽ là phân phối lỗi lý thuyết xung quanh (xem xét cả mô hình và thông tin thực nghiệm được cung cấp)?Nt

  • NtNt

  • R

Các hướng khám phá cho đến nay:

  • NtK
  • Nt/max
  • Nt/max

1
KrNtt

@whuber, tôi đã cố gắng giải quyết một số ý kiến ​​của bạn trong một chỉnh sửa gần đây.
Etienne Low-Décarie

1
5 nghĩ rằng nếu bạn có thể mô tả các thuộc tính của phân phối tiếng ồn theo cách bạn có thì bạn có thể chọn một dạng tham số với các thuộc tính đó. Tôi nghĩ để tóm tắt gia đình phải 1. được xác định trên một khoảng hữu hạn, 2. cho phép nghiêng trái, lệch phải và đối xứng. và 3. có phương sai tăng khi Nt tăng. Phân phối beta phù hợp với hóa đơn cho 1 và 2. Khoảng cố định là [0, 1]. Vì vậy, để cho phép phương sai tăng, chúng ta có thể thêm một tham số c để phân phối phân phối cho intervsl [0, c].
Michael R. Chernick

Câu trả lời:


3

Như Michael Chernick đã chỉ ra, bản phân phối beta được chia tỷ lệ có ý nghĩa tốt nhất cho việc này. Tuy nhiên, cho tất cả các mục đích thực tế và hy vọng rằng bạn sẽ KHÔNG BAO GIỜlàm cho mô hình hoàn toàn đúng, bạn sẽ tốt hơn nếu chỉ mô hình hóa giá trị trung bình thông qua hồi quy phi tuyến theo phương trình tăng trưởng logistic của bạn và kết hợp điều này với các lỗi tiêu chuẩn mạnh mẽ đối với tính không đồng nhất. Đặt điều này vào bối cảnh khả năng tối đa sẽ tạo ra một cảm giác sai lầm về độ chính xác tuyệt vời. Nếu lý thuyết sinh thái sẽ tạo ra một phân phối, bạn nên phù hợp với phân phối đó. Nếu lý thuyết của bạn chỉ đưa ra dự đoán cho giá trị trung bình, bạn nên tuân theo cách giải thích này và đừng cố gắng đưa ra bất kỳ điều gì hơn thế, như phân phối toàn diện. (Hệ thống đường cong của Pearson chắc chắn đã được ưa thích từ 100 năm trước, nhưng các quá trình ngẫu nhiên không tuân theo các phương trình vi phân để tạo ra các đường cong mật độ, đó là động lực của ông với các đường cong mật độ này - đúng hơn là,Ntphải có một giới hạn trên; Tôi muốn nói rằng lỗi đo lường được thiết bị của bạn giới thiệu trở nên nghiêm trọng khi quá trình đạt đến giới hạn trên của việc được đo chính xác một cách hợp lý. Nếu bạn kết hợp phép đo với quy trình cơ bản, bạn sẽ nhận ra điều đó một cách rõ ràng, nhưng tôi sẽ tưởng tượng bạn có mối quan tâm lớn hơn đến quy trình hơn là mô tả cách thức thiết bị của bạn hoạt động. (Quá trình sẽ có 10 năm kể từ bây giờ; các thiết bị đo lường mới có thể có sẵn, vì vậy công việc của bạn sẽ trở nên lỗi thời.)


Cảm ơn nhiều! Tôi đồng ý rằng một sự tách biệt của quá trình và biện pháp là thú vị. Tuy nhiên, tôi muốn đề xuất rằng hầu hết các phương pháp đo có giới hạn trên mạnh mẽ này, nhưng điều quan trọng là phải cách ly điều này. Nếu tôi sử dụng bản beta được chia tỷ lệ, bất chấp cảnh báo của bạn về độ tin cậy phù hợp với MLE, bạn có đề xuất nào về cách liên kết các tham số hình dạng với hệ thống này để mô hình các biến để cho phép MLE không?
Etienne Low-Décarie

Nếu bạn tin chắc rằng ranh giới của bạn thực sự quan trọng trong ứng dụng của bạn, bạn có thể chỉ cần sử dụng bản beta được chia tỷ lệ này. Tất cả những gì tôi đang nói là tôi không bị thuyết phục. Có các mô hình cho dữ liệu bị cắt bớt, trong đó tất cả những gì bạn biết là giá trị thực vượt quá mức tối đa bạn có thể đo được; đôi khi chúng được sử dụng cùng với mã hóa thu nhập hàng đầu, trong khi vì lý do bảo mật, thu nhập lớn hơn 100 triệu USD / năm được rút ngắn xuống còn 100 nghìn USD / năm.
StasK

1

@whuber là chính xác rằng không có mối quan hệ cần thiết của phần cấu trúc của mô hình này với việc phân phối các thuật ngữ lỗi. Vì vậy, không có câu trả lời cho câu hỏi của bạn cho phân phối lỗi lý thuyết.

Điều này không có nghĩa là nó không phải là một câu hỏi hay - chỉ là câu trả lời sẽ chủ yếu dựa trên kinh nghiệm.

Bạn dường như đang cho rằng sự ngẫu nhiên là phụ gia. Tôi thấy không có lý do (ngoài sự thuận tiện tính toán) cho trường hợp này. Là một sự thay thế mà có một yếu tố ngẫu nhiên ở một nơi khác trong mô hình? Ví dụ, xem phần sau đây, trong đó tính ngẫu nhiên được giới thiệu là Thông thường được phân phối với giá trị trung bình là 1, phương sai là điều duy nhất để ước tính. Tôi không có lý do để nghĩ rằng đây là điều đúng đắn để làm khác hơn là nó tạo ra kết quả hợp lý dường như phù hợp với những gì bạn muốn thấy. Liệu nó có thực tế hay không khi sử dụng một cái gì đó như thế này làm cơ sở để ước tính một mô hình mà tôi không biết.

loggrowth <- function(K, N, r, time, rand=1){
    K*N*exp(rand*r*time)/(K+N*exp(rand*r*time-1)))}

plot(1:100, loggrowth(100,20,.08,1:100, rnorm(100,1,0.1)), 
    type="p", ylab="", xlab="time")
lines(1:100, loggrowth(100,20,.08,1:100))

nhập mô tả hình ảnh ở đây


Trong trường hợp này, bạn có thể có các giá trị Nt dưới 0 và trên ranh giới trên cứng. Hơn nữa, tiếng ồn được dự kiến ​​trong tất cả các tham số (không nhất thiết là trong sản phẩm của một tham số theo thời gian), do đó nhiễu trên biến phản ứng. Tôi vẫn sẽ quan tâm đến việc giải thích khả năng tối đa của cách tiếp cận của bạn.
Etienne Low-Décarie

Điều này không cho phép phân phối bị giới hạn cho mỗi Nt và không cho phép thành phần nhiễu bị lệch. Tôi không biết ý tưởng của tôi về phân phối beta được chia tỷ lệ đã được sử dụng trong tài liệu hay chưa nhưng nó đáp ứng tốt các hạn chế. Tôi đã không thử nó nhưng có lẽ khả năng tối đa có thể được thử. Tôi không chắc chắn nhưng có lẽ sẽ có vấn đề nếu c được bao gồm trong ước tính khả năng. Có lẽ c có thể được ước tính riêng chỉ dựa trên Nt và sau đó phần còn lại của mô hình có thể phù hợp với khả năng tối đa cho mỗi Nt cố định.
Michael R. Chernick

Tôi chỉ đang suy nghĩ thành tiếng. Có ai nghĩ rằng vấn đề này có thể được biến thành một bài nghiên cứu tốt?
Michael R. Chernick

Một bài báo từ năm 1966 đã xem xét điều này một chút, tuy nhiên tôi chưa thấy một bài nào gần đây. Tôi có thể mọi thứ đã thay đổi kể từ khi? jstor.org/discover/10.2307/ Mạnh
Etienne Low-Décarie

Xin vui lòng cho tôi biết nếu bạn quyết định đi tuyến đường này.
Etienne Low-Décarie
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.