kiểm tra thống kê để xem mối quan hệ là tuyến tính hay phi tuyến tính


9

Tôi có một tập dữ liệu mẫu như sau:

Volume <- seq(1,20,0.1)
var1 <- 100 
x2 <- 1000000
x3 <- 30

x4 = sqrt(x2/pi)
H = x3 - Volume
r = (x4*H)/(H + Volume)

Power = (var1*x2)/(100*(pi*Volume/3)*(x4*x4 + x4*r + r*r))

Power <- jitter(Power, factor = 1, amount = 0.1)
plot(Volume,Power)

nhập mô tả hình ảnh ở đây

Từ hình vẽ, có thể gợi ý rằng giữa một phạm vi 'Âm lượng' và 'Sức mạnh' nhất định, mối quan hệ là tuyến tính, khi đó, 'Âm lượng' trở nên tương đối nhỏ, mối quan hệ trở nên phi tuyến tính. Có một bài kiểm tra thống kê để minh họa điều này?

Liên quan đến một số khuyến nghị được thể hiện trong các phản hồi cho OP:

Ví dụ hiển thị ở đây chỉ đơn giản là một ví dụ, bộ dữ liệu tôi có vẻ tương tự như mối quan hệ được thấy ở đây mặc dù ồn ào hơn. Phân tích mà tôi đã tiến hành cho đến nay cho thấy khi tôi phân tích một thể tích của một chất lỏng cụ thể, công suất của tín hiệu tăng mạnh khi có âm lượng thấp. Vì vậy, giả sử tôi chỉ có một môi trường mà âm lượng nằm trong khoảng từ 15 đến 20, nó gần như trông giống như một mối quan hệ tuyến tính. Tuy nhiên, bằng cách tăng phạm vi điểm tức là có khối lượng nhỏ hơn, chúng tôi thấy rằng mối quan hệ hoàn toàn không tuyến tính. Bây giờ tôi đang tìm kiếm một số lời khuyên thống kê về cách thống kê cho thấy điều này. Hy vọng điều này có ý nghĩa.


5
Có một vài điều đang diễn ra ở đây. Đầu tiên, tất nhiên một mối quan hệ sẽ trông tuyến tính với điều kiện phạm vi của các biến được giới hạn phù hợp. Thứ hai, tính không đồng nhất của dữ liệu gần như là một đặc điểm nổi bật như mối quan hệ phi tuyến tính: sự phân tán lớn hơn ở khối lượng cao và công suất thấp so với khối lượng thấp và công suất cao. Bất kể, chính xác những gì bạn muốn kiểm tra? Tính tuyến tính của mối quan hệ trên toàn bộ phạm vi?
whuber

4
Trên thực tế, tôi muốn lấy lại nhận xét về tính không đồng nhất: cốt truyện mang đến vẻ ngoài như vậy, nhưng đó chỉ là ảo ảnh gây ra bởi các sườn dốc tương đối ở âm lượng thấp hơn. (Tuy nhiên, về mặt sức mạnh có mối quan hệ cực kỳ không đồng nhất.) Một khi chúng tôi xác định rằng sự thay đổi về sức mạnh không phảikhông đồng nhất , điều này loại trừ một số loại phân tích (chúng tôi không muốn áp dụng các phép biến đổi phi tuyến của sức mạnh) và gợi ý ủng hộ những người khác (chẳng hạn như bình phương tối thiểu phi tuyến hoặc mô hình tuyến tính tổng quát), một khi sự phi tuyến được thiết lập rõ ràng.
whuber

Bây giờ tôi đã thêm một mô tả ngắn gọn về vấn đề trong tay. Cảm ơn ý kiến ​​của bạn cho đến nay, những điều này thực sự được đánh giá cao và đang giúp tôi suy nghĩ vấn đề.
KatyB

Tại sao không kiểm tra hiệu ứng bậc hai?
AdamO

2
@Simon Tôi không sử dụng bất kỳ thử nghiệm nào, tuy nhiên bạn có thể thấy rằng đây là homoscedastic bằng cách vẽ kích thước điển hình của phần dư so với Khối lượng. Đây là một số Rmã : plot(s <- by(cbind(Power, Volume), groups <- cut(Volume, 10), function(d) summary(lm(Power ~ Volume, data=d))$sigma), xlab="Volume range", ylab="Residual SD", ylim=c(0, max(s))); abline(h=mean(s), lty=2, col="Blue"). Nó cho thấy một kích thước còn lại gần như không đổi trên toàn bộ phạm vi.
whuber

Câu trả lời:


4

Đây về cơ bản là một vấn đề lựa chọn mô hình. Tôi khuyến khích bạn chọn một tập hợp các mô hình hợp lý về mặt vật lý (tuyến tính, hàm mũ, có thể là mối quan hệ tuyến tính không liên tục) và sử dụng Tiêu chí thông tin Akaike hoặc Tiêu chí thông tin Bayes để chọn ra vấn đề tốt nhất - lưu ý đến vấn đề không đồng nhất mà @whuber chỉ ra.


2

Bạn đã thử googling này!? Một cách để làm điều này là phù hợp với công suất cao hơn hoặc các thuật ngữ phi tuyến tính khác cho mô hình của bạn và kiểm tra xem hệ số của chúng có khác biệt đáng kể so với 0 không.

Có một số ví dụ ở đây http://www.albany.edu/~po467/EPI553/Fall_2006/regression_assumptions.pdf

Trong trường hợp của bạn, bạn có thể muốn chia tập dữ liệu của mình thành hai phần để kiểm tra tính phi tuyến tính cho âm lượng <5 và tuyến tính cho âm lượng> 5.

Vấn đề khác mà bạn có là dữ liệu của bạn không đồng nhất, vi phạm giả định quy tắc cho dữ liệu hồi quy. Liên kết được cung cấp cũng đưa ra các ví dụ về thử nghiệm cho điều này.


Liên kết bị hỏng.
Jatin

2

Tôi đề nghị sử dụng hồi quy phi tuyến để phù hợp với một mô hình cho tất cả dữ liệu của bạn. Điểm chọn một khối lượng tùy ý và khớp một mô hình với các khối lượng nhỏ hơn khối lượng đó và một mô hình khác với các khối lượng lớn hơn là gì? Có bất kỳ lý do, ngoài vẻ ngoài của hình, cho việc sử dụng 5 như một ngưỡng sắc nét? Bạn có thực sự tin rằng sau một ngưỡng âm lượng cụ thể, đường cong lý tưởng là tuyến tính? Không phải nhiều khả năng nó tiếp cận theo chiều ngang khi tăng âm lượng, nhưng không bao giờ khá tuyến tính?

Tất nhiên, việc lựa chọn công cụ phân tích phải phụ thuộc vào câu hỏi khoa học nào bạn đang cố gắng trả lời và kiến ​​thức trước đây của bạn về hệ thống.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.