Ước tính các tham số cho một quá trình không gian


12

Tôi được cung cấp một lưới các giá trị nguyên dương. Những con số này đại diện cho một cường độ tương ứng với sức mạnh niềm tin của một người chiếm vị trí lưới đó (giá trị cao hơn cho thấy niềm tin cao hơn). Một người nói chung sẽ có ảnh hưởng đến nhiều ô lưới.n×n

Tôi tin rằng mô hình cường độ sẽ "nhìn Gaussian" ở chỗ sẽ có một vị trí trung tâm của cường độ cao, và sau đó cường độ giảm dần theo mọi hướng. Cụ thể, tôi muốn mô hình hóa các giá trị đến từ "Gaussian được chia tỷ lệ" với tham số cho phương sai và giá trị khác cho hệ số tỷ lệ.

Có hai yếu tố phức tạp:

  • sự vắng mặt của một người sẽ không tương ứng với một giá trị 0, vì nhiễu nền và các hiệu ứng khác, nhưng các giá trị nên nhỏ hơn. Chúng có thể thất thường, và ở lần xấp xỉ đầu tiên có thể khó mô hình hóa thành nhiễu Gaussian đơn giản.
  • Phạm vi cường độ có thể khác nhau. Trong một trường hợp, các giá trị có thể nằm trong khoảng từ 1 đến 10 và trong một trường hợp khác, từ 1 đến 100.

Tôi đang tìm kiếm một chiến lược ước tính tham số thích hợp, hoặc con trỏ đến tài liệu liên quan. Con trỏ đến lý do tại sao tôi tiếp cận vấn đề này một cách sai lầm hoàn toàn cũng sẽ được đánh giá cao :). Tôi đã đọc về quá trình phá hoại và Gaussian, nhưng dường như đó là máy móc rất nặng cho vấn đề của tôi.


1
Bạn có ý nghĩa gì bởi một Gaussian với tham số phương sai tỷ lệ? Tham số phương sai tham số tỷ lệ của Gaussian! Tôi cũng không chắc lắm về mô hình bạn đã thiết lập cho đến nay. Bạn có thể mô tả vấn đề bạn thực sự đang cố gắng giải quyết chi tiết hơn không? Sử dụng một Gaussian để mô hình các quan sát có giá trị nguyên nhỏ có độ chi tiết thấp có vẻ tanh.
Đức Hồng Y

(+1) Cho một câu hỏi thú vị. Mong được hiểu những gì bạn đang cố gắng giải quyết tốt hơn một chút.
Đức hồng y

Dưới đây là một số quan sát: 1. Nếu giá trị của bạn là số nguyên, sử dụng Gaussian có vẻ không phù hợp. 2. Không rõ mục đích của mô hình của bạn là gì, bạn có muốn xác định các cụm niềm tin mạnh mẽ chẳng hạn? Điều gì sẽ được giải thích các tham số của bạn nếu bạn có chúng? 3. Vì bạn có một lưới, tại sao không thử kết hợp các phân phối bivariate? Sau đó, lưới sẽ là hỗ trợ của phân phối (giả sử đơn vị vuông) và cường độ sẽ tương ứng với các vùng có xác suất cao.
mpiktas

Cảm ơn tất cả những điểm thú vị. Hãy để tôi cố gắng làm rõ. Sự lựa chọn "Gaussian", dưới ánh sáng của các bình luận, có thể là một cá trích đỏ gây ra nhiều nhầm lẫn hơn nó giúp. Đặc điểm chính của dữ liệu là các giá trị cường độ cao tại điểm tin tưởng cao nhất vào vị trí của người đó và giảm dần "triệt để" xung quanh nó (mà tôi đã quan sát theo kinh nghiệm). Các giá trị cường độ xuất phát từ giải pháp cho một vấn đề nghịch đảo (tuyến tính) và do đó thực sự không nhất thiết phải là tích phân - đó chỉ là dữ liệu chúng ta có.
Suresh Venkatasubramanian

btw Tôi đánh giá cao những nỗ lực để làm cho câu hỏi được xác định rõ hơn và được mô hình hóa tốt hơn. Tôi sẽ làm hết sức mình để giải thích cài đặt dữ liệu thực tế để hội tụ các giả định mô hình đúng.
Suresh Venkatasubramanian

Câu trả lời:


5

Bạn có thể sử dụng mô-đun này của thư viện python pysal cho các phương pháp phân tích dữ liệu không gian mà tôi thảo luận dưới đây.

Mô tả của bạn về thái độ của mỗi người bị ảnh hưởng bởi thái độ của những người xung quanh có thể được thể hiện bằng mô hình tự phát không gian (SAR) (cũng xem phần giải thích SAR đơn giản của tôi từ câu trả lời SE 2 này ). Cách tiếp cận đơn giản nhất là bỏ qua các yếu tố khác và ước tính sức mạnh của ảnh hưởng như thế nào những người xung quanh ảnh hưởng đến thái độ của nhau bằng cách sử dụng thống kê I của Moran .

Nếu bạn muốn đánh giá tầm quan trọng của các yếu tố khác trong khi ước tính cường độ ảnh hưởng của những người xung quanh, một nhiệm vụ phức tạp hơn, thì bạn có thể ước tính các tham số của hồi quy: . Xem các tài liệu ở đây . (Các phương pháp ước tính loại hồi quy này đến từ lĩnh vực kinh tế lượng không gian và có thể phức tạp hơn nhiều so với tham chiếu tôi đã đưa ra.)y=bx+rhoWy+e

Thử thách của bạn sẽ là xây dựng ma trận trọng số không gian ( ). Tôi nghĩ rằng mỗi phần tử của ma trận nên là 1 hoặc 0 dựa trên việc người ở trong một khoảng cách nào đó bạn cảm thấy rằng nó được yêu cầu ảnh hưởng đến người khác .w i j i jWwijij

Để có được một ý tưởng trực quan về vấn đề, dưới đây tôi minh họa cách một quá trình tạo dữ liệu tự phát không gian (DGP) sẽ tạo ra một mô hình các giá trị. Đối với 2 mạng giá trị mô phỏng, các khối màu trắng đại diện cho các giá trị cao và các khối tối đại diện cho các giá trị thấp.

Trong mạng đầu tiên bên dưới các giá trị lưới đã được tạo bởi một quá trình ngẫu nhiên phân phối thông thường (hoặc Gaussian), trong đó bằng không.rho

Ngẫu nhiên (Gaussian)

Trong mạng tiếp theo bên dưới, các giá trị lưới đã được tạo bởi một quá trình tự phát theo không gian, trong đó đã được đặt ở mức cao, giả sử .8. rhonhập mô tả hình ảnh ở đây


Điều đó rất thú vị (và Geary C có liên quan cũng vậy). Điều này có thể gần với những gì tôi cần.
Suresh Venkatasubramanian

Geary C giúp bạn thấy các giá trị gần với một cụm khác, thậm chí các giá trị ở giữa phân phối. Moran's I giúp bạn thấy cụm giá trị rất cao với giá trị rất cao và cụm giá trị rất thấp xung quanh giá trị rất thấp. Vì vậy, có lẽ bạn đúng và phương pháp đơn giản và tốt nhất là Geary's C. Hãy nhớ rằng phương pháp C của Geary là thăm dò và sẽ không cho phép bạn đưa ra kết quả của mình về các yếu tố khác. Nhìn vào mô-đun python này để biết mã để chạy Geary C: pysal.org/1.1/l Library / esda / gold.html .
b_dev

Hãy để tôi chơi với một số nhiều hơn nữa. Nếu nó dường như làm những gì tôi cần (và tôi nghĩ nó sẽ), đây có vẻ là câu trả lời tốt nhất.
Suresh Venkatasubramanian

3

Đây là một ý tưởng đơn giản mà có thể làm việc. Như tôi đã nói trong các ý kiến ​​nếu bạn có một lưới có cường độ tại sao không phù hợp với mật độ phân phối bivariate?

Dưới đây là biểu đồ mẫu để minh họa quan điểm của tôi: nhập mô tả hình ảnh ở đây

Mỗi điểm lưới với được hiển thị dưới dạng hình vuông, được tô màu theo cường độ. Xếp chồng trên biểu đồ là biểu đồ đường viền của biểu đồ mật độ chuẩn bivariate. Như bạn có thể thấy các đường đồng mức mở rộng theo hướng giảm cường độ. Trung tâm sẽ được kiểm soát bởi giá trị trung bình của bivariate bình thường và sự lan truyền của cường độ theo ma trận hiệp phương sai.

Để có được ước tính của ma trận trung bình và ma trận hiệp phương sai, có thể sử dụng tối ưu hóa số đơn giản, so sánh cường độ với các giá trị của hàm mật độ bằng cách sử dụng trung bình và ma trận hiệp phương sai làm tham số. Tối thiểu hóa để có được các ước tính.

Tất nhiên đây không phải là một ước tính thống kê, nhưng ít nhất nó sẽ cho bạn ý tưởng làm thế nào để tiến xa hơn.

Đây là mã để tái tạo biểu đồ:

require(mvtnorm)
sigma=cbind(c(0.1,0.7*0.1),c(0.7*0.1,0.1))

x<-seq(0,1,by=0.01)
y<-seq(0,1,by=0.01)
z<-outer(x,y,function(x,y)dmvnorm(cbind(x,y),mean=mean,sigma=sigma))

mz<-melt(z)

mz$X1<-(mz$X1-1)/100
mz$X2<-(mz$X2-1)/100

colnames(mz)<-c("x","y","z")

mz$intensity<-round(mz$z*1000)

ggplot(mz, aes(x,y)) + geom_tile(aes(fill = intensity), colour = "white") + scale_fill_gradient(low = "white",     high = "steelblue")+geom_contour(aes(z=z),colour="black")

2

Mô hình của bạn là trường ngẫu nhiên hai chiều và bạn đang cố ước tính phân phối chung của các biến ngẫu nhiên giá trị nguyên . Bạn sẽ muốn giả định vị trí không gian: đó là phân phối chung của giống như phân phối chung của . Đặc biệt, phân phối biên là giống nhau cho mọi tế bào. Một câu hỏi đơn giản để hỏi là cấu trúc tự tương quan của trường. Đó là, điều gì là đúng với khoảng cách ? Chúng tôi biểu diễn điều này như là một hàmX[i,j]X[i,j](X[i1,j1],...,X[im,jm])c o r r ( X [ i 1 , j 1 ] , X [ i 2 , j 2 ] ) d ( [ i 1 , j 1 ] , [ i 2 , j 2 ] ) ρ ( d ) ρ ( d ) = k d - 1 k(X[i1+k,j1+l]...,X[im+k,jm+l])corr(X[i1,j1],X[i2,j2])d([i1,j1],[i2,j2])ρ(d). Một mô hình đơn giản cho cấu trúc tự tương quan là , trong đó là hằng số.ρ(d)=kd1k

d([i1,j1],[i2,j2])=|i1i2|+|j1j2|ρ(d)ví dụ thông qua khả năng tối đa. Để biết thêm ý tưởng, hãy tìm "trường ngẫu nhiên".


1
"Muốn giả định không gian cố định" xuất hiện trực tiếp để mâu thuẫn với giả định của OP rằng "cường độ giảm dần triệt để theo mọi hướng."
whuber

Làm sao vậy Một mô hình như vậy sẽ xảy ra với cấu trúc tự tương quan mà tôi đề xuất.
charles.y.zheng

1
@ sarles Đó là một điểm quan trọng: nếu thực sự xu hướng rõ ràng này được quy cho sự tự tương quan, thì về nguyên tắc, một nhận thức độc lập khác của quá trình có thể có một xu hướng khác biệt đáng kể, chẳng hạn như tăng giá trị từ một điểm trung tâm. Bởi vì OP đã xác định rõ ràng và phân biệt một số yếu tố quyết định với xu hướng ("giảm dần xuyên tâm") và các yếu tố tương quan ("có ảnh hưởng đến nhiều ô lưới"), một câu trả lời tôn trọng điều này có thể sẽ được xem tích cực hơn so với khẳng định OP "sẽ muốn" thay đổi suy nghĩ của mình.
whuber

Tôi không chắc là tôi hiểu điều kiện cố định không gian. Nhìn bề ngoài, có vẻ như rất mâu thuẫn với ý tưởng có một "đỉnh cao nhô ra" tại một địa điểm cụ thể, nhưng rõ ràng tôi không hiểu điều gì đó.
Suresh Venkatasubramanian

1
@ sarles, mô hình bạn mô tả sẽ có mặt cho từng điểm lưới, do giả định trạm không gian. Văn phòng phẩm về cơ bản là nói rằng tất cả các điểm của tôi hành xử tương tự nhau. Đây không phải là trường hợp được mô tả bởi OP. Câu trả lời vẫn rất tốt, nhưng không phù hợp trong trường hợp này.
mpiktas
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.