Mô hình ước tính mật độ dân số


14

Một cơ sở dữ liệu về (dân số, diện tích, hình dạng) có thể được sử dụng để ánh xạ mật độ dân số bằng cách gán một giá trị dân số / diện tích không đổi cho mỗi hình dạng (là một đa giác như khối Điều tra dân số, đường, quận, tiểu bang, bất cứ điều gì). Tuy nhiên, dân số thường không được phân phối đồng đều trong đa giác của họ. Ánh xạ phân tích là quá trình tinh chỉnh các ước tính mật độ này bằng dữ liệu phụ trợ. Đó là một vấn đề quan trọng trong khoa học xã hội như đánh giá gần đây cho thấy.

Sau đó, giả sử rằng chúng tôi có sẵn một bản đồ phụ trợ về độ che phủ đất (hoặc bất kỳ yếu tố riêng biệt nào khác). Trong trường hợp đơn giản nhất, chúng ta có thể sử dụng các khu vực rõ ràng không thể ở được như thủy vực để phân định nơi dân cư không và theo đó, chỉ định tất cả dân số cho các khu vực còn lại. Tổng quát hơn, mỗi đơn vị Điều tra dân số được khắc thành phần có diện tích bề mặt , . Do đó, tập dữ liệu của chúng tôi được bổ sung vào danh sách các bộ dữ liệujkxjii=1,2,,k

(yj,xj1,xj2,,xjk)

trong đó là dân số (giả định được đo không có lỗi) trong đơn vị và - mặc dù điều này không hoàn toàn đúng - chúng ta có thể giả sử mọi cũng được đo chính xác. Trong các điều khoản này, mục tiêu là phân vùng mỗi thành một tổngyjjxjiyj

yj=zj1+zj2++zjk

trong đó mỗi zji0zji ước tính dân số trong đơn vị j cư trú trong lớp phủ đất i . Các ước tính cần phải được thiên vị. Phân vùng này tinh chỉnh bản đồ mật độ dân số bằng cách gán mật độ zji/xji cho giao điểm của jth Đa giác điều tra dân số và lớp phủ đất ith .

Vấn đề này khác với cài đặt hồi quy tiêu chuẩn theo các cách nổi bật:

  1. Việc phân vùng của mỗi yj phải chính xác.
  2. Các thành phần của mọi phân vùng phải không âm.
  3. Không có (theo giả định) không có lỗi trong bất kỳ dữ liệu nào: tất cả dân số đều tính yj và tất cả các khu vực xji đều đúng.

Có nhiều cách tiếp cận đối với một giải pháp, chẳng hạn như phương pháp " ánh xạ dasymetric thông minh ", nhưng tất cả những gì tôi đã đọc đều có các yếu tố đặc biệt và tiềm năng rõ ràng cho sự thiên vị. Tôi đang tìm kiếm câu trả lời gợi ý các phương pháp thống kê sáng tạo, có thể tính toán được. Ứng dụng ngay lập tức liên quan đến một bộ sưu tập của c. 105 - 106 Đơn vị điều tra dân số trung bình 40 người mỗi người (mặc dù một phần khá lớn có 0 người) và khoảng một chục lớp phủ đất.


Vấn đề định dạng bây giờ đã được sửa. Đó là một lỗi.
Rob Hyndman

@Rob Cảm ơn bạn, và cảm ơn tất cả những người đã xem xét điều này: Tôi đã thấy những bình luận của bạn trước khi chúng bị xóa và rất biết ơn những nỗ lực của bạn.
whuber

1
Ngoài ra cái này: P. A Zandbergen và D. A Ignizio, so sánh các kỹ thuật lập bản đồ đo lường đối với các ước tính dân số khu vực nhỏ, Bản đồ học và Khoa học thông tin địa lý 37, không. 3 (2010): 199 Từ214. ingentaconnect.com/content/acsm/cagis/2010/00000037/00000003/NH Mà dường như gọi ra để pha trộn.
fgregg

1
Bài viết này có thể hữu ích: Hwahwan Kim và Xiaobai Yao, nội suy Pycnophylactic xem xét lại: tích hợp với phương pháp lập bản đồ dasymetric, Tạp chí quốc tế về viễn thám 31, không. 21 (2010): 5657. notifyaworld.com/10.1080/01431161.2010.496805
fgregg

1
Bạn biết đấy, ánh xạ dasymetric cuối cùng là một vấn đề suy luận sinh thái. Công việc gần đây của K. Imai có thể hữu ích: pan.oxfordjournals.org/content/16/1/41.abauge
fgregg

Câu trả lời:


4

Bạn có thể muốn kiểm tra công việc của Mitchel Langford trên bản đồ dasymetric.

Ông xây dựng các raster đại diện cho phân bố dân số của xứ Wales và một số phương pháp phương pháp của ông có thể hữu ích ở đây.

Cập nhật: Bạn cũng có thể có một cái nhìn tại nơi làm việc của Jeremy Mennis (đặc biệt là những hai bài báo).


2
Cảm ơn bạn. Công việc đó cung cấp một con trỏ vào một mạng lưới các nghiên cứu gần đây về ánh xạ dasymetric.
whuber

2

Câu hỏi thú vị. Đây là một cú đâm dự kiến ​​khi tiếp cận điều này từ góc độ thống kê. Giả sử rằng chúng tôi đưa ra một cách để gán số lượng dân số cho từng khu vực . Biểu thị mối quan hệ này như sau:xji

zji=f(xji,β)

Rõ ràng, bất kỳ dạng chức năng nào chúng ta áp đặt cho Sẽ có giá trị gần đúng nhất với mối quan hệ thực và do đó cần kết hợp lỗi vào phương trình trên. Do đó, những điều trên trở thành:f(.)

zji=f(xji,β)+ϵji

Ở đâu,

ϵjiN(0,σ2)

Giả định lỗi phân phối về thời hạn lỗi là nhằm mục đích minh họa. Nếu cần chúng ta có thể thay đổi nó khi thích hợp.

Tuy nhiên, chúng ta cần một phân tách chính xác của . Vì vậy, chúng ta cần áp đặt một ràng buộc đối với các điều khoản lỗi và hàm Như dưới đây: f ( . )yjif(.)

iϵji=0

if(xji,β)=yj

Suy ra vectơ xếp chồng của bởi và các thuật ngữ xác định xếp chồng của bởi . Như vậy, chúng ta có: z j f ( x j i , β ) f jzjizjf(xji,β)fj

zjN(fj,σ2I)I(fje=yj)I((zjfj)e=0)

Ở đâu,

e là một vectơ của các chiều có kích thước phù hợp.

Ràng buộc chỉ báo đầu tiên nắm bắt ý tưởng rằng tổng các thuật ngữ xác định sẽ tổng hợp với và điều khoản thứ hai nắm bắt ý tưởng rằng phần dư lỗi sẽ tổng bằng 0.yj

Lựa chọn mô hình phức tạp hơn khi chúng ta đang phân tách chính xác được quan sát . Có lẽ, một cách để tiếp cận lựa chọn mô hình là chọn mô hình mang lại phương sai sai số thấp nhất, tức là mô hình mang lại ước tính thấp nhất của .yjσ2

Chỉnh sửa 1

Suy nghĩ thêm một số công thức trên có thể được đơn giản hóa vì nó có nhiều ràng buộc hơn mức cần thiết.

zji=f(xji,β)+ϵji

Ở đâu,

ϵjiN(0,σ2)

Suy ra vectơ xếp chồng của bởi và các thuật ngữ xác định xếp chồng của bởi . Như vậy, chúng ta có:zjizjf(xji,β)fj

zjN(fj,σ2I)I(zje=yj)

Ở đâu,

e là một vectơ của các chiều có kích thước phù hợp.

Ràng buộc trên đảm bảo phân tách chính xác.zj


2
@Srikant Cảm ơn bạn. Tôi đã suy nghĩ theo các dòng tương tự khi tôi đặt câu hỏi và từ đó đã thử nghiệm GLM (phân phối Poisson với liên kết tuyến tính ) cũng như một số mô hình khác. Thật không may, bây giờ có vẻ như bất kỳ mô hình nào chỉ dựa trên loại và tỷ lệ che phủ đất sẽ không hoạt động tốt: một mẫu của các dữ liệu này cho thấy các mô hình dân số phụ thuộc vào bối cảnh không gian lớn hơn. Ở mức tối thiểu, sau đó, chúng ta sẽ cần bao gồm các hiệp phương sai độ trễ trong một mô hình tuyến tính.
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.