Tôi có thể sử dụng bootstrapping, tại sao hoặc tại sao không?


10

Tôi hiện đang làm việc trên các ước tính sinh khối bằng cách sử dụng hình ảnh vệ tinh. Tôi sẽ nhanh chóng xác định nền tảng của câu hỏi của tôi và sau đó giải thích câu hỏi thống kê mà tôi đang làm việc.

Lý lịch

Vấn đề

Tôi đang cố gắng ước tính sinh khối trên một khu vực ở Pháp. Phản ứng của tôi là mật độ khối lượng gỗ (tính bằng ), tỷ lệ này nhiều hay ít so với sinh khối (tùy thuộc vào mật độ gỗ ...).m3/ha

Các biến độc lập mà tôi có là các chỉ số thực vật có nguồn gốc từ các phản xạ đo được trong khu vực này (vệ tinh được sử dụng trong nghiên cứu là MODIS cho những người biết về nó). Các chỉ số này là ví dụ NDVI, EVI, v.v. Tôi có bản đồ của các chỉ số và độ phân giải của bản đồ là 250m.

Có mối tương quan mạnh mẽ giữa các chỉ số này và khối lượng trong cùng một loại rừng (quần xã và khí hậu). Vì vậy, tôi đang cố gắng hồi quy mật độ âm lượng so với các chỉ số này (thực ra là chuỗi thời gian của chúng) trên các lô hàng tồn kho nơi tôi biết khối lượng.

Kiểm kê rừng

Khối lượng trên các ô này được ước tính bằng phương pháp lấy mẫu sau:

  1. Các nút hàng tồn kho được đặt trên một lưới thường xuyên bao phủ khu vực.
  2. Một âm mưu được gắn vào mỗi nút và quá trình kiểm kê (loại cây, khối lượng, chiều cao tán, v.v.) xảy ra trên lô này. Tất nhiên tôi chỉ quan tâm đến biểu đồ kiểm kê và các giá trị của các chỉ số thực vật của tôi là giá trị của pixel chứa biểu đồ.
  3. Quy trình kiểm kê trên một lô như sau:

    http://i.stack.imgur.com/DeHdC.png

    • Số đo của những cây có đường kính> 37,5cm trong vòng tròn bán kính 15m
    • Số đo của những cây có đường kính> 22,5cm trong vòng tròn bán kính 9m
    • Số đo của những cây có đường kính> 7,5cm trong vòng tròn bán kính 6m

Mật độ khối lượng sau đó được tính toán bằng cách sử dụng các yếu tố mở rộng.

Đối với mỗi ô, tôi có quyền truy cập vào dữ liệu cho tất cả các cây được đo.

Hơn nữa, đối với mỗi cây đơn lẻ, tôi có sự không chắc chắn về âm lượng do sử dụng các phương trình tương đương (giả sử 10%).

Thống kê ở đâu là quan trọng ...

Để hồi quy của tôi chính xác hơn, tôi cần cho mỗi ước tính về khối lượng phương sai / CI của biện pháp này. Điều này phụ thuộc, IMO, vào số lượng cây được lấy mẫu và mật độ khối lượng được tìm thấy.

Vì vậy, tôi có hai vấn đề:

  1. Làm thế nào để tính đến thực tế là các chỉ số thực vật của tôi được đo trên một pixel 250m?

    Tôi có thể giả sử rằng mật độ âm lượng không đổi trên một pixel và tôi lấy mẫu pixel này bằng một ô kho.

  2. Làm thế nào để ước tính sự thay đổi của mật độ âm lượng của tôi?

    Tôi nghĩ rằng tôi có thể sử dụng bootstrapping trên quần thể cây. Nhưng tổng số cây đo được của tôi có thể khá nhỏ (từ 7 đến 20 ...). Hơn nữa, làm thế nào tôi có thể tính đến thực tế là tôi đang đo cây trên các vòng tròn khác nhau tùy thuộc vào kích thước của chúng? Và sự thay đổi sẽ thay đổi như thế nào nếu tôi đang tìm kiếm trên toàn bộ pixel?

Tôi cũng đã nghĩ rằng tôi có thể sử dụng Mô phỏng Monte Carlo để mô phỏng một khu rừng, và sau đó lấy mẫu ngẫu nhiên khu rừng này với các ô để xem điều gì đang xảy ra ...

Tôi không có một nền tảng thống kê mạnh mẽ, vì vậy tôi có một chút mất mát!

Câu trả lời:


1

Tôi không hiểu rõ dữ liệu của bạn, nhưng tôi có thể nói với bạn rằng một giải pháp thay thế cho bootstrap đa phương thức hoạt động tốt hơn cho các sự kiện hiếm gặp là nhiễu loạn / bootstrap hoang dã. Perturbation cực kỳ linh hoạt và thường có thể xử lý dữ liệu không phải là dữ liệu, tuy nhiên đôi khi cần rất nhiều sự khéo léo để ước tính chính xác cdf. Nếu bạn thành công trong việc chỉ định chính xác công thức bootstrap, bạn sẽ đưa ra ít giả định hơn và có thể ít sai lệch hơn so với phương pháp làm mịn được đề xuất trước đây, đặc biệt là với tập dữ liệu thưa thớt của bạn, có thể làm cho ước tính mật độ không ổn định.


0

Nếu tôi phải tiếp cận vấn đề này, trước tiên tôi sẽ bắt đầu bằng cách:

  1. nhìn vào bản đồ của dữ liệu nguồn
  2. cố gắng làm mịn 2d trên bề mặt, thử thông báo với AIC
  3. tính đạo hàm của độ mịn tại vị trí và liên kết biến đổi đầu vào với biến đổi đầu ra bằng phương pháp delta
  4. So sánh kết quả của điều này với một số giá trị "đã biết" để xác minh / xác thực cách tiếp cận

Các liên kết có liên quan: http://www.stanford.edu/group/cme308/notes/TaylorAppDeltaMethod.pdf http://www.ingentaconnect.com/content/klu/stco/2010/00000020/00000004/00009140?crawler=true

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.