Tôi hiện đang xây dựng một phiên bản trên EC2 để nhập toàn bộ ảnh chụp nhanh của Planet.osm cho toàn bộ dữ liệu của Trái đất cho một số dự án chúng tôi đang thực hiện. Tôi đã tạo ra một phiên bản Ubuntu x64 lớn và đính kèm nhiều bộ lưu trữ riêng biệt trên một ổ EBS cho cơ sở dữ liệu Postgres và sửa đổi nó để lưu trữ dữ liệu PGQuery ở đó.
Bây giờ máy chủ đang gặp sự cố khi sử dụng osm2pgsql
để nhập ảnh chụp nhanh ... Sau một vài lần thử với các cấu hình bộ nhớ khác nhau và không có gì, quá trình tiếp tục xuất ra "Bị giết" sau khi đã hoàn thành; một khi nó đã bị giết trong khi "vượt qua các cách chờ xử lý" và lần tiếp theo, sau khi điều chỉnh một chút bộ đệm mỏng, nó đã đạt đến "các cách xử lý" trước khi thoát ra. Từ những gì tôi đã đọc, điều này thường là do vấn đề bộ nhớ.
Đây là nỗ lực mới nhất của tôi để chạy nhập:
osm2pgsql -v -U osm -s -C 4096 -S default.style -d osm /data/osm/planet-latest.osm.bz2
Và đây là thông số kỹ thuật cho một ví dụ lớn trên EC2:
Bộ nhớ lớn 7,5 GB bộ nhớ, 4 đơn vị tính toán EC2 (2 lõi ảo với 2 đơn vị tính toán EC2 mỗi đơn vị), bộ nhớ lưu trữ cục bộ 850 GB, nền tảng 64 bit
Câu hỏi của tôi là - có một số tài nguyên điểm chuẩn tốt để xác định các yêu cầu điều chỉnh cho osm2pgsql và Postgres? Tốc độ nhập thậm chí không quan trọng đối với tôi, tôi chỉ muốn có thể đảm bảo quá trình hoàn tất an toàn, ngay cả khi phải mất 4 hoặc 5 ngày ... Tôi đã đọc qua " Tối ưu hóa kết xuất của Frederick Ramm" chuỗi "(PDF) tài liệu từ SOTM năm ngoái, nhưng có ý kiến / tài nguyên tốt nào khác không?