Gắn đám mây từ / thẻ vào ranh giới địa lý


15

Có bất kỳ công cụ có sẵn hoặc phương pháp đề xuất nào để hiển thị thẻ hoặc đám mây từ (còn được gọi là wordle ) trên bản đồ thế giới, giống như trong ví dụ này: Bản đồ: Hoa Kỳ họ ? (Có thể có các ví dụ khác trên NY Times.)

Lưu ý rằng trong ví dụ trên, từ được định vị theo tọa độ cố định, trong khi việc phân loại văn bản có thể được thực hiện bằng thuật toán wordle (như được mô tả trên SO ) theo cách tự động. Vì vậy, có một phần mềm cho phép bạn đặt các từ ngẫu nhiên trên một quốc gia nhất định hay bạn nghĩ rằng tốt nhất là nên điều chỉnh thuật toán gốc wordle (ví dụ: bằng cách thêm các ràng buộc dựa trên các biên giới được xác định trước)?



@underdark Cảm ơn bạn đã chỉ ra chủ đề đó. Tuy nhiên, dường như tôi liên quan nhiều hơn đến gắn thẻ địa lý, trong khi tôi đang tìm kiếm một giải pháp mà chúng ta không phải liên kết các tọa độ không gian đã biết (ví dụ: thị trấn hoặc các hạt) với mỗi từ. Nói cách khác, hãy để bố cục các từ vào một quốc gia không bị ràng buộc ngoài các biên giới thực tế của nó. Nếu người khác cảm thấy nó thực sự là một bản sao, tôi có thể loại bỏ nó mà không cần bất kỳ sự thăm dò nào.
chl

@chl: Vậy vị trí của các từ bên trong ranh giới không có ý nghĩa gì? Sau đó, nó không trùng lặp.
underdark

@underdark Vâng, chính xác. Ý tưởng chính của wordle là cố gắng tìm một bố cục không gian đẹp mắt với các từ có kích thước bằng tần số tương đối của chúng. Sau đó, tôi chỉ muốn hạn chế lựa chọn tọa độ (x, y) có thể trên "đường viền".
chl

Có một vài chủ đề thẻ / đám mây ở đây trong GSE. gis.stackexchange.com/search?q=tag+cloud Dường như cần có một số nỗ lực (có lẽ được bắt đầu bởi cộng đồng trao đổi ngăn xếp) để phân biệt đám mây với thẻ / đám mây. Ngay cả với thẻ trong tìm kiếm của tôi, tôi đã nhận được "có vẻ như" tất cả các chuỗi đám mây được trả về. Có lẽ chúng ta có thể bắt đầu một chủ đề trên meta để thảo luận. Hoặc có lẽ nó không làm phiền ai khác. ???
Brad Nesom

Câu trả lời:


4

Sẽ mất rất ít điều chỉnh: xấp xỉ ranh giới đa giác bằng các đường đẳng (nghĩa là các phân đoạn ngang và dọc) và, như điều kiện ban đầu, đặt các hộp (có nội dung trống) được xếp dọc theo các đường đó ở bên ngoài đa giác và bên trong của hộp giới hạn của đa giác. Tại thời điểm này, cấu hình sẽ trông chính xác như thể thuật toán Wordle đã hoạt động được một thời gian và tình cờ đặt những từ đầu tiên xung quanh chu vi của khung giới hạn. Hãy để thuật toán tiếp quản từ đó.

Trong thực tế, số tiền này đại diện cho đa giác với một hình tứ giác ngay từ đầu và nếu không thì sao chép chính xác thuật toán Wordle.

Nếu bạn không đặt hàng ngàn từ vào đa giác và nếu bạn có ít thời gian tính toán, bạn hoàn toàn không phải viết mã chỉ mục không gian: bạn có thể thực hiện phát hiện va chạm bằng cách sử dụng so sánh tất cả các cặp của brute-force các hộp giới hạn. Với một chút công việc nhỏ hơn, bạn có thể duy trì danh sách các vị trí từ được sắp xếp theo tọa độ x và y và khai thác các danh sách này để hợp lý hóa thuật toán phát hiện va chạm.


6

Rất lừa. Tôi đang cố gắng tự mình làm một cái gì đó tương tự, nhưng để tạo ra các bản đồ chính tả như thế này từ Bản đồ Trục.

nhập mô tả hình ảnh ở đây

Bạn có thể thử một cái gì đó với qgis hoặc mapnik, những điều cơ bản sẽ là:
1) Đếm các từ và tạo trọng số theo số lần xuất hiện.
2) tạo các điểm ngẫu nhiên bên trong một poligon.
3) cho mỗi điểm tải lên một từ và trọng số của nó để xác nhận bảng.
4) Vẽ văn bản với kích thước phông chữ dựa trên trọng lượng.

Bạn cũng có thể thêm một vòng quay ngẫu nhiên và màu sắc vào bảng.


(+1) Cảm ơn bạn đã chỉ ra bản đồ typographic. Nó nhắc nhở tôi rằng tôi đã đi qua những thứ mát mẻ vài tháng trước. Tôi sẽ dùng thử nhưng tôi đã tự hỏi liệu mã Python có sẵn được đóng góp bởi @awise trên SO cũng không hữu ích hay không, cung cấp cho tôi thêm các điều khoản chống lại biên giới quốc gia. Tôi không đủ quen thuộc với QGis nhưng tôi sẽ cố gắng học nó.
chl

Đặt các từ tại các điểm ngẫu nhiên thống nhất thường sẽ tạo ra nhiều sự chồng chéo. Nếu các từ được chia tỷ lệ đồng đều để gần như điền vào đa giác - mà trong hầu hết các trường hợp là tình huống mong muốn - thì việc sử dụng các điểm ngẫu nhiên chắc chắn không hoạt động. Nó sẽ là một khởi đầu tốt cho một thuật toán ủ mô phỏng không gian, mặc dù :-).
whuber

Chúng không trùng nhau vì qgis và mapnik có các bộ phát hiện va chạm. Nhưng một số từ sẽ bị đàn áp. Có nhiều vấn đề khác, như, bạn cần bao nhiêu từ tùy thuộc vào kích thước đa giác?
Pablo

@whuber, Theo ideia của bạn, Có thể thay vì các điểm ngẫu nhiên, thuật toán có thể bắt đầu điền vào đa giác với các đa giác khác với kích thước từ từ trên cùng bên trái cho đến bên phải. sau đó dán nhãn cho các đa giác.
Pablo

5

Tagxedo có vẻ tốt. Quá tệ, nó sử dụng Silverlight.


(+1) Có vẻ tốt, mặc dù tốt nhất không nên dựa vào Silverlight.
chl

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.