Các cách để đối phó với tính năng kinh độ / vĩ độ [đã đóng]


18

Tôi đang làm việc trên một bộ dữ liệu hư cấu với 25 tính năng. Hai trong số các tính năng là vĩ độ và kinh độ của một địa điểm và các đặc điểm khác là giá trị pH, độ cao, tốc độ gió vv với các phạm vi khác nhau. Tôi có thể thực hiện chuẩn hóa trên các tính năng khác nhưng làm cách nào để tiếp cận các tính năng vĩ độ / kinh độ?

Chỉnh sửa: Đây là một vấn đề để dự đoán năng suất nông nghiệp. Tôi nghĩ rằng lat / long là rất quan trọng vì các địa điểm có thể rất quan trọng trong dự đoán và do đó tiến thoái lưỡng nan.


Bạn có thể làm rõ lý do tại sao bạn không nghĩ rằng bạn có thể bình thường hóa các tính năng đó? Có lẽ chúng là số giống như các tính năng khác, vì vậy bạn có thể lấy trung bình / sd? Là mối quan tâm của bạn về việc có khoảng cách tự nhiên giữa các vị trí? Nếu vậy, dữ liệu có bao phủ một khu vực nhỏ (có giá trị tương tự) hay nó là toàn cầu?
Neil Slater

@NeilSlater Chỉ bằng trực giác, nó không có ý nghĩa với tôi để bình thường hóa các tính năng này. Thông tin sẽ không bị mất nếu được chuẩn hóa? Tôi có bộ dữ liệu bao gồm các quận của Mỹ.
AllThingsScience

Bạn nghĩ thông tin gì sẽ bị mất? Nó có thể sẽ không thực sự bị mất, nhưng nếu bạn giải thích trong câu hỏi của bạn về mối quan tâm của bạn, ai đó sẽ có thể trả lời. Không biết gì nữa, tôi sẽ bình thường hóa bất kể - đối với các giá trị toàn cầu và một số vấn đề (trong đó khoảng cách giữa các điểm là quan trọng) Tôi có thể tạo ra một tính năng tọa độ cartesian 3d từ dài / lat.
Neil Slater

Câu hỏi của bạn ở đây là gì? Bạn đang cố gắng tìm hiểu gì từ dữ liệu? Tương quan? Phân cụm? Phân loại? Sự dự đoán? Nội suy? Làm thế nào là vị trí quan trọng đối với mô hình của bạn?
Spainedman

@Spacesman Vui lòng xem chỉnh sửa.
AllThingsScience

Câu trả lời:


24

Các tọa độ dài Lat có một vấn đề là 2 tính năng đại diện cho không gian ba chiều. Điều này có nghĩa là tọa độ dài đi khắp nơi, có nghĩa là hai giá trị cực đoan nhất thực sự rất gần nhau. Tôi đã xử lý vấn đề này một vài lần và những gì tôi làm trong trường hợp này là ánh xạ chúng tới tọa độ x, y và z. Điều này có nghĩa là điểm gần trong 3 chiều này cũng gần với thực tế. Tùy thuộc vào trường hợp sử dụng, bạn có thể bỏ qua những thay đổi về chiều cao và ánh xạ chúng đến một hình cầu hoàn hảo. Những tính năng này sau đó có thể được tiêu chuẩn hóa đúng.

Để làm rõ (tóm tắt từ các ý kiến):

x = cos(lat) * cos(lon)
y = cos(lat) * sin(lon), 
z = sin(lat) 

1
Điều đó rất thú vị. Cảm ơn bạn! Bạn có thể xác nhận nếu đây là những công thức để chuyển đổi? x = R * cos (lat) * cos (lon), y = R * cos (lat) * sin (lon), z = R * sin (lat)
AllThingsScience

Hiện tại tôi không có quyền truy cập vào mã của mình nhưng có vẻ đúng. Bạn không cần R vì dù sao bạn cũng sẽ chuẩn hóa;)
Jan van der Vegt

Hoàn hảo! Cảm ơn bạn.
AllThingsScience
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.