Tôi có một khung dữ liệu với các giá trị lặp lại trong cột A. Tôi muốn loại bỏ các mục trùng lặp, giữ cho hàng có giá trị cao nhất trong cột B.
Vậy đây:
A B
1 10
1 20
2 30
2 40
3 10
Nên biến thành thế này:
A B
1 20
2 40
3 10
Wes đã thêm một số chức năng tốt đẹp để loại bỏ các bản sao: http://wesmckinney.com/blog/?p=340 . Nhưng AFAICT, nó được thiết kế cho các bản sao chính xác, vì vậy không đề cập đến các tiêu chí để chọn hàng nào được giữ.
Tôi đoán có lẽ có một cách dễ dàng để làm điều này --- có thể dễ như sắp xếp khung dữ liệu trước khi bỏ các bản sao --- nhưng tôi không biết logic bên trong của nhóm đủ tốt để tìm ra nó. Bất kỳ đề xuất?