Tôi có một loạt các mô tả công việc được nhập bởi người dùng. Có tất cả các loại lỗi chính tả và dữ liệu xấu. I E:
...
tulane univ hospital
tulip
tullett prebon
...
weik investment
weill cornell university medical center
weis
weiss waldee hohimer dds
welded constrction l.p.
welder
welder
welder
...
Những bước bạn sẽ thực hiện để 'gia tăng' giá trị này với những hiểu biết liên quan đến công việc?
Điều tốt nhất tôi có thể nghĩ đến là đưa nó cho wolfram alpha. Nhưng tôi tự hỏi nếu có những kỹ thuật có thể truy cập khác mà tôi có thể sử dụng bằng python.
Cập nhật: Tôi phát hiện ra rằng có Phân loại nghề nghiệp tiêu chuẩn , tôi thực sự muốn ghép tên với SOC và SOC với một loạt các mức lương trung bình.