Tôi đang làm việc trên một dự án sử dụng tệp CSV do khách hàng cung cấp để điền vào cơ sở dữ liệu. Ứng dụng khách là tạo bảng tính, sau đó lưu nó dưới dạng CSV sẽ được tải lên, sau đó được phân tích cú pháp vào cơ sở dữ liệu.
Vấn đề là, bất cứ khi nào khách hàng lưu bảng tính excel dưới dạng tệp .csv của MS-DOS, nhiều ký tự đặc biệt sẽ được chuyển đổi thành dấu hỏi "?" (các ký hiệu như '"/). Tuy nhiên, nếu sau đó chúng tôi mở tệp CSV và thay thế thủ công từng tệp bằng ký tự bên phải thì nó hoạt động tốt.
Vấn đề là tệp dữ liệu rất LỚN và chúng tôi không thể làm điều này một cách hợp lý, vì vậy tôi đã hy vọng có một cách để lưu nó. Chúng tôi đã cố gắng xuất dưới dạng Unicode và ASCII nhưng không có kết quả. Chúng tôi cũng đã thử tải lên tài liệu google và lưu lại, tuy nhiên, nó cũng phá vỡ các ký tự đó.