Trong năm 2010, bạn có phục vụ các URL chứa ký tự UTF-8 trong một cổng web lớn không?
Các ký tự Unicode bị cấm theo RFC trên các URL (xem tại đây ). Chúng sẽ phải được mã hóa phần trăm để tuân thủ các tiêu chuẩn.
Tuy nhiên, quan điểm chính của tôi là phục vụ các ký tự chưa được mã hóa cho mục đích duy nhất là có các URL trông đẹp mắt, do đó, phần trăm mã hóa đã bị loại bỏ.
Tất cả các trình duyệt chính dường như đang phân tích các URL đó đều ổn cho dù RFC nói gì. Tuy nhiên, ấn tượng chung của tôi là nó rất run khi rời khỏi miền của các trình duyệt web:
- Các URL được sao chép + dán vào tệp văn bản, Email, thậm chí các trang web có mã hóa khác
- Thư viện máy khách HTTP
- Trình duyệt kỳ lạ, trình đọc RSS
Có phải ấn tượng của tôi là chính xác rằng rắc rối sẽ xảy ra ở đây, và do đó nó không phải là một giải pháp thực tế (nếu) bạn đang phục vụ một đối tượng phi kỹ thuật và điều quan trọng là tất cả các liên kết của bạn đều hoạt động tốt ngay cả khi được trích dẫn và truyền lại?
Có một số cách kỳ diệu để phục vụ các URL có giao diện đẹp trong HTML
http://www.example.com/düsseldorf?neighbourhood=Lörick
có thể được sao chép + dán với các ký tự đặc biệt nguyên vẹn, nhưng hoạt động chính xác khi được sử dụng lại trong các máy khách cũ?