Bạn đang sử dụng python 2.x hay 3.0?
Nếu bạn đang sử dụng 2.x, hãy thử đặt chuỗi regex thành chuỗi unicode-Escape, với 'u'. Vì đó là regex, nên thực hành tốt để biến chuỗi regex của bạn thành một chuỗi thô, với 'r'. Ngoài ra, đặt toàn bộ mẫu của bạn trong ngoặc đơn là không cần thiết.
re.sub(ur'[\u064B-\u0652\u06D4\u0670\u0674\u06D5-\u06ED]+', '', ...)
http://docs.python.org/tutorial/introduction.html#unicode-strings
Biên tập:
Bạn cũng nên sử dụng cờ re.UNICODE / re.U / (? U) cho các biểu tượng unicode, nhưng nó chỉ ảnh hưởng đến các bí danh lớp ký tự như \ w hoặc \ b, trong đó mẫu này không sử dụng bất kỳ và như vậy sẽ không bị ảnh hưởng bởi.
u
vàr
tiền tố. Điều đó khá tuyệt!