Làm cách nào để xóa tất cả các ký tự đặc biệt khỏi chuỗi trong R và thay thế chúng bằng dấu cách?
Một số ký tự đặc biệt cần xóa là: ~!@#$%^&*(){}_+:"<>?,./;'[]-=
Tôi đã thử regex
với [:punct:]
mẫu nhưng nó chỉ loại bỏ các dấu chấm câu.
Câu hỏi 2: Và cách xóa các ký tự trong tiếng nước ngoài như : â í ü Â á ą ę ś ć
?
Trả lời: Sử dụng [^[:alnum:]]
để loại bỏ ~!@#$%^&*(){}_+:"<>?,./;'[]-=
và sử dụng [^a-zA-Z0-9]
để loại bỏ cũng â í ü Â á ą ę ś ć
trong regex
hoặc các regexpr
chức năng.
sub
hoặc các gsub
chức năng.