Tôi đang cố gắng thực hiện một số phân loại văn bản bằng Textblob. Đầu tiên tôi đang đào tạo mô hình và tuần tự hóa nó bằng cách sử dụng pickle như hình dưới đây.
import pickle
from textblob.classifiers import NaiveBayesClassifier
with open('sample.csv', 'r') as fp:
cl = NaiveBayesClassifier(fp, format="csv")
f = open('sample_classifier.pickle', 'wb')
pickle.dump(cl, f)
f.close()
Và khi tôi cố gắng chạy tệp này:
import pickle
f = open('sample_classifier.pickle', encoding="utf8")
cl = pickle.load(f)
f.close()
Tôi gặp lỗi này:
UnicodeDecodeError: codec 'utf-8' không thể giải mã byte 0x80 ở vị trí 0: byte bắt đầu không hợp lệ
Sau đây là nội dung của sample.csv của tôi:
SQL của tôi không hoạt động chính xác chút nào. Đây là một lựa chọn sai lầm, SQL
Tôi có vấn đề. Vui lòng phản hồi ngay lập tức, Hỗ trợ
Tôi sai ở đâu đây? Xin vui lòng giúp đỡ.