Vì vậy, tôi có một tập dữ liệu mà tôi muốn xóa các từ dừng sử dụng
stopwords.words('english')
Tôi đang đấu tranh làm cách nào để sử dụng điều này trong mã của mình để chỉ đơn giản là lấy ra những từ này. Tôi đã có một danh sách các từ trong tập dữ liệu này rồi, phần tôi đang đấu tranh là so sánh với danh sách này và loại bỏ các từ dừng. Bất kỳ trợ giúp được đánh giá cao.
from nltk.corpus import stopwords
cho những người dùng google trong tương lai
nltk.download("stopwords")
để cung cấp từ điển từ khóa.