Bạn có thể thử đoạn mã sau.
import weka.core.converters.ConverterUtils.DataSource;
import weka.filters.unsupervised.attribute.StringToWordVector;
import weka.core.Instances;
Instances data = DataSource.read(".../document.txt"); //Your document .
filter.setInputFormat(data);
StringToWordVector filter = new StringToWordVector();
filter.setStopwords(new File(".../stopwords.txt")); //stop words file.
Instances data = Filter.useFilter(data,filter);
Bạn cũng có thể đọc tài liệu sau để hiểu rõ hơn về API Weka cho Java.
http://weka.sourceforge.net/doc. Ổn định