Tôi đã xây dựng mô hình LSTM để dự đoán các câu hỏi trùng lặp trên bộ dữ liệu chính thức của Quora. Các nhãn kiểm tra là 0 hoặc 1. 1 cho biết cặp câu hỏi bị trùng lặp. Sau khi xây dựng mô hình bằng cách sử dụng model.fit
, tôi kiểm tra mô hình bằng cách sử dụng model.predict
dữ liệu thử nghiệm. Đầu ra là một mảng các giá trị giống như dưới đây:
[ 0.00514298]
[ 0.15161049]
[ 0.27588326]
[ 0.00236167]
[ 1.80067325]
[ 0.01048524]
[ 1.43425131]
[ 1.99202418]
[ 0.54853892]
[ 0.02514757]
Tôi chỉ hiển thị 10 giá trị đầu tiên trong mảng. Tôi không hiểu ý nghĩa của các giá trị này là gì và nhãn dự đoán cho mỗi cặp câu hỏi là gì?