Phân loại trình tự vector


9

Tập dữ liệu của tôi bao gồm các chuỗi vector. Mỗi vector có 50 kích thước có giá trị thực. Số lượng vectơ trong một phạm vi trình tự từ 3-5 đến 10-15. Nói cách khác, độ dài của một chuỗi không cố định.

Một số lượng hợp lý của các chuỗi (không phải vectơ!) Được chú thích bằng nhãn lớp. Nhiệm vụ của tôi là tìm hiểu một trình phân loại đưa ra một chuỗi các vectơ, nhãn lớp cho toàn bộ chuỗi được tính toán.

Tôi không thể nói chính xác bản chất của dữ liệu nhưng bản chất của các chuỗi không phải là tạm thời. Tuy nhiên, vectơ không thể được hoán đổi với vectơ mà không thay đổi nhãn ( ). Nói cách khác, thứ tự của vectơ là quan trọng. Các vectơ là tương đương nhau, ví dụ, nó có ý nghĩa để tính toán một sản phẩm chấm và sử dụng giá trị tương tự này.xTôixjTôij

Câu hỏi của tôi là: các công cụ / thuật toán có thể giúp phân loại dữ liệu đó là gì?

CẬP NHẬT: Dữ liệu có một thuộc tính mà một hoặc rất ít vectơ ảnh hưởng mạnh đến nhãn lớp.

GIẢI PHÁP KHẢ NĂNG: Sau một số nghiên cứu, có vẻ như Mạng thần kinh tái phát (RNN) phù hợp với dự luật khá tự nhiên. Ý tưởng bao trùm là chọn kích thước ngữ cảnh , ghép các vectơ từ, thực hiện gộp tối đa và cung cấp thông qua NN cổ điển. Tại mỗi vị trí cửa sổ ngữ cảnh có thể có trong một câu, một vectơ đặc trưng được xây dựng. Ví dụ, vectơ tính năng cuối cùng được xây dựng bằng cách sử dụng tổng hợp tối đa. Việc truyền ngược được thực hiện để điều chỉnh các tham số của mạng. Tôi đã có một số kết quả tích cực (GPU là phải).k

Câu trả lời:


3

Vì bạn không thể tiết lộ nhiều chi tiết, tôi buộc phải có một chút chung chung trong câu trả lời của mình. Tôi hy vọng nó sẽ hữu ích tuy nhiên. Trước hết, tôi chỉ xem xét việc giảm các chuỗi trước khi phân loại (có thể bằng cách sử dụng sản phẩm chấm hoặc một thứ khác) nếu bạn có thể chắc chắn rằng bạn không mất thông tin bạn cần để phân loại sau đó. Vì vậy, cách tiếp cận này chỉ khả thi nếu bạn có một số hiểu biết sâu sắc về bản chất của phân loại. Để đưa ra một ví dụ đơn giản: nếu nhãn lớp chỉ là số lượng vectơ trong chuỗi của bạn, bạn sẽ không thành công lắm trong việc dự đoán nhãn lớp từ sản phẩm chấm.

Do đó, tôi sẽ lấy toàn bộ chuỗi làm đầu vào để phân loại và áp đặt tối đa cho độ dài chuỗi bạn muốn xem xét. Trước tiên, bạn có thể thực hiện việc này bằng cách tìm độ dài chuỗi tối đa m trong tập huấn luyện của mình và sau đó biến từng chuỗi vectơ 50 chiều thành một vectơ có kích thước 50 * m, có thể có một số giá trị bị thiếu ở cuối nếu chuỗi của bạn không có chiều dài tối đa. Bạn có thể sẽ muốn thoát khỏi những giá trị còn thiếu này và bạn có thể chỉ muốn thay thế chúng bằng số không.

Có hai con đường bạn có thể đi từ đây: 1.) Bạn trực tiếp áp dụng các phương pháp phân loại được biết là phù hợp với kích thước cao. Hãy thử một cái gì đó đơn giản mà không cần điều chỉnh nhiều như Bayes ngây thơ. Bằng cách này bạn có thể xem liệu phương pháp này có khả thi hay không mà mất quá nhiều thời gian nếu không. 2.) Bạn cố gắng đầu tiên để giảm kích thước và hiểu bản chất của phân loại tốt hơn. Bạn có thể muốn sử dụng một cái gì đó như phân tích thành phần chính hoặc phân tích mối tương quan / liên kết giữa mỗi thành phần vector và nhãn lớp. Nếu bạn thành công, bạn biết cách giảm kích thước đầu vào chính xác trước khi áp dụng phân loại.

Nếu bạn muốn làm theo bất kỳ ý tưởng nào trong số những ý tưởng này, xin lưu ý rằng các chi tiết cụ thể của dữ liệu của bạn và phân loại có thể khiến bất kỳ ý tưởng nào được đề xuất ở trên không khả thi. Vì vậy, hãy cẩn thận kiểm tra bất kỳ chi tiết nào bạn biết nhưng không thể đăng ở đây trước khi cố gắng đảm bảo rằng bạn không lãng phí thời gian của mình.


0

Dữ liệu có một thuộc tính như vậy mà một hoặc rất ít vectơ ảnh hưởng mạnh đến nhãn lớp.

Cách tiếp cận tốt nhất (và dễ nhất) có lẽ chỉ đơn giản là huấn luyện một lớp phân loại trên mỗi vectơ và sau đó tính trung bình các dự đoán trên các vectơ cho một chuỗi đã cho. Các vectơ quan trọng sẽ có ảnh hưởng mạnh mẽ trong các dự đoán của chúng, trong khi các dự đoán cho các vectơ không quan trọng sẽ gần bằng 0,5 (hoặc tương tự cho một vấn đề phân loại không nhị phân).


Không hẳn vậy. Đặc biệt là nếu bạn có nhiều vectơ mà không có thông tin quan trọng .. Nếu bạn đi theo con đường đó, thì chắc chắn sử dụng LSTM :)
pir
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.