Xử lý các vectơ đặc trưng có độ dài thay đổi


8

Làm thế nào để một người đối phó với một vector tính năng có thể thay đổi kích thước?

Giả sử mỗi đối tượng, tôi tính toán 4 tính năng. Để giải quyết vấn đề hồi quy nhất định, tôi có thể có 1, 2 hoặc nhiều hơn các đối tượng này (không quá 10). Do đó, vectơ đặc trưng có chiều dài 4 * N. Làm thế nào điều này thường được giải quyết?

Các đối tượng đại diện cho các đối tượng vật lý (ví dụ người khác) viết một người quan sát. Đối với một lát cắt thời gian, một đối tượng có thể được đặt theo chiều ngang, theo chiều dọc, có một số tốc độ và một số tiêu đề (4 tính năng). Cố gắng giải quyết: nơi nào một người cảm thấy thoải mái nhất. Trong một số trường hợp chỉ có 1 đối tượng, nhưng có thể có 2 hoặc nhiều hơn.

Tuyên bố miễn trừ trách nhiệm : Tôi có kiến ​​thức hạn chế về phương pháp ML. Tôi đã có các lớp học ở trường đại học nhiều năm trước và tham gia khóa học ML của Andrew Ng trực tuyến như một chương trình bồi dưỡng nhưng nếu không thì không theo kịp tốc độ. Một nơi bắt đầu để nhìn được đánh giá cao.


Bạn có thể cho chúng tôi biết thêm một chút về đối tượng của bạn là gì và vấn đề hồi quy là gì không? Điều này có thể ảnh hưởng đến cách chúng tôi nghĩ bạn nên xử lý mã hóa tính năng.
Imran

@Imran Các đối tượng đại diện cho các đối tượng vật lý (ví dụ: người khác) ghi lại một người quan sát. Đối với một lát cắt thời gian, một đối tượng có thể được đặt theo chiều ngang, theo chiều dọc, có một số tốc độ và một số tiêu đề (4 tính năng). Cố gắng giải quyết: nơi nào một người cảm thấy thoải mái nhất. Trong một số trường hợp chỉ có 1 đối tượng, nhưng có thể có 2 hoặc nhiều hơn.
Otto Nahmee

@Emre Cập nhật câu hỏi ban đầu với ví dụ
Otto Nahmee

Cảm ơn bạn đã làm rõ. Bạn có một bộ huấn luyện được dán nhãn, ví dụ như một danh sách các tình huống mà ai đó được bao quanh bởi các đối tượng này và bạn đã đánh dấu vị trí chính xác nơi họ cảm thấy thoải mái nhất?
Imran

@Imran Chưa phải là một bộ hoàn chỉnh - đây là thứ mà tôi vẫn đang trong quá trình thu thập
Otto Nahmee

Câu trả lời:


3

Trước hết chào mừng đến với cộng đồng!

Về câu hỏi tôi sẽ nói có những hiểu lầm. Bạn nói rằng bạn tính toán 4 tính năng "cho mỗi đối tượng". Nó có nghĩa là mọi điểm dữ liệu (đối tượng) được mô tả với 4 tính năng. Vì vậy, độ dài của các tính năng không khác nhau. Xin lưu ý rằng tôi nói điều này bởi vì "bạn tính toán các tính năng cho các mẫu / điểm dữ liệu / đối tượng của bạn" vì vậy mọi đối tượng ở đây là một điểm trong không gian 4 chiều. Nếu bạn có ý gì khác xin vui lòng sửa cho tôi.

Nói cách khác, bạn có một ma trận dữ liệu với một số hàng (số lượng đối tượng) và 4 cột.

Tổng quát hơn về toàn bộ khái niệm. Không, đây không phải là một cách tiếp cận hợp lệ để tạo dữ liệu tiêu chuẩn. Trong dữ liệu tiêu chuẩn, số lượng cột luôn giống nhau vì bạn không thể nghiên cứu các đối tượng nếu chúng được xác định trong các không gian khác nhau. Nhiều thuật toán ML cũng hoạt động với dữ liệu tiêu chuẩn, có nghĩa là bạn không thể sử dụng chúng nếu kích thước của các vectơ đặc trưng khác nhau. Nói một cách khái niệm hơn, kích thước của các tính năng bạn tính toán cho các đối tượng không thể thay đổi. Làm sao? Tôi muốn trích xuất các tính năng từ khuôn mặt. Tôi nói màu mắt , khoảng cách giữa hai mắtkhoảng cách giữa hai tai . Tôi có 3 tính năng và đối với bất kỳ ai đến nghiên cứu của tôi, tôi tính toán cùng một bộ tính năng. Làm thế nào kích thước có thể khác nhau nếu quá trình trích xuất tính năng là tiêu chuẩn?

Nhưng trong dữ liệu không chuẩn, bạn có thể gặp trường hợp như vậy. Trong trường hợp này, bạn có thể tiêu chuẩn hóa các tính năng. Ví dụ như một ví dụ bé, hãy tưởng tượng các biểu đồ khác nhau với số lượng nút và cạnh khác nhau. Bạn có thể mô tả mỗi biểu đồ với mức độ trung bình , độ dài đường dẫn trung bìnhsố lượng nút . Sau đó, mỗi biểu đồ được mô tả với 3 tính năng và bạn có thể đưa nó vào một thuật toán.

Nhưng nếu bạn không muốn chuẩn hóa dữ liệu (vì nó thường bị mất thông tin), bạn cần tìm các phương pháp phân tích phù hợp mà bạn cần giải thích thêm về dữ liệu của mình.

Tôi hy vọng nó đã giúp!

Chúc may mắn!


Cảm ơn! Bạn đã đề cập rằng trong dữ liệu tiêu chuẩn, số lượng cột luôn giống nhau , tôi có đúng không khi nói điều này áp dụng cho các hàng, vì vậy nó sẽ đọc như trong dữ liệu tiêu chuẩn, số lượng cột hàng luôn giống nhau ?
Otto Nahmee

1
Không Không Không ... Số lượng cột là các tính năng nên chúng phải giống nhau. nhưng số lượng hàng là kích thước của dữ liệu của bạn. Bạn có thể trích xuất 3 tính năng từ 10 người hoặc từ 20 người hoặc chỉ từ 1 người. Nói cách khác, khi bạn đang hiển thị các điểm theo tọa độ X, Y, Z, bạn có thể hiển thị 3 điểm hoặc 10 điểm. Chúng có thể khác nhau nhưng X, Y và Z là tọa độ cố định.
Kasra Manshaei

Tôi đang có một kịch bản như vậy trong đó tôi có số lượng giao diện khác nhau cho các thiết bị Mạng khác nhau, ở đây tôi không thể lấy trung bình của tất cả các giao diện, vì tất cả các giao diện đều khác nhau. Tôi sẽ sử dụng "phương pháp phân tích phù hợp" như bạn đã đề cập, trong trường hợp tôi không giải quyết, tôi chắc chắn sẽ giải thích rõ ràng vấn đề của mình và liên hệ lại với bạn. @KasraManshaei
debaonline4u

1
@ debaonline4u chắc chắn! Sẽ vui mừng giúp đỡ!
Kasra Manshaei

1

OK, có vẻ như bạn đang cố mã hóa vị trí và vận tốc của một số lượng đối tượng khác nhau vào mỗi ví dụ đào tạo.

Một cách để làm điều này là với hai mặt phẳng tính năng cho mỗi ví dụ đào tạo làm đầu vào kênh cho mạng thần kinh tích chập. Mặt phẳng tính năng đầu tiên mã hóa thành phần x vận tốc cho từng đối tượng tại vị trí của đối tượng đó và mặt phẳng thứ hai thực hiện tương tự cho thành phần y.

Vì bạn đã nói các vị trí liên quan đến người quan sát, tôi sẽ cho rằng người quan sát luôn ở cùng một vị trí, do đó không cần thêm bất kỳ thông tin bổ sung nào vào đầu vào.

Tôi cũng sẽ cho rằng hai đối tượng không thể ở cùng một nơi.

Ví dụ: giả sử bạn đang ở trong một thế giới 3x3 và bạn có các vật thể ở (0,1) và (2,2) với vận tốc (3,2) và (1,7) tương ứng. Ví dụ đầu vào này có thể được mã hóa thành:

[ 0 0 0
  3 0 0
  0 0 1 ]

[ 0 0 0
  2 0 0
  0 0 7 ]

Như bạn có thể thấy kích thước đầu vào luôn giống nhau cho dù có bao nhiêu đối tượng. Nhiều đối tượng sẽ chỉ dẫn đến nhiều mục khác không.

Tôi đã đề xuất một mạng lưới vì chúng hoạt động đặc biệt tốt với các vấn đề không gian, nhưng nếu bạn muốn thử mạng thần kinh vanilla trước thì bạn có thể làm phẳng hình dạng đầu vào của mình từ (m, 3,3,2) đến (m, 12).


Cảm ơn, đó là một cách tiếp cận khá thú vị. Có hạn chế nào mà tôi phải phân biệt phạm vi đầu vào không? Với bài toán hồi quy, các giá trị có thể liên tục, có điều gì có thể được thực hiện ở đây để biểu diễn các giá trị liên tục không?
Otto Nahmee
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.