Ý nghĩa của các tính năng tiềm ẩn?


15

Tôi đang cố gắng hiểu các mô hình nhân tố ma trận cho các hệ thống đề xuất và tôi luôn đọc 'các tính năng tiềm ẩn', nhưng điều đó có nghĩa là gì? Tôi biết một tính năng có nghĩa là gì đối với tập dữ liệu đào tạo nhưng tôi không thể hiểu ý tưởng về các tính năng tiềm ẩn. Mỗi bài viết về chủ đề tôi có thể tìm thấy chỉ là quá nông.

Biên tập:

nếu bạn ít nhất có thể chỉ cho tôi một số giấy tờ giải thích ý tưởng.


Dưới đây là ví dụ đơn giản có thể giúp bạn quuxlabs.com/blog/2010/09/ uy
Akavall 16/07/14

Câu trả lời:


9

Tiềm ẩn có nghĩa là không thể quan sát trực tiếp. Việc sử dụng phổ biến thuật ngữ trong PCA và Phân tích nhân tố là để giảm kích thước của một số lượng lớn các tính năng quan sát trực tiếp thành một tập hợp nhỏ hơn các tính năng có thể quan sát gián tiếp.


Vì vậy, kích thước giảm là các tính năng tiềm ẩn? Trong trường hợp của PCA, các vectơ riêng của ma trận hiệp phương sai, tức là các thành phần chính, phải không?
Jack Twain

Đúng @AlexTwain
samthebest

Bạn có thể cung cấp cho tôi một hướng dẫn / giấy đề cập đến điều đó? Tôi không thể tìm thấy bất kỳ hướng dẫn / giấy có hệ thống!
Jack Twain

Vâng, trang wiki khá tốt, bạn có thể theo dõi các tài liệu tham khảo ở đó nếu bạn thực sự muốn en.wikipedia.org/wiki/Latent_variable
samthebest

1
@JackTwain tương tự PCA chính xác là các tính năng tiềm ẩn là các hàm riêng. Các thành phần chính là các trọng số được gán cho mỗi quan sát cho các hàm riêng. Trong các mô hình nhân tố ma trận khác, các tính năng tiềm ẩn đóng vai trò của các hàm riêng. Điều này nghe có vẻ khoa trương, nhưng sai lầm không tạo ra sự nhầm lẫn cho mọi người.
phỏng đoán

3

Trong bối cảnh Phương thức Factorization, các tính năng tiềm ẩn thường được dùng để mô tả các mục dọc theo mỗi chiều. Hãy để tôi giải thích bằng ví dụ.

RRuipuTqipuuqii

puqi


Tôi đã đọc các bài báo trong đó các tính năng tiềm ẩn (giả sử "vectơ người dùng") được sử dụng để dự đoán một số biến mục tiêu, hãy sử dụng giới tính làm ví dụ. Nó "hoạt động" trong đó một mô hình dự đoán có thể được xây dựng theo cách này. Câu hỏi của tôi là sự khác biệt giữa "vectơ người dùng" và, giả sử, tính trung bình của "vectơ mục" cho tất cả các mục mà người dùng đã "truy cập" là gì? IOW, bạn sẽ mong đợi mô hình dự đoán được đề cập ở trên sẽ tốt hơn hoặc xấu hơn với mô hình này so với mô hình kia? Cảm ơn (nếu bạn từng thấy điều này).
thecity2

@ thecity2, bạn có thể trung bình các mục của người dùng và điều này thực sự hữu ích khi bạn giao dịch với người mới mà bạn không tính toán các vectơ người dùng (mặc dù rất khó để chạy một vài lần lặp tối ưu hóa để tính toán nó). Ngoài ra còn có một vấn đề với tính trung bình đơn giản: người dùng đã tiêu thụ càng nhiều vật phẩm - gần như bằng không vectơ vật phẩm trung bình của họ (vì thường xuyên L2, và có thể các đặc tính khó chịu khác của không gian chiều cao). Cuối cùng, có một vectơ riêng sẽ linh hoạt hơn: mô hình của bạn có thể học được tính trung bình như vậy.
Artem Sobolev

Điều đó nói rằng, có những nỗ lực sử dụng lịch sử của người dùng để mô hình hóa vector của người dùng. Ví dụ: xem bài viết "Xây dựng đề xuất âm nhạc của riêng bạn bằng cách mô hình hóa các luồng phát thanh trên Internet"
Artem Sobolev

0

Tôi muốn nói rằng các yếu tố mang tính đại diện hơn các thành phần chính để có được nhận thức về 'độ trễ' / độ ẩn của một biến. Độ trễ là một trong những lý do tại sao các nhà khoa học hành vi đo lường các cấu trúc tri giác như cảm giác, nỗi buồn về nhiều mặt hàng / biện pháp và rút ra một số cho các biến ẩn như vậy không thể đo lường trực tiếp.


0

Ở đây dữ liệu của bạn là xếp hạng được đưa ra bởi nhiều người dùng cho các bộ phim khác nhau. Như những người khác đã chỉ ra, có nghĩa là tiềm ẩn không thể quan sát trực tiếp.

Đối với một bộ phim, các tính năng tiềm ẩn của nó xác định số lượng hành động, lãng mạn, cốt truyện, diễn viên nổi tiếng, v.v. Tương tự, đối với một tập dữ liệu khác bao gồm các chữ số viết tay, các biến tiềm ẩn có thể là góc cạnh, độ nghiêng, v.v.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.