Hãy xem xét 4 tín hiệu dạng sóng sau:
signal1 = [4.1880 11.5270 55.8612 110.6730 146.2967 145.4113 104.1815 60.1679 14.3949 -53.7558 -72.6384 -88.0250 -98.4607]
signal2 = [ -39.6966 44.8127 95.0896 145.4097 144.5878 95.5007 61.0545 47.2886 28.1277 -40.9720 -53.6246 -63.4821 -72.3029 -74.8313 -77.8124]
signal3 = [-225.5691 -192.8458 -145.6628 151.0867 172.0412 172.5784 164.2109 160.3817 164.5383 171.8134 178.3905 180.8994 172.1375 149.2719 -51.9629 -148.1348 -150.4799 -149.6639]
signal4 = [ -218.5187 -211.5729 -181.9739 -144.8084 127.3846 162.9755 162.6934 150.8078 145.8774 156.9846 175.2362 188.0448 189.4951 175.9540 147.4631 -89.9513 -154.1579 -151.0851]
Chúng tôi nhận thấy rằng tín hiệu 1 và 2 trông giống nhau và tín hiệu 3 và 4 trông giống nhau.
Tôi đang tìm kiếm một thuật toán lấy tín hiệu đầu vào n và chia chúng thành các nhóm m, trong đó các tín hiệu trong mỗi nhóm là tương tự nhau.
Bước đầu tiên trong thuật toán như vậy thường sẽ là tính toán một vectơ đặc trưng cho mỗi tín hiệu: .
Để làm ví dụ, chúng ta có thể định nghĩa vectơ đặc trưng là: [width, max, max-min]. Trong trường hợp đó, chúng tôi sẽ nhận được các vectơ tính năng sau:
Điều quan trọng khi quyết định về một vectơ đặc trưng là các tín hiệu tương tự có được các vectơ đặc trưng gần nhau và các tín hiệu khác nhau sẽ có các vectơ đặc trưng cách xa nhau.
Trong ví dụ trên, chúng tôi nhận được:
Do đó, chúng ta có thể kết luận rằng tín hiệu 2 giống với tín hiệu 1 hơn nhiều so với tín hiệu 3.
Là vectơ đặc trưng, tôi cũng có thể sử dụng các thuật ngữ từ biến đổi cosin rời rạc của tín hiệu. Hình dưới đây cho thấy các tín hiệu cùng với xấp xỉ các tín hiệu theo 5 thuật ngữ đầu tiên từ biến đổi cosine rời rạc:
Các hệ số cosin rời rạc trong trường hợp này là:
F1 = [94.2496 192.7706 -211.4520 -82.8782 11.2105]
F2 = [61.7481 230.3206 -114.1549 -129.2138 -65.9035]
F3 = [182.2051 18.6785 -595.3893 -46.9929 -236.3459]
F4 = [148.6924 -171.0035 -593.7428 16.8965 -223.8754]
Trong trường hợp này, chúng tôi nhận được:
Tỷ lệ này không hoàn toàn lớn như đối với vectơ tính năng đơn giản hơn ở trên. Điều này có nghĩa là vector tính năng đơn giản hơn là tốt hơn?
Cho đến nay tôi chỉ hiển thị 2 dạng sóng. Biểu đồ dưới đây cho thấy một số dạng sóng khác sẽ là đầu vào cho thuật toán như vậy. Một tín hiệu sẽ được trích xuất từ mỗi đỉnh trong âm mưu này, bắt đầu từ phút gần nhất bên trái của đỉnh và dừng ở phút gần nhất bên phải của đỉnh:
Ví dụ, signal3 được trích xuất từ âm mưu này giữa mẫu 217 và 234. Signal4 được trích xuất từ một âm mưu khác.
Trong trường hợp bạn tò mò; mỗi âm mưu như vậy tương ứng với các phép đo âm thanh của micro tại các vị trí khác nhau trong không gian. Mỗi micrô nhận được cùng một tín hiệu nhưng tín hiệu bị dịch chuyển theo thời gian và bị biến dạng từ micrô sang micrô.
Các vectơ đặc trưng có thể được gửi đến một thuật toán phân cụm, chẳng hạn như k-nghĩa là nhóm các tín hiệu với các vectơ đặc trưng gần nhau.
Có ai trong số các bạn có bất kỳ kinh nghiệm / lời khuyên nào về việc thiết kế một vectơ đặc trưng sẽ tốt trong việc phân biệt tín hiệu dạng sóng không?
Ngoài ra thuật toán phân cụm nào bạn sẽ sử dụng?
Cảm ơn trước cho bất kỳ câu trả lời!