Có thể sử dụng một máy tạo sóng hẹp để phân tách giọng nói


7

Trong luận án thạc sĩ của tôi, tôi đang cố gắng thực hiện một Beamformer.

Tôi đã thực hiện phần tổng chậm trễ 1 năm trước. Tôi đa được kể:

trong bộ lọc FIR chúng ta có thể làm

FFT -> null thùng tần số không mong muốn -> IFFT.

Chúng ta có thể giống nhau trong Beamformers. Nếu chúng ta biết nhiễu DOA (như 0 ở góc 25 và 1 ở mọi nơi khác trong khoảng từ -90 đến 90), chúng ta có thể ---> IFFT và sử dụng các trọng số trong các phần tử tách rời.

Bất cứ điều gì tôi đã thử nó đều không hoạt động. Hơn tôi bắt đầu đọc sách, đáng ngạc nhiên là không thể tìm thấy phương pháp mà cố vấn của tôi nói với tôi. Thay vào đó tôi đã tìm ra các phương pháp như MVDR, LCMV. Bây giờ tôi đang cố gắng sử dụng lcmvweights của phương pháp MATLAB để có trọng số chính xác cho từng phần tử và áp dụng trong công cụ định dạng độ trễ tổng của tôi. Ngay cả khi tôi thành công khi sử dụng phương pháp này, tôi cũng tò mò liệu có thể sử dụng các máy tạo tia hẹp trong các tín hiệu phức tạp như lời nói không?

Câu trả lời:


5

Nếu bạn đang xử lý nói 8 kHz cho băng thông giọng nói danh nghĩa là 4kHz tức là 0 Hz - 4 kHz, thì về cơ bản lời nói đó là tín hiệu băng rộng. Do đó, Beamforming băng hẹp sẽ không hoạt động tốt. Mô hình chùm tia của bạn sẽ ổn đối với tần suất quan tâm cụ thể - nhưng một khi bạn bắt đầu di chuyển ra khỏi tần số đó, mô hình chùm tia của bạn sẽ xấu đi.

Những gì bạn đang tìm kiếm là định dạng chùm băng rộng - sử dụng độ trễ thời gian thực tế (hoặc dịch pha pha tuyến tính theo tần số trong miền tần số) thay vì chỉ dịch pha.

Thông thường các kỹ thuật như LCMV và MVDR được phát triển cho tín hiệu băng tần hẹp. Có một số cách tiếp cận vấn đề băng rộng:

  1. Sử dụng một dòng trì hoãn khai thác trên mỗi kênh. Nếu bạn cón các kênh và m vòi trên mỗi kênh thì ma trận tương quan của bạn là mn x mn. Vì vậy, các hệ phương trình trở nên rất lớn.
  2. Sử dụng một loạt các chùm tia hẹp. Trong trường hợp này bạn sẽ cóm chùm tia (m tần số) mỗi người có nkênh truyền hình. Bây giờ mỗi Beamformer có mộtn x n ma trận tương quan, nhưng bạn có mcủa họ. Vì vậy, nó dẫn đến giảm độ phức tạp từ trường hợp trước.
  3. Bạn có thể tạo thành một bộ b dầm thông thường (sử dụng thời gian trễ thay vì chỉ hệ số nhân pha) và sau đó thực hiện xử lý thích ứng trên dầm.

Tài liệu tham khảo tốt nhất tôi có thể nghĩ đến là của Van Plants - Xử lý mảng tối ưu. Lưu ý đôi khi bạn gặp phải một số khác biệt nhỏ về thuật ngữ - một số văn bản sẽ biểu thị MVDR là sử dụng ma trận tương quan tín hiệu, trong khi các văn bản khác sử dụng ma trận tương quan tín hiệu cộng với nhiễu - Hãy cẩn thận khi xem. Tôi biết Van Plants tạo ra sự khác biệt giữa hai trường hợp. Hầu hết các văn bản khác không và chỉ sử dụng một công thức và gọi nó là MVDR.


Tôi có cần phải đi sâu vào công cụ ma trận Tương quan. Tôi đang thiếu nền tảng thiên văn, tôi đang đọc nhưng không thể hiểu chính xác. Bạn nghĩ gì tôi có thể trực tiếp sử dụng chức năng lcmvweights trong matlab? Hơn sử dụng chúng trực tiếp trong máy tạo tia trễ tổng mà tôi đã thực hiện.
Kadir Erdem Demir

@KadirErdemDemir Nếu bạn đang sử dụng tùy chọn 2 (từ phía trên) thì có, bạn có thể sử dụng trọng lượng lcmv. Tôi không quen thuộc với lcmvweights của Matlab - trừ khi nó xử lý định dạng dải tần rộng, bạn sẽ không thể sử dụng các đầu ra trong một máy tạo tia tổng hợp trễ thực sự (tùy chọn 1) (trái ngược với triển khai dịch pha)
David

5

Công trình của Darren Ward, Rod Kennedy và Bob Williamson đã nghiên cứu cách thiết kế các bộ lọc được áp dụng cho một máy tạo sóng trễ và tổng cho phép thu tín hiệu băng rộng.

Như bạn có thể thấy trong hình 2 của chúng, một máy tạo sóng dải hẹp không hoạt động tốt như tần số thay đổi từ tần số thiết kế.

nhập mô tả hình ảnh ở đây

Sự lựa chọn phù hợp của các bộ lọc trong các đường dẫn của máy tạo tia trễ và tổng cho phép tạo ra đáp ứng mảng phụ thuộc tần số ít hơn (hình 4 từ bài báo của chúng bên dưới).

nhập mô tả hình ảnh ở đây

Một bài báo sau mà tôi đã làm với Darren và Bob cho thấy rằng có thể có một thiết kế bất biến tần số định vị một giá trị chính xác theo một hướng nhất định (ví dụ: bài báo đó đã 20 tuổi trong năm nay).

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.