Làm cách nào để tối ưu hóa độ dài cửa sổ trong STFT?


12

Tôi có nhiều tín hiệu EEG và tôi muốn phân tích chúng bằng các phương pháp tuyến tính như STFT (Biến đổi Fourier thời gian ngắn). Trong STFT, Làm cách nào tôi có thể tối ưu hóa độ dài cửa sổ phân tích, để phản ánh phổ tần số của từng cửa sổ phân tích một cách thích hợp?


Nếu bạn sẽ tối ưu hóa một cái gì đó, bạn cần một biện pháp khách quan. Câu hỏi của bạn không thực sự nói cách bạn đo chiều dài cửa sổ "tối ưu". Bạn có ý nghĩa gì khi phản ánh phổ tần số theo "cách thích hợp?"
Jason R

@Maen: bạn muốn phân tích tín hiệu EEG để làm gì với chúng?
Sriram

Phiếu bầu và xác nhận câu trả lời tốt nhất là bắt buộc
Laurent Duval

Câu trả lời:


5

Đây là "nguyên tắc bất định" cổ điển của Biến đổi Fourier. Bạn có thể có độ phân giải cao về thời gian hoặc độ phân giải cao về tần số nhưng không phải cả hai cùng một lúc. Độ dài cửa sổ cho phép bạn trao đổi giữa hai.

Nếu bạn muốn phát hiện "sự kiện" trong tín hiệu EEG của mình với độ phân giải 10ms, thì đây sẽ là chiều dài cửa sổ của bạn. Điều này sẽ cung cấp cho bạn độ phân giải tần số khoảng 100 Hz.


3

Độ dài cửa sổ tối ưu sẽ phụ thuộc vào ứng dụng của bạn. Nếu ứng dụng của bạn như vậy mà bạn cần thông tin miền thời gian để chính xác hơn, hãy giảm kích thước cửa sổ của bạn. Nếu ứng dụng yêu cầu thông tin miền tần số cụ thể hơn, thì hãy tăng kích thước của các cửa sổ. Như Hilmar đã đề cập, Uncertainty Principlethực sự khiến bạn không còn lựa chọn nào khác. Bạn không thể có được độ phân giải hoàn hảo trong cả hai miền cùng một lúc. Bạn có thể nhận được độ phân giải hoàn hảo chỉ trong một miền với chi phí phân giải bằng 0 ở miền kia (miền thời gian và tần số) hoặc ở giữa độ phân giải, nhưng ở cả hai miền.

Tôi không biết nếu điều này trả lời câu hỏi của bạn vì bạn đã hỏi cụ thể về STFT. Bạn có thể thử sử dụng wavelet transformsđể lấy thông tin trong tín hiệu. Wavelet transformssẽ cung cấp cho bạn độ phân giải trên một phạm vi lớn hơn nhiều bằng cách phân tích tín hiệu ở nhiều độ phân giải cửa sổ.


0

Tôi không biết EEG nhưng vấn đề cơ bản (có lẽ tôi nên nói là cơ bản) khi sử dụng STFT là chọn độ dài cửa sổ phù hợp. Nếu điện não đồ của bạn định kỳ và bạn muốn giải quyết vấn đề cơ bản và hài hòa, bạn nên sử dụng cửa sổ 'dài'. Thay vào đó, nếu bạn muốn phát hiện sự khởi đầu hoặc sự hiện diện của một sự kiện nào đó hoặc bạn quan tâm nhiều hơn đến đường bao của quang phổ, bạn có thể sử dụng cửa sổ 'ngắn'.


0

Tôi đã dành rất nhiều thời gian để tối ưu hóa các cửa sổ trong phân tích tần suất thời gian hoặc ngân hàng bộ lọc . Người ta có thể tối ưu hóa chúng để phát hiện, khử nhiễu, tách tín hiệu ... Nó phụ thuộc rất nhiều vào ứng dụng. Vì phân tích tần số thời gian thường là dư thừa, tối ưu hóa các cửa sổ phân tích hoặc tổng hợp là các nhiệm vụ khác nhau. Và chiều dài chỉ có một tham số trong thiết kế cửa sổ.

Vấn đề thậm chí còn phức tạp hơn khi công thức tối ưu hóa rời rạc phức tạp hơn nhiều so với trường hợp miền thời gian liên tục (xem ví dụ: Biến đổi Gabor tập trung tối ưu cho các thành phần tần số thời gian cục bộ ).

Vì vậy, quy tắc thực tế hiện tại của tôi là: bắt đầu với hình dạng cửa sổ và chiều dài có vẻ ổn. Sau đó lặp lại phân tích với hai cửa sổ với hai lần rưỡi chiều dài và kết hợp các kết quả.


-1

Thông thường kích thước cửa sổ rộng cho độ phân giải tần số tốt hơn nhưng độ phân giải thời gian kém và ngược lại. Nhìn vào ví dụ này nơi tôi đã tạo ra một phổ của sóng hình sin với 5kHz và tốc độ mẫu là 22050Hz, từ mã C ++ của tôi.

nhập mô tả hình ảnh ở đây

Biểu đồ trên có kích thước cửa sổ 2048 mẫu và chồng chéo 1024 mẫu.

Nhìn vào biểu đồ này:

nhập mô tả hình ảnh ở đây

Cái này có kích thước cửa sổ 512 mẫu và chồng lên 256 mẫu.

Bạn có thể thấy sự khác biệt? Cái đầu tiên có độ phân giải tần số tốt hơn cái thứ hai. Nhưng cái thứ hai có độ phân giải thời gian tốt hơn khi so với cái thứ nhất. Vì vậy, việc chọn kích thước cửa sổ phụ thuộc vào ứng dụng của bạn. Nếu bạn đang xử lý các mẫu giọng nói để theo dõi cao độ, việc chọn kích thước cửa sổ lớn hơn sẽ là lựa chọn phù hợp.


Sóng hình sin đơn giản là không tốt để giải thích độ phân giải tần số. Ngay cả quét sin cũng tốt hơn cho điều đó.
jojek

Vì vậy, loại đầu vào nào sẽ tốt, theo bạn?
vishnu

Tôi đã đề cập ở trên.
jojek

Bạn có nghĩa là quét sin?. Có loại tín hiệu nào khác mà tôi có thể sử dụng không? Tôi có một bài thuyết trình trên phổ và muốn hiển thị một số nội dung hay trong slide của tôi về các cửa sổ. Sẽ đánh giá cao bất kỳ lời khuyên nào :)
vishnu
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.