Thống kê nào được sử dụng để xác định sự hiện diện của tín hiệu trong nhiễu?


12

Đây là một vấn đề phát hiện tôi tin rằng:

Tôi đang bị bối rối bởi những gì dường như là một vấn đề đơn giản. Về cơ bản, tôi có một nhóm quan tâm. Nếu năng lượng tín hiệu tồn tại trong dải quan tâm này, thì tôi thực hiện thao tác X trên tín hiệu của mình.

Vấn đề của tôi là tôi không chắc chắn chính xác làm thế nào để đi đến 'quyết định' nếu một tín hiệu tồn tại hay không. Trong đó, sau khi tôi thực hiện FFT, tôi có thể tìm kiếm các đỉnh.

Nhưng bây giờ thì sao?

  • Là thống kê được sử dụng thường so sánh đỉnh này với trung bình xung quanh của phổ? Hay là một số thống kê khác?
  • Tôi sử dụng biện pháp thống kê nào để đơn giản xác định xem có tín hiệu hay không và đi từ đó?
  • Làm cách nào để đặt giá trị này? Ngưỡng đơn giản?

EDIT Dựa trên phản hồi:

Đối với trường hợp đơn giản này, tôi giả sử một âm, trong tiếng ồn gaussian trắng. Những gì tôi đang cố gắng để có được một xử lý là:

  1. Làm thế nào chính xác một người tạo ra một đường cong ROC . Có ai phải đi và dán nhãn tất cả các dữ liệu trước, và sau đó nhận được tỷ lệ dương tính thật và dương tính giả cho vô số ngưỡng?

  2. Làm thế nào để giảm SNR ảnh hưởng đến đường cong ROC? Di chuyển nó về phía đường chéo?

  3. Việc điều chỉnh thích ứng đang làm gì với một đường cong ROC nhất định được tạo ra mà không có ngưỡng thích ứng?

    3a. Một số kỹ thuật ngưỡng thích ứng phổ biến tôi có thể xem là phổ biến là gì?


Bạn có muốn một thuật toán bó (ngoại tuyến) hoặc một thuật toán tuần tự (trực tuyến) không? Bạn có thống kê nhiễu và tín hiệu (nghĩa là bạn có thể mô tả tỷ lệ khả năng) không? Nếu vậy, bạn đã thử sử dụng SPRT chưa?
Emre

@Emre Nó có thể ngoại tuyến. Tôi không thực sự chắc chắn ý của bạn về thống kê tín hiệu / nhiễu, tôi có một cảm biến sẽ đo tín hiệu (âm thanh) khi có nhiễu và SNR của nó có thể thay đổi ...
Spacey

Ông có nghĩa là: các tính chất thống kê của tiếng ồn và tín hiệu là gì? Bạn có biết sự phân phối của tiếng ồn? Còn việc phân phối tín hiệu cộng với nhiễu thì sao?
Jason R

@JasonR Tôi thấy. Chà, tín hiệu sẽ là âm, và nhiễu là gaussian. Tui bỏ lỡ điều gì vậy?
Spacey

Có lẽ. Gaussian trắng? Vấn đề là để phân tích nó về mặt lý thuyết, bạn cần giả sử một số mô hình xác suất cho nhiễu và tín hiệu cộng với nhiễu. Dựa trên câu trả lời đó, bạn có thể làm điều đó.
Jason R

Câu trả lời:


9

Đây là một trong những vấn đề xử lý tín hiệu lâu đời nhất và có thể gặp phải một hình thức đơn giản trong phần giới thiệu về lý thuyết phát hiện. Có những cách tiếp cận lý thuyết và thực tế để giải quyết vấn đề như vậy, có thể hoặc không thể trùng lặp tùy thuộc vào ứng dụng cụ thể.

Pd Pfa

PdPfaPd=1Pfa=0và gọi nó là một ngày. Như bạn có thể mong đợi, nó không dễ dàng như vậy. Có một sự đánh đổi cố hữu giữa hai số liệu; thông thường nếu bạn làm một cái gì đó cải thiện một cái, bạn sẽ quan sát thấy một số sự xuống cấp trong cái khác.

Một ví dụ đơn giản: nếu bạn đang tìm kiếm sự hiện diện của xung dựa trên nền nhiễu, bạn có thể quyết định đặt ngưỡng ở đâu đó trên mức nhiễu "điển hình" và quyết định chỉ ra sự hiện diện của tín hiệu quan tâm nếu thống kê phát hiện của bạn bị phá vỡ trên ngưỡng. Muốn xác suất báo động sai thực sự thấp? Đặt ngưỡng cao. Nhưng sau đó, xác suất phát hiện có thể giảm đáng kể nếu ngưỡng nâng cao bằng hoặc cao hơn mức công suất tín hiệu dự kiến!

PdPfa

nhập mô tả hình ảnh ở đây

Một máy dò lý tưởng sẽ có đường cong ROC ôm sát đỉnh của cốt truyện; nghĩa là, nó có thể cung cấp sự phát hiện được đảm bảo cho bất kỳ tỷ lệ báo động sai nào. Trong thực tế, một máy dò sẽ có một đặc điểm trông giống như những âm mưu ở trên; tăng xác suất phát hiện cũng sẽ làm tăng tỷ lệ báo động sai và ngược lại.

Do đó, từ góc độ lý thuyết, các loại vấn đề này tập trung vào việc lựa chọn một số cân bằng giữa hiệu suất phát hiện và xác suất báo động sai. Làm thế nào sự cân bằng đó được mô tả về mặt toán học phụ thuộc vào mô hình thống kê của bạn cho quá trình ngẫu nhiên mà máy dò quan sát được. Mô hình thường sẽ có hai trạng thái hoặc giả thuyết:

H0:no signal is present
H1:signal is present

Thông thường, thống kê mà máy dò quan sát sẽ có một trong hai phân phối, theo đó giả thuyết là đúng. Sau đó, máy dò áp dụng một số loại thử nghiệm được sử dụng để xác định giả thuyết thực sự và do đó liệu tín hiệu có mặt hay không. Các bản phân phối của thống kê phát hiện là một chức năng của mô hình tín hiệu mà bạn chọn phù hợp với ứng dụng của mình.

Các mô hình tín hiệu phổ biến là phát hiện tín hiệu điều chế biên độ xung dựa trên nền của nhiễu Gaussian trắng phụ gia (AWGN) . Trong khi mô tả đó có phần cụ thể đối với truyền thông kỹ thuật số, nhiều vấn đề có thể được ánh xạ tới đó hoặc một mô hình tương tự. Cụ thể, nếu bạn đang tìm kiếm một âm có giá trị không đổi được định vị theo thời gian dựa trên nền của AWGN và máy dò quan sát cường độ tín hiệu, thì thống kê đó sẽ có phân phối Rayleigh nếu không có âm và phân phối Rician nếu có.

Khi một mô hình thống kê đã được phát triển, quy tắc quyết định của máy dò phải được chỉ định. Điều này có thể phức tạp như bạn mong muốn, dựa trên những gì có ý nghĩa cho ứng dụng của bạn. Lý tưởng nhất là bạn muốn đưa ra quyết định tối ưu theo một nghĩa nào đó, dựa trên kiến ​​thức của bạn về phân phối thống kê phát hiện theo cả hai giả thuyết, xác suất của mỗi giả thuyết là đúng và chi phí tương đối sai về giả thuyết ( mà tôi sẽ nói nhiều hơn một chút). Lý thuyết quyết định Bayes có thể được sử dụng như một khuôn khổ để tiếp cận khía cạnh này của vấn đề từ góc độ lý thuyết.

TT(t)t

TT=5Pd=0.9999Pfa=0.01

Nơi cuối cùng bạn quyết định ngồi trên đường cong hiệu suất là tùy thuộc vào bạn và là một tham số thiết kế quan trọng. Điểm hiệu suất phù hợp để lựa chọn phụ thuộc vào chi phí tương đối của hai loại lỗi có thể xảy ra: việc máy dò của bạn bỏ lỡ sự xuất hiện của tín hiệu khi nó xảy ra hay đăng ký sự xuất hiện của tín hiệu khi nó không xảy ra? Một ví dụ: một khả năng phát hiện đạn đạo-tên lửa-máy bay-với-tự động-tấn công giả tưởng sẽ được phục vụ tốt nhất để có tỷ lệ báo động rất sai; bắt đầu một cuộc chiến tranh thế giới vì một phát hiện giả sẽ là điều không may. Một ví dụ về tình huống ngược sẽ là một máy thu truyền thông được sử dụng cho các ứng dụng an toàn trong cuộc sống; nếu bạn muốn tự tin tối đa rằng nó không nhận được bất kỳ tin nhắn đau khổ nào,


Cảm ơn JasonR, bài viết rất hay. Tôi vẫn đang tiêu hóa bài viết của bạn, tuy nhiên một câu hỏi xuất hiện trong đầu. Chính xác thì đường cong ROC này được tạo ra như thế nào? Tôi hiểu rằng tôi đo tỷ lệ dương tính thật và dương tính giả cho bất kỳ phân loại nào và đánh dấu một điểm trong đường cong ROC. Vì vậy, điều gì đang được thay đổi để tôi có được nhiều điểm để tôi có thể tạo đường cong cho bất kỳ một phân loại nào?
Spacey

1
PdPfa

1

Thống kê là tỷ lệ khả năng (LR), và thử nghiệm là so sánh giữa tỷ lệ này với ngưỡng. Nếu bạn làm theo truyền thống đặt khả năng giả thuyết null trong mẫu số, bạn quyết định có lợi cho sự thay thế giả thuyết ( so với các giả thuyết ) nếu LR là đủ cao. Tỷ lệ càng cao, sự tự tin của bạn càng lớn. Đây là bài kiểm tra bạn sẽ thực hiện nếu bạn đã thu thập dữ liệu. Nếu bạn muốn quyết định khi dữ liệu đến bữa ăn, bạn có thể sử dụng thử nghiệm tuần tự , như SPRT .

Ở giai đoạn này, bạn có thể được hưởng lợi từ một cuốn sách về kiểm tra giả thuyết hoặc lý thuyết quyết định (tổng quát hơn).

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.