Đây là một chuyến đi phụ từ ứng dụng ngáy của tôi .
Tôi đã có một vết nứt trong việc tạo ra sự tự tương quan tín hiệu âm thanh, để xem liệu điều đó có "tương quan" với ngáy / thở rất tốt không. Tôi có một thuật toán đơn giản (tạo ra 1.0 là phần tử zeroth, đây là một dấu hiệu tốt), nhưng tôi tự hỏi làm thế nào để đánh giá kết quả để xác định xem liệu tự động có mạnh hay không, và có lẽ hơn nữa, làm thế nào để sử dụng nó để phân tách nguồn âm thanh khác nhau có thể.
Câu hỏi số 1: RMS của tự động tương quan (bỏ qua phần tử 0) có phải là một số liệu "chất lượng" tốt như bất kỳ, hoặc có điều gì tốt hơn không?
Để giải thích: Tôi chỉ đơn giản muốn một cách số (so với "nhìn" vào biểu đồ) để phân biệt tín hiệu tương quan cao với tín hiệu tương thích kém hơn.
(Tôi thực sự không biết đủ để biết những câu hỏi khác.)
Một số kết quả ban đầu: Trong một số trường hợp, tự động tương quan (RMS hoặc đỉnh) cho thấy một bước nhảy mạnh mẽ trên ngáy - chính xác là phản ứng tôi muốn thấy. Trong các trường hợp khác, không có chuyển động rõ ràng nào trong các biện pháp này (và đây có thể là hai tiếng ngáy liên tiếp với hai phản ứng) và trong các tình huống tiếng ồn cao, các phép đo thực sự nhúng (hơi) trong khi ngáy.
Cập nhật - 22 tháng 5: Cuối cùng tôi cũng có một chút thời gian để làm việc này thêm một số. (Tôi đã bị loại bỏ trên một ứng dụng khác đúng nghĩa là một nỗi đau.) Tôi đã đưa đầu ra của tự tương quan vào một FFT và đầu ra hơi thú vị - nó cho thấy một đỉnh khá kịch tính gần gốc khi bắt đầu ngáy.
Vì vậy, bây giờ tôi phải đối mặt với vấn đề định lượng đỉnh này bằng cách nào đó. Điều kỳ lạ là các đỉnh cao nhất, về độ lớn tuyệt đối, xảy ra vào thời điểm khác, nhưng tôi đã thử tỷ lệ của cực đại với trung bình số học và điều đó theo dõi khá tốt. Vì vậy, một số cách tốt để đo lường "đỉnh cao" của FFT là gì. (Và xin đừng nói rằng tôi cần phải thực hiện FFT của nó - điều này đã gần với việc nuốt đuôi của chính nó. :))
Ngoài ra, đối với tôi, chất lượng của FFT có thể được cải thiện phần nào nếu tôi phản ánh các kết quả tự tương quan được đưa vào, với số 0 (theo định nghĩa là 1 độ lớn) ở giữa. Điều này sẽ đặt "đuôi" trên cả hai đầu. Đây có phải (có thể) một ý tưởng tốt? Hình ảnh phản chiếu nên được dựng đứng hoặc đảo ngược? (Tất nhiên, tôi sẽ thử nó bất kể bạn nói gì, nhưng tôi nghĩ có lẽ tôi sẽ nhận được một số gợi ý về các chi tiết.)
Đã thử phẳng
Các trường hợp thử nghiệm của tôi có thể được chia thành loại "cư xử đúng mực" và loại "trẻ có vấn đề".
Đối với các trường hợp thử nghiệm "hoạt động tốt", độ phẳng của FFT của sự tự tương quan giảm đáng kể và tỷ lệ cực đại so với mức độ tự tương quan trung bình leo lên trong một tiếng ngáy. Tỷ lệ của hai số đó (tỷ lệ cực đại chia cho độ phẳng) đặc biệt nhạy cảm, thể hiện sự leo lên 5-10 lần trong khi thở / ngáy.
Tuy nhiên, đối với "những đứa trẻ có vấn đề", các con số lại đi theo hướng ngược lại. Tỷ lệ đỉnh / trung bình giảm nhẹ trong khi độ phẳng thực sự tăng 50-100%
Sự khác biệt giữa hai loại này là (hầu hết) ba lần:
- Mức độ tiếng ồn (thường) cao hơn trong "trẻ em có vấn đề"
- Mức âm thanh (khá nhiều luôn luôn) thấp hơn trong "vấn đề trẻ em"
- "Trẻ có vấn đề" có xu hướng bao gồm thở nhiều hơn và ngáy thực tế ít hơn (và tôi cần phát hiện cả hai)
Có ý kiến gì không?
Cập nhật - 25/05/2012: Đó là một chút sớm để có một điệu nhảy chiến thắng, nhưng khi tôi phản ánh sự tự kỷ về một điểm, đã lấy FFT về điều đó, và sau đó làm phẳng quang phổ, sơ đồ tỷ lệ kết hợp của tôi cho thấy một bước nhảy tốt trong một số môi trường khác nhau. Phản ánh sự tự tương quan dường như cải thiện chất lượng của FFT.
Tuy nhiên, một điểm nhỏ là, vì "thành phần DC" của "tín hiệu" phản xạ bằng 0, kết quả FFT của zeroth luôn bằng 0 và loại này phá vỡ một ý nghĩa hình học bao gồm 0. Nhưng bỏ qua phần tử zeroth dường như hoạt động.
Kết quả tôi nhận được không đủ để xác định ngáy / hơi thở, nhưng dường như đó là một "xác nhận" khá nhạy cảm - nếu tôi không nhận được "bước nhảy" thì có lẽ đó không phải là tiếng ngáy / hơi thở.
Tôi đã không phân tích kỹ, nhưng tôi nghi ngờ rằng những gì đang xảy ra là âm thanh huýt sáo xảy ra ở đâu đó trong khi thở / ngáy, và tiếng còi đó là thứ được phát hiện.