Làm cách nào để kiểm tra xem hai tín hiệu có được phân phối bình thường không?


10

Như đã giải thích trên trang Wikipedia này , nếu hai biến ngẫu nhiên X và Y không tương quan và được phân phối bình thường, thì chúng độc lập thống kê.

Tôi biết cách kiểm tra xem X và Y có tương quan với nhau không, nhưng không biết làm thế nào để kiểm tra xem chúng có được phân phối bình thường hay không. Tôi hầu như không biết bất kỳ số liệu thống kê nào (tôi đã học được phân phối bình thường là gì vài tuần trước), vì vậy một số câu trả lời giải thích (và có thể một số liên kết đến hướng dẫn) sẽ thực sự hữu ích.

Vì vậy, câu hỏi của tôi là: Có hai tín hiệu được lấy mẫu với số lần N hữu hạn, làm thế nào tôi có thể kiểm tra xem hai mẫu tín hiệu có được phân phối bình thường không?

Ví dụ: các hình ảnh dưới đây cho thấy phân phối chung ước tính của hai tín hiệu, s1 và s2, trong đó:

x=0.2:0.2:34;
s1 = x*sawtooth(x); %Sawtooth
s2 = randn(size(x,2)); %Gaussian

nhập mô tả hình ảnh ở đây nhập mô tả hình ảnh ở đây

Pdf chung được ước tính bằng Công cụ ước tính mật độ hạt nhân 2D này .

Từ các hình ảnh, có thể dễ dàng thấy rằng pdf chung có hình dạng giống như ngọn đồi tập trung ở gốc. Tôi tin rằng đây là dấu hiệu cho thấy chúng thực tế được phân phối chung. Tuy nhiên, tôi muốn có một cách để kiểm tra toán học. Có một số loại công thức có thể được sử dụng?

Cảm ơn bạn.


Đây là một mô phỏng nơi bạn bắt đầu với các tín hiệu mà không phải là cùng bình thường bằng cách xây dựng và thủ tục thống kê của bạn dường như được cho thấy rằng người ta có thể được hợp lý tự tin rằng các tín hiệu trên thực tế cùng bình thường. Vì vậy, bạn nên kiểm tra xem (a) phương pháp thống kê đã được áp dụng, hoặc một cách chính xác áp dụng, hoặc một cách chính xác giải thích, hoặc (b) Phương pháp thế hệ tín hiệu của bạn đang dẫn đầu các tín hiệu mà trên thực tế cùng bình thường mặc dù một prima facie trường hợp không thể được thực hiện cho sự bình thường chung (như trường hợp nếu s1 = randn(size(x,2));; s2 = randn(size(x,2));??
Dilip Sarwate

@DilipSarwate Đó sẽ là (b). Tôi muốn một cách để kiểm tra xem phân phối chung trên thực tế là bình thường.
Rachel

Câu trả lời:


6

Ngoài kiểm tra đồ họa, bạn có thể sử dụng một bài kiểm tra cho tính chuẩn . Đối với dữ liệu bivariate, các thử nghiệm của Mardia là một lựa chọn tốt. Họ định lượng hình dạng phân phối của bạn theo hai cách khác nhau. Nếu hình dạng trông không bình thường, các thử nghiệm cho giá trị p thấp.

Thực hiện Matlab có thể được tìm thấy ở đây .


2

Đây là một nhận xét mở rộng hơn là một nỗ lực cải thiện đề xuất cụ thể của @ MånsT: Kiểm tra thống kê và lớn không phải là kiểm tra phân phối nào tạo ra dữ liệu mà là những gì KHÔNG. Có một vài bài kiểm tra được "điều chỉnh" để đưa ra câu trả lời cho câu hỏi về tính quy tắc: Đây có phải là từ Phân phối Bình thường không. Thử nghiệm Kolmogorov-Smirnov một mẫu được biết đến khá rộng rãi. Thử nghiệm Anderson Darling có lẽ mạnh hơn trong trường hợp một chiều. Bạn nên nghiêm túc tự hỏi, TẠI SAO câu trả lời quan trọng? Mọi người thường đặt câu hỏi cho các mục đích thống kê sai. Ví dụ của bạn đã chứng minh rằng bài kiểm tra nhãn cầu đồ họa của bạn có sức mạnh thấp so với giải pháp thay thế bao gồm phương án răng cưa Gaussian, nhưng bạn chưa cho thấy sự thất bại đó ảnh hưởng đến câu hỏi tiềm ẩn của bạn như thế nào.


Trong trường hợp này, răng cưa thay thế trên thực tế là đúng vì đó là cách dữ liệu được tạo ra, nhưng thử nghiệm nhãn cầu đồ họa cho thấy không nên từ chối null (bình thường chung) . Hầu hết các nhà thống kê đều hiểu rằng việc không từ chối null không giống như chấp nhận null, nhưng OP muốn có một lý do toán học để biến việc không từ chối null thành một sự ôm trọn của null như sự thật nhận được ( sự thật bị nguyền rủa).
Dilip Sarwate

Đúng. Thực tế là nỗ lực kiểm tra mô phỏng của anh ta đã không từ chối đúng cách đã được hiểu (như trước đó bạn đã nhận xét). Làm thế nào một người nên tiếp cận vấn đề năng lượng thấp cho một phương pháp là trọng tâm của tư duy thống kê và không rõ anh ta đã nắm vững nguyên tắc cơ bản. Nhưng tôi đã không kết luận rằng anh ta yêu cầu một bài kiểm tra toán học phê chuẩn kết quả nhãn cầu của anh ta.
DWin

@DilipSarwate Nếu tôi không thể chứng minh rằng phân phối chung là bình thường, tôi muốn chứng minh rằng có một xác suất tốt rằng thực tế nó là như vậy. Tôi không phải là một nhà thống kê bởi bất kỳ sự tưởng tượng nào, nhưng sẽ không từ chối null ít nhất là một dấu hiệu tốt?
Rachel

@DWin Có lẽ bạn đúng và tôi chưa nắm bắt được nguyên tắc cơ bản đủ tốt. Như tôi đã nói, tôi là một người mới thống kê! Tôi biết rằng trên thực tế hai biến có thể được phân phối chung và sẽ giống như một cách để kiểm tra xem điều này có đúng không (ít nhất là với một mức độ tin cậy / xác suất nhất định). Và PS: chỉ là một ghi chú nhỏ - đó là cô ấy, không phải anh.
Rachel

@Rachel Những gì bạn đang cố gắng để "chứng minh", viz. rằng hai tín hiệu này là bình thường chung là prima facie không đúng vì một tín hiệu được tạo ra dưới dạng tín hiệu răng cưa và tín hiệu kia là nhiễu Gaussian. Nhưng dù sao bạn cũng cảm thấy rằng chúng là bình thường chung, và thử nghiệm của bạn cung cấp căn cứ hợp lý cho một niềm tin như vậy. Như Nữ hoàng Đỏ đã nói với Alice: "Đôi khi tôi đã tin có đến sáu điều không thể trước khi ăn sáng". Vì vậy, hãy tự tin rằng thử nghiệm đồ họa / nhãn cầu của bạn trong thực tế cho phép bạn kết luận với một số niềm tin rằng hai tín hiệu trên thực tế là bình thường, và tiến hành ngay lập tức.
Dilip Sarwate
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.