Dưới đây là một ví dụ đồ chơi đơn giản minh họa hiệu ứng của kích thước trong vấn đề phân biệt đối xử, ví dụ như vấn đề bạn gặp phải khi bạn muốn nói nếu có gì đó được quan sát hoặc nếu chỉ quan sát được hiệu ứng ngẫu nhiên (vấn đề này là một vấn đề kinh điển trong khoa học).
Heuristic. Vấn đề quan trọng ở đây là định mức Euclidian có tầm quan trọng như nhau đối với bất kỳ hướng nào. Điều này cấu thành sự thiếu trước và như bạn chắc chắn biết ở chiều cao không có bữa ăn trưa miễn phí (nghĩa là nếu bạn không có ý tưởng trước về những gì bạn đang tìm kiếm, thì không có lý do gì mà một số tiếng ồn sẽ không giống như bạn tìm kiếm, đây là tautology ...).
Tôi muốn nói rằng đối với bất kỳ vấn đề nào, có một giới hạn thông tin cần thiết để tìm ra thứ gì đó ngoài tiếng ồn. Giới hạn này có liên quan bằng cách nào đó với "kích thước" của khu vực bạn đang cố gắng khám phá liên quan đến mức độ "tiếng ồn" (tức là mức độ nội dung không chính xác).
Ở chiều cao nếu bạn có trước tín hiệu của mình thưa thớt thì bạn có thể loại bỏ (tức là phạt) vectơ không thưa thớt bằng một số liệu lấp đầy không gian bằng vectơ thưa hoặc bằng cách sử dụng kỹ thuật ngưỡng.
Khung Giả sử rằng là một vectơ gaussian với trung bình và hiệp phương sai đường chéo ( được biết) và bạn muốn kiểm tra giả thuyết đơn giảnv σ tôi d σξνσTôiCười mở miệngσ
θ ∈ R n θ
H0:ν= 0 ,VSHθ:ν= θ
(đối với một ) không nhất thiết phải được biết trước.
θ ∈ Rviết sai rồiθ
Kiểm tra thống kê với năng lượng . Trực giác bạn chắc chắn có là một ý tưởng tốt để đánh giá định mức / năng lượng của bạn quan sátξđể xây dựng một thống kê kiểm tra. Trên thực tế bạn có thể xây dựng một tiêu chuẩn trung tâm (theoH0) phiên bảnTncủa năng lượngTn=Σiξ 2 i -σ2Eviết sai rồi= 1viết sai rồiΣviết sai rồii = 1ξ2TôiξH0Tviết sai rồi . Điều đó làm cho một khu vực quan trọng ở cấp độαcó dạng{Tn≥v1-α}chov1-αđược chọn tốtTviết sai rồi= ∑Tôiξ2Tôi- σ22 n σ4√α{ Tviết sai rồi≥ v1 - α}v1 - α
Sức mạnh của bài kiểm tra và kích thước. Trong trường hợp này, đây là một bài tập xác suất dễ dàng để hiển thị công thức sau đây cho sức mạnh của bài kiểm tra của bạn:
vớiZmột khoảnnbiến ngẫu nhiên iid vớiE[Z]=0vàVmộtr(Z)=1.
Pθ( T≤ v1 - α) = P⎛⎝⎜Z≤ v1 - α1 + 2 ∥ q ∥22/ (N σ2)-------------√- ∥ θ ∥222 n σ4+ 2 σ2∥ q ∥22/ (N σ2)------------------√⎞⎠⎟
Zviết sai rồiE [Z] = 0Vmột r ( Z) = 1
Điều này có nghĩa rằng sức mạnh của thử nghiệm của bạn được tăng năng lượng của tín hiệu của bạn và giảm n . Thực tế, điều này có nghĩa là khi bạn tăng kích thước n của vấn đề nếu nó không tăng cường độ tín hiệu đồng thời thì bạn đang thêm thông tin không chính xác vào quan sát của mình (hoặc bạn đang giảm tỷ lệ thông tin hữu ích trong thông tin bạn có): điều này giống như thêm tiếng ồn và làm giảm sức mạnh của bài kiểm tra (nghĩa là nhiều khả năng bạn sẽ nói không có gì được quan sát trong khi thực sự có gì đó).∥ q ∥22viết sai rồiviết sai rồi
Hướng tới một bài kiểm tra với một thống kê ngưỡng. Nếu bạn không có nhiều năng lượng trong tín hiệu của mình nhưng nếu bạn biết một phép biến đổi tuyến tính có thể giúp bạn tập trung năng lượng này vào một phần nhỏ của tín hiệu, thì bạn có thể xây dựng một thống kê kiểm tra chỉ đánh giá năng lượng cho nhỏ một phần tín hiệu của bạn. Nếu bạn biết trước nơi nó được tập trung (ví dụ bạn được biết đến có thể không phải là tần số cao trong tín hiệu của bạn) sau đó bạn có thể có được một sức mạnh trong các thử nghiệm trước với thay thế bởi một số ít và ‖ θ ‖ 2 2 gần như giống nhau. .. Nếu bạn không biết trước, bạn phải ước tính điều này dẫn đến các bài kiểm tra ngưỡng nổi tiếng.viết sai rồi∥ q ∥22
Lưu ý rằng đối số này chính xác là ở gốc nhiều bài báo như
- Một Antoniadis, F Abramovich, T Sapatinas và B Vidakovic. Phương pháp Wavelet để thử nghiệm trong phân tích chức năng của các mô hình phương sai. Tạp chí quốc tế về Wavelets và các ứng dụng của nó, 93: 1007 trận1021, 2004.
- MV Burnashef và Begmatov. Về một vấn đề phát hiện tín hiệu dẫn đến phân phối ổn định. Lý thuyết xác suất và ứng dụng của nó, 35 (3): 556 1955, 1990.
- Y. Baraud. Tốc độ tối thiểu không triệu chứng của kiểm tra trong phát hiện tín hiệu. Bernoulli, 8: 577 216060, 2002.
- J Fan. Kiểm tra tầm quan trọng dựa trên ngưỡng sóng con và cắt ngắn của neyman. JASA, 91: 674 Từ688, 1996.
- J. Fan và SK Lin. Kiểm tra ý nghĩa khi dữ liệu là các đường cong. JASA, 93: 1007 trận1021, 1998.
- V. Spokoiny. Kiểm tra giả thuyết thích nghi bằng cách sử dụng wavelet. Biên niên sử Thống kê, 24 (6): 2477 21228, tháng 12 năm 1996.