Kiểm tra một đỉnh có ý nghĩa thống kê


14

Tôi có một bộ dữ liệu, x . Tôi muốn kiểm tra giả thuyết sau: Có một đỉnh trong ; đó là khi tăng, đầu tiên tăng và sau đó giảm.yxyxy

Ý tưởng đầu tiên của tôi là phù hợp và trong một máy ảnh DSLR. Đó là, nếu tôi thấy rằng hệ số trước là dương đáng kể và hệ số trước là âm đáng kể, thì tôi có hỗ trợ cho giả thuyết này. Tuy nhiên, điều này chỉ kiểm tra một loại mối quan hệ (bậc hai) và có thể không nhất thiết phải nắm bắt sự tồn tại của đỉnh.xx2xx2

Sau đó, tôi nghĩ đến việc tìm , như một vùng (giá trị được sắp xếp của) , rằng nằm giữa và , hai vùng khác của chứa ít nhất nhiều điểm như và và đáng kể. Nếu giả thuyết là đúng, chúng ta nên kỳ vọng nhiều khu vực như vậy . Vì vậy, nếu số lượng đủ lớn, cần có sự hỗ trợ cho giả thuyết.bxbacxbyb¯>ya¯yb¯>yc¯bb

Bạn có nghĩ rằng tôi đang đi đúng hướng để tìm một bài kiểm tra phù hợp cho giả thuyết của mình không? Hay tôi đang phát minh ra bánh xe và có một phương pháp được thiết lập cho vấn đề này? Tôi sẽ đánh giá rất cao đầu vào của bạn.

CẬP NHẬT. Biến phụ thuộc của tôi là số đếm (số nguyên không âm).y


thay đổi trơn tru với x ? Nếu vậy, bạn có thể thử điều chỉnh một mô hình bao gồm mượt mà hơn (giả sử là GAM) và sau đó tính toán các dẫn xuất đầu tiên của thiết bị mượt mà hơn và khoảng tin cậy của chúng. Nếu đạo hàm là tăng đáng kể thì giảm đáng kể bạn có câu trả lời. yx
Phục hồi Monica - G. Simpson

Câu trả lời:


6

Tôi đã nghĩ về ý tưởng làm mịn cũng. Nhưng có cả một khu vực được gọi là phương pháp phản ứng bề mặt tìm kiếm các đỉnh trong dữ liệu nhiễu (chủ yếu liên quan đến việc sử dụng phương pháp bậc hai phù hợp với dữ liệu) và có một bài báo nổi tiếng mà tôi nhớ lại với tiêu đề "Bump hunt" trong tiêu đề. Dưới đây là một số liên kết đến sách về phương pháp phản ứng bề mặt. Sách của Ray Myer được viết rất tốt. Tôi sẽ cố gắng tìm giấy săn bắn.

Phương pháp đáp ứng bề mặt: Tối ưu hóa quy trình và sản phẩm bằng các thí nghiệm được thiết kế

Phương pháp đáp ứng bề mặt và các chủ đề liên quan

Phương pháp bề mặt đáp ứng

Xây dựng mô hình thực nghiệm và các bề mặt đáp ứng

Mặc dù không phải là bài báo tôi đang tìm kiếm, đây là một bài viết rất phù hợp của Jerry Friedman và Nick Fisher liên quan đến những ý tưởng này được áp dụng cho dữ liệu chiều cao.

Đây là một bài viết với một số ý kiến ​​trực tuyến.

Vì vậy, tôi hy vọng bạn ít nhất đánh giá cao phản ứng của tôi. Tôi nghĩ ý tưởng của bạn là tốt và đi đúng hướng nhưng vâng tôi nghĩ bạn có thể đang phát minh lại bánh xe và tôi hy vọng bạn và những người khác sẽ xem xét các tài liệu tham khảo tuyệt vời này.


3
Tôi không nằm trong số những người xuống cấp, nhưng Câu trả lời trên các trang SE được dự kiến ​​sẽ không chỉ là một liên kết đến nội dung. Tóm tắt nội dung hoặc cung cấp phản hồi tóm tắt sau đó liên kết với nội dung để biết thêm chi tiết sẽ tốt hơn.
Phục hồi Monica - G. Simpson

2
Tôi ủng hộ điều này bởi vì (1) nó thể hiện một ý tưởng tốt; (2) nó có một số lời bình luận; và (3) nó được hỗ trợ với một số liên kết được lựa chọn cẩn thận, bao gồm cả tài liệu có sẵn miễn phí. Vâng, nó trông tệ về mặt chính tả, bởi vì các liên kết có thể được định dạng độc đáo hơn: nhưng tôi hy vọng mọi người không cân nhắc khía cạnh đó của câu trả lời trong quyết định bỏ phiếu của họ!
whuber

1
@whuber Tôi đồng ý sau khi có thể đọc nó rõ ràng do định dạng đẹp của Procastinator. +1 cũng vậy. Tôi nghĩ rằng có đủ tóm tắt ở đây và một số chủ đề gần như quá phức tạp cho bất cứ điều gì ngoài ý tưởng cơ bản và một tài liệu tham khảo để đọc thêm.
Erik

5
@MichaelCécick Lưu ý rằng đó không phải là một lời chỉ trích từ tôi, chỉ đưa ra một lý do tại sao mọi người có thể đã bỏ phiếu. Tôi sẽ không đồng ý với họ nếu đó là lý do bởi vì tôi nghĩ câu trả lời của bạn là đúng chỗ, đặc biệt là với PRIM; Tôi chỉ tham khảo ý kiến ​​của tôi về Hastie và cộng sự (2009) về những gì nó nói trên PRIM. Bạn có thể muốn thêm liên kết đó vào Câu trả lời vì có hai phần trên PRIM ở đó và PDF có sẵn miễn phí.
Phục hồi Monica - G. Simpson

1
@Nikita Giả thuyết thống kê chính thức mà bạn muốn kiểm tra là gì? Trước tiên, bạn phải tìm các đỉnh là một phần lớn của điều này. Bạn đang kiểm tra rằng đỉnh không chỉ là kết quả của tiếng ồn? Tôi không chắc có tài liệu nào để giải quyết vấn đề này nhưng tôi nghĩ rằng bạn có thể phù hợp với hồi quy đa thức cho dữ liệu (có lẽ là một phương pháp bậc hai). Từ đó bạn sẽ có một ước tính về phương sai còn lại. Ý nghĩa thống kê của thuật ngữ bậc hai sẽ là một thử nghiệm cho tầm quan trọng của đỉnh.
Michael R. Chernick

1

Mặc dù bạn chưa trả lời câu hỏi của tôi, nhưng nếu tôi đoán đúng, bạn đang tìm kiếm một bài kiểm tra tiếng ồn trắng có trong miền tần số để cho thấy phổ đó là phẳng. Vì vậy, kiểm tra biểu đồ của Fisher trong tài liệu tham khảo này được gọi là kappa của Fisher có thể được sử dụng. Xem liên kết.

http://www4.stat.ncsu.edu/~dickey/Spain/pdf_Notes/Spectral2.pdf

Bài kiểm tra của Bartlett cũng được đề cập trong tài liệu tham khảo. Bây giờ bác bỏ các giả thuyết không có giá trị để tìm một đỉnh đáng kể trong biểu đồ. Điều này có nghĩa là một thành phần định kỳ tồn tại trong chuỗi thời gian.

Bởi vì thử nghiệm nằm trong miền tần số và liên quan đến biểu đồ định kỳ, tọa độ có phân phối chi bình phương 2 theo giả thuyết null và là độc lập. Phân phối đặc biệt này xuất hiện chỉ vì sự chuyển đổi sang miền tần số. Nếu x là thời gian thì điều này sẽ không hoạt động trong miền thời gian hoặc nói chung, phân phối cho ys sẽ không phải là bình phương chi độc lập.

m



Vậy y là dữ liệu đếm và biến giải thích liên tục xa là gì? Những đề xuất trước đây của tôi có lẽ không có trong trường hợp đó nhưng có rất nhiều tài liệu gần đây về mô hình đếm. Vì vậy, nếu bạn có thể cụ thể hơn một chút về dữ liệu và vấn đề có lẽ tôi có thể chỉ ra một giải pháp.
Michael R. Chernick

yx

Tôi không chắc liệu điều này có giúp ích gì không nhưng Cameron và Trivingi đã xuất bản một cuốn sách về mô hình hồi quy đếm và có phiên bản thứ hai ra mắt vào năm 2013. Đây là một liên kết với một số thông tin: cameron.econ.ucdavis.edu/racd/count .html
Michael R. Chernick
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.