Phân tích điểm thay đổi


8

Ai đó có thể vui lòng giải thích điểm thay đổi với tôi. Tôi đang sử dụng gói trong R và tôi thực sự không hiểu ý nghĩa của các phương pháp khác nhau, ưu và nhược điểm của từng phương pháp và tôi đặc biệt không hiểu giá trị phạt. Khi bạn tăng giá trị hình phạt, điều đó có nghĩa là gì và nó làm gì? Tôi đã thực hiện một số lượng lớn nghiên cứu trực tuyến nhưng tôi chỉ tiếp tục tìm kiếm các trang web R và R nhanh, rất tốt, nhưng cách họ nói nó không cắt giảm cho tôi.

Cám ơn rất nhiều.


2
Bạn đã đọc tài liệu này cho gói changepoint chưa?
Jeromy Anglim

Thật không may, tôi đã làm :(
Darla

Câu trả lời:


21

Có 3 chức năng chính trong gói changepoint cpt.mean, cpt.varcpt.meanvar. Là một học viên, đây là những chức năng duy nhất trong gói mà bạn cần. Nếu bạn nghĩ rằng dữ liệu của bạn có thể chứa thay đổi về ý nghĩa thì bạn sử dụng cpt.meanchức năng, v.v.

Câu hỏi tiếp theo bạn nên tự hỏi mình nếu bạn đang tìm kiếm một hoặc nhiều thay đổi trong dữ liệu của bạn. Đối methodsố xử lý vấn đề này, có AMOC cho tối đa một thay đổi và PELT, BinSeg và SegNeigh cho nhiều thay đổi. Phương pháp nhiều thay đổi nào bạn muốn sử dụng phụ thuộc vào:

a) Sự lựa chọn của bạn về phương pháp phân phối / không phân phối (xem bên dưới) và

b) Bạn có bao nhiêu thời gian / bạn muốn câu trả lời của bạn chính xác đến mức nào. BinSeg nhanh nhưng gần đúng, PELT chính xác và nhanh chóng nhưng không thể được sử dụng trong tất cả các bản phân phối, SegNeigh chính xác nhưng chậm.

Câu hỏi tiếp theo là những giả định nào bạn có thể / sẵn sàng đưa ra về dữ liệu của mình. Chìa khóa ở đây là giả định áp dụng cho từng bộ dữ liệu giữa các thay đổi và không áp dụng cho toàn bộ dữ liệu. Ví dụ: bạn có thể giả sử phân phối Bình thường nhưng nếu bạn thực hiện kiểm tra Tính quy phạm trên toàn bộ dữ liệu thì rất có thể sẽ thất bại (do những thay đổi tiềm năng). Do đó, thông thường chúng tôi đưa ra một giả định, chạy phân tích thay đổi sau đó kiểm tra các giả định dựa trên các thay đổi được xác định. Một lần nữa, tùy thuộc vào loại thay đổi, có các phương pháp phân phối và phân phối miễn phí khác nhau. Xem tài liệu cho từng chức năng để biết các lựa chọn và thoải mái nhận xét thống kê kiểm tra nào bạn đang nghĩ đến việc sử dụng và tôi có thể liệt kê các giả định.

Cuối cùng, bạn nhìn vào hình phạt. Hình phạt cung cấp một sự thỏa hiệp giữa rất nhiều thay đổi nhỏ và không có thay đổi. Do đó, nếu bạn đặt hình phạt thành 0 thì bạn sẽ có một thay đổi ở mọi vị trí có thể và nếu bạn đặt hình phạt thành vô cùng thì bạn sẽ không nhận được thay đổi nào. Giá trị thích hợp của hình phạt tùy thuộc vào dữ liệu của bạn và câu hỏi bạn muốn trả lời. Ví dụ: bạn có thể có các thay đổi trung bình 0,5 đơn vị nhưng bạn chỉ có thể quan tâm đến các thay đổi của hơn 1 đơn vị. Có nhiều cách để chọn hình phạt của bạn:

  1. "Bằng mắt", tức là thử một vài giá trị khác nhau cho đến khi bạn tìm thấy một giá trị phù hợp với vấn đề của mình.

  2. "Khuỷu tay", tức là vẽ số lượng điểm thay đổi được xác định theo hình phạt được sử dụng. Điều này tạo ra một đường cong theo đó các giá trị nhỏ của hình phạt tạo ra những thay đổi lớn (giả) và khi hình phạt giảm các thay đổi giả này giảm xuống với tốc độ nhanh, tốc độ này chậm lại khi chỉ có những thay đổi thực sự trước khi giảm dần xuống không có thay đổi nào đối với hình phạt lớn hơn . Ý tưởng là khớp 2 đường thẳng với đường cong này và chọn hình phạt nơi chúng giao nhau. Điều này tạo ra một cách đặc biệt nhưng khách quan hơn để chọn hình phạt hơn 1.

  3. sử dụng một tiêu chí thông tin. Có một số như AIC, BIC / SIC, Hannan-Quinn được bao gồm trong gói. Có những cái khác không được bao gồm trong gói nhưng bạn có thể cung cấp một công thức cho pen.valuenếu bạn muốn.

Nếu bạn cần thêm thông tin hoặc làm rõ về các điểm cụ thể, chỉ cần bình luận và tôi sẽ cố gắng trả lời.


Điều đó rất hữu ích, cảm ơn bạn. Một điều của tôi là, tôi thực sự sải bước về giá trị hình phạt. Nó có nghĩa là gì? Khi cắm thủ công, làm thế nào để bạn diễn giải một pen.value = .05 câu một pen.value = .40? Điều đó nói gì về dữ liệu của bạn?
Darla

Kích thước của pen.value tương đối với dữ liệu bạn đang làm việc để bạn thực sự không thể so sánh pen.value 0,05 trên một bộ dữ liệu với pen.value 0,4 trên một dữ liệu khác. Tuy nhiên, trên cùng một tập dữ liệu, hình phạt nhỏ hơn sẽ xác định nhiều thay đổi hơn và do đó có thể xác định các thay đổi nhỏ hơn trong các tham số. Giá trị hình phạt lớn hơn đang tìm kiếm những thay đổi lớn hơn trước khi nó coi chúng là "đáng kể".
adunaic

Vậy làm thế nào để tôi biết tầm quan trọng của nó có ý nghĩa như thế nào? Nếu tôi đặt bút.value = .20 tôi nhận được 8 điểm thay đổi, nhưng nếu tôi đặt bút.value = .30, tôi chỉ nhận được 5 điểm thay đổi. Làm thế nào để tôi biết nếu 3 thay đổi đó là đáng chú ý? Làm thế nào tôi nên biết giá trị nào để gắn bó?
Darla

1
xem câu trả lời cho câu hỏi mới của Deb tại: stats.stackexchange.com/questions/60245/iêu
adunaic

Làm thế nào để đi về thực hiện phân tích thay đổi cán? điều đó có thể không?
user1234440
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.