Sự khác biệt giữa phân tích dữ liệu chức năng và phân tích dữ liệu chiều cao là gì


10

Có rất nhiều tài liệu tham khảo trong tài liệu thống kê về " dữ liệu chức năng " (tức là dữ liệu là các đường cong) và song song với " dữ liệu chiều cao " (tức là khi dữ liệu là các vectơ chiều cao). Câu hỏi của tôi là về sự khác biệt giữa hai loại dữ liệu.

Khi nói về các phương pháp thống kê ứng dụng áp dụng trong trường hợp 1 có thể được hiểu là sự chia sẻ lại các phương pháp từ trường hợp 2 thông qua một phép chiếu vào không gian con chiều hữu hạn của một không gian các hàm, nó có thể là đa thức, spline, wavelet, Fourier, ... và sẽ chuyển vấn đề chức năng thành một vấn đề vectơ hữu hạn chiều (vì trong toán học ứng dụng, mọi thứ trở nên hữu hạn tại một số điểm).

Câu hỏi của tôi là: chúng ta có thể nói rằng bất kỳ quy trình thống kê nào áp dụng cho dữ liệu chức năng cũng có thể được áp dụng (gần như trực tiếp) cho dữ liệu kích thước cao và bất kỳ quy trình dành riêng cho dữ liệu chiều cao có thể được áp dụng (gần như trực tiếp) cho dữ liệu chức năng không?

Nếu câu trả lời là không, bạn có thể minh họa?

EDIT / CẬP NHẬT với sự giúp đỡ của câu trả lời của Simon Byrne:

  • thưa thớt (S-thưa thớt giả định, bóng và yếu chuyền dài cho ) được sử dụng như một giả định về cấu trúc trong phân tích thống kê chiều cao.lplpp<1
  • "Độ mịn" được sử dụng như một giả định cấu trúc trong phân tích dữ liệu chức năng.

Mặt khác, biến đổi nghịch đảo Fourier và biến đổi sóng con nghịch đảo đang biến đổi sự cay đắng thành sự trơn tru, và sự mượt mà được chuyển thành sự châm biếm bởi biến đổi wavelet và fourier. Điều này làm cho sự khác biệt quan trọng được đề cập bởi Simon không quá quan trọng?


1
Làm mịn một phần lớn của phân tích dữ liệu chức năng và nó có thể được chuyển đổi thành vấn đề ước lượng trung bình vectơ bằng cách chiếu lên một cơ sở thích hợp (ví dụ Fourier hoặc wavelet), nhưng có những vấn đề khác trong phân tích dữ liệu chức năng tùy thuộc vào cấu trúc chức năng. 't dịch dễ dàng. Lấy ví dụ về hồi quy chức năng nơi bạn quan tâm đến việc dự đoán một phản ứng chức năng từ các hiệp phương sai.
vqv

Câu trả lời:


12

Dữ liệu chức năng thường liên quan đến câu hỏi khác nhau. Tôi đã đọc Phân tích dữ liệu chức năng, Ramsey và Silverman và họ dành nhiều thời gian để thảo luận về đăng ký đường cong, chức năng cong vênh và ước tính các dẫn xuất của các đường cong. Đây có xu hướng là những câu hỏi rất khác so với những câu hỏi của những người quan tâm nghiên cứu dữ liệu chiều cao.


Hoàn toàn đồng ý! các câu hỏi được hỏi là khác nhau. Đăng ký, đánh dấu, ước tính các công cụ phái sinh có thể phát sinh từ quan điểm chức năng. Điều này thuyết phục tôi! Vì vậy, vấn đề lớn với dữ liệu chức năng (vì nó đứng trong tài liệu thống kê) sẽ không phải là nó được định nghĩa trên một tập liên tục mà nhiều hơn là nó được lập chỉ mục trên một tập hợp có thứ tự?
cướp girard

Không chỉ là nó được định nghĩa trên một tập hợp có thứ tự. Mặt khác, làm thế nào bạn phân biệt phân tích chuỗi thời gian với phân tích dữ liệu chức năng? Tôi đồng ý với @ user549 ở chỗ nó hiểu rõ các loại câu hỏi được hỏi. Chúng là cụ thể cho cấu trúc của dữ liệu.
vqv

15

Có và không. Ở cấp độ lý thuyết, cả hai trường hợp đều có thể sử dụng các kỹ thuật và khung tương tự (một ví dụ tuyệt vời là hồi quy quy trình Gaussian).

Sự khác biệt quan trọng là các giả định được sử dụng để ngăn chặn quá mức (chính quy hóa):

  • Trong trường hợp chức năng, thường có một số giả định về độ mịn, nói cách khác, các giá trị xảy ra gần nhau nên tương tự nhau theo một cách có hệ thống. Điều này dẫn đến việc sử dụng các kỹ thuật như spline, hoàng thổ, quy trình Gaussian, v.v.

  • Trong trường hợp chiều cao, thường có một giả định về độ thưa: đó là chỉ một tập hợp con của các kích thước sẽ có bất kỳ tín hiệu nào. Điều này dẫn đến các kỹ thuật nhằm xác định các kích thước đó (Lasso, LARS, các linh mục slab-and-spike, v.v.)

CẬP NHẬT:

Tôi đã không thực sự nghĩ về các phương pháp wavelet / Fourier, nhưng đúng vậy, các kỹ thuật ngưỡng được sử dụng cho các phương pháp như vậy đang nhắm đến sự thưa thớt trong không gian dự kiến. Ngược lại, một số kỹ thuật chiều cao giả định chiếu vào đa tạp chiều thấp hơn (ví dụ phân tích thành phần chính), đây là một loại giả định độ mịn.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.