Ý nghĩa của


10

Ý nghĩa của ap=(i=1n|ai(t)|p)1p ?

Công thức này được gọi ra trên trang thứ năm của Tóm tắt luồng dữ liệu được cải tiến: Bản phác thảo Count-Min và các ứng dụng của nó (có thể tìm thấy ở đây ). Tôi đang thực hiện Phác thảo tối thiểu và có thể hiểu các khái niệm cơ bản tốt, nhưng một số điểm tốt hơn được giải thích theo phương trình này và một số thuật ngữ khác mà tôi không quen thuộc.

Câu trả lời:


11

Đó là tiêu chuẩn Lp . Xem ví dụ các bài viết Wikipedia:

Nếu bạn sử dụng , bạn sẽ thấy nó phân giải theo định mức Euclide quen thuộc hơn - tức là thước đo quen thuộc nhất được sử dụng làm độ dài của vectơ . Các giá trị khác của p cung cấp cho người khác các cách đo chiều dài như được nêu trong bài viết - xem các phần về định mức Euclide, định mức Taxicab, v.v.p=2a


Có một cuốn sách giáo khoa có thể tiếp cận mà bạn có thể đề nghị thảo luận về cách thức và lý do tại sao Khoảng cách Manhattan hữu ích trong thống kê?
Kaelin Colclasure

1
@Kaelin: Thật không may, tôi không thể nghĩ ra một văn bản nói riêng về điều này. Tôi có thể nói với bạn rằng khoảng cách L1 được ưa thích vì nó ít nhạy cảm hơn với các ngoại lệ. Nó cũng liên quan đến khoảng cách giữa các phân phối theo kinh nghiệm trong lý thuyết xác suất (L1 gấp đôi "tổng khoảng cách biến đổi": en.wikipedia.org/wiki/Total_variation_distance ).
ars

Bạn có thể thấy ở đây một lời giải thích trực quan về lý do tại sao khoảng cách Manhattan, hoặc chỉ tiêu L1, được ưa thích hơn các khoảng cách khác. Tất cả bắt nguồn từ "lời nguyền của chiều". Ngoài ra, để cụ thể hơn, là không gian Lebesgue của các hàm có thể tích hợp, trong khi là không gian vectơ cho các vectơ chứa nhiều thành phần tùy ý. Về cơ bản, khi bạn nói về tổng hợp các tính năng, bạn đang nói về và, khi bạn đang tích hợp các chức năng, đó là . LnlnlnLn
Douglas De Rizzo Meneghetti

6

Bài viết này dường như không sử dụng định mức theo bất kỳ cách thiết yếu nào - mỗi một kết quả đều tham chiếu định mức một cách rõ ràng. Vấn đề tự xác định định mức nào sẽ sử dụng. Trong trường hợp này, sự quan tâm tập trung vào tính chính xác của multisets. Một multiset được biểu diễn dưới dạng một vectơ đếm các phần tử của nó, từ đó tính chính xác của nó xảy ra giống với định mức của nó . Thông thường các kết quả được chứng minh cho một chỉ tiêu có thể giữ mà không có bất kỳ thay đổi nào cần thiết trong bằng chứng cho một phạm vi rộng của (thường là ). Cơ hội cho tính tổng quát cao hơn mà không mất phí sẽ dẫn đến nhiều bài báo như thế này để nói về các chỉ tiêu .LpL1L1p1pLp

Lp chuẩn mực của trở thành của riêng họ trong các cuộc thảo luận về tính đối ngẫu trong lý thuyết không gian Hilbert và Banach. Các sách nâng cao, nhưng giới thiệu (không phải là mâu thuẫn!) Về phân tích thường bao gồm kỹ lưỡng tài liệu này. Để biết giới thiệu về một số mối quan hệ giữa các tiêu chuẩn này, hãy đọc về Bất đẳng thức Chủ sở hữuBất đẳng thức Minkowski .


+1. Mặc dù tôi không chắc chắn một cuốn sách phân tích, ngay cả khi đó là Rudin, là "có thể tiếp cận". ;-)
ars

@ars: Vâng, nhưng tôi không biết bất kỳ ai thực sự là như vậy. Đó là lý do tại sao tôi chỉ ra hai bài viết trên Wikipedia.
whuber

Tôi biết, tôi thích nó - đó là khuyến nghị phù hợp để thực hiện trong trường hợp OP muốn đào sâu hơn.
ars

2

||a||biểu thị một hàm cụ thể, được gọi là định mức , được xác định trên một không gian vectơ. Nó ánh xạ một phần tử chiều của không gian vectơ thành một số thực không âm. biểu thị một định mức cụ thể được xác định trên không gian vectơ. Đặt là không gian vectơ. Bất kỳ hàm , cũng được ký hiệu lànhư vậy màn||a||pVp:VR+p(v)||v||

  1. p là hữu hạn và lồi
  2. p(x)=0x=0
  3. αR,xV,p(αx)=|α|p(x)

được gọi là một chỉ tiêu trong và sau đó được gọi là một không gian được định mức. Bạn có thể kiểm tra xem hàm của bạn có thỏa mãn tất cả các thuộc tính này không. Trong ví dụ của bạn, là một không gian của các hàm, đó là . Đó là một khái quát của không gian Euclide (với chỉ tiêu Euclide) mà bạn có thể quen thuộc, đó chỉ là một trường hợp cụ thể của không gian được định mức trong đó tập hợp bên dưới là ( n-chiều) số thực và chỉ tiêu là định mức Euclide, một trường hợp cụ thể của hàm xuất hiện trong câu hỏi của bạn.V(V,p)(V,||||Vai:TT

Chẳng hạn, mặt phẳng euclide là một không gian được định mức sao cho , và xác định định mức trên là . Vì vậy, nó chỉ là một mặt phẳng và định mức cho "độ lớn" của vectơ. Lưu ý rằng đó chỉ là trường hợp đặc biệt của định mức bạn đã đề cập sao cho và bạn không cần toán tử giá trị tuyệt đối vì đó là tổng các số hạng bình phương.V=R2x=(x1,x2)R2R2p(x)=||x||2=||x||=(x1+x2)2=(i=12xi2)1/2n=2,p=2,ai(x)=xi

Những chủ đề này được đề cập trong sách giáo khoa Phân tích thực hoặc Đại số tuyến tính (theo cách hạn chế hơn) theo các nhóm định mức hoặc không gian chuẩn.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.