Một đa tạp là gì?


28

Trong kỹ thuật giảm kích thước như Phân tích thành phần chính, LDA, v.v ... thường sử dụng thuật ngữ đa tạp. Một đa tạp trong thuật ngữ phi kỹ thuật là gì? Nếu một điểm thuộc về một hình cầu mà tôi muốn giảm kích thước và nếu có nhiễu yxy không tương quan thì các điểm x thực tế sẽ cách xa nhau do nhiễu. Do đó, lọc tiếng ồn sẽ được yêu cầu. Vì vậy, việc giảm kích thước sẽ được thực hiện trên z = x + y . Do đó, ở đây xy có thuộc về đa tạp khác nhau không?xyxyxz=x+yxy

Tôi đang làm việc trên dữ liệu đám mây điểm thường được sử dụng trong tầm nhìn của robot; các đám mây điểm bị nhiễu do nhiễu trong quá trình thu nhận và tôi cần giảm nhiễu trước khi giảm kích thước. Nếu không, tôi sẽ nhận được giảm kích thước không chính xác. Vì vậy, đa tạp ở đây là gì và nhiễu là một phần của cùng một đa tạp mà thuộc về?x


4
Thật sự không thể sử dụng thuật ngữ một cách chính xác mà không chính xác về mặt toán học
Chill2Macht

Câu trả lời:


45

Theo thuật ngữ phi kỹ thuật, đa tạp là một cấu trúc hình học liên tục có kích thước hữu hạn: đường thẳng, đường cong, mặt phẳng, bề mặt, hình cầu, quả bóng, hình trụ, hình xuyến, "đốm màu" ... đại loại như thế này : nhập mô tả hình ảnh ở đây

Đây là một thuật ngữ chung được các nhà toán học sử dụng để nói "đường cong" (chiều 1) hoặc "bề mặt" (chiều 2) hoặc đối tượng 3D (chiều 3) ... cho bất kỳ kích thước hữu hạn . Một đa tạp một chiều chỉ đơn giản là một đường cong (đường thẳng, đường tròn ...). Một đa tạp hai chiều chỉ đơn giản là một bề mặt (mặt phẳng, hình cầu, hình xuyến, hình trụ ...). Một đa tạp ba chiều là một "vật thể đầy đủ" (quả bóng, khối lập phương đầy đủ, không gian 3D xung quanh chúng ta ...).n

Một đa tạp thường được mô tả bởi một phương trình: tập hợp các điểm như x 2 + y 2 = 1 là một đa tạp một chiều (một đường tròn).(x,y)x2+y2=1

Một đa tạp có cùng chiều ở khắp mọi nơi. Ví dụ: nếu bạn nối một đường (chiều 1) vào một hình cầu (chiều 2) thì cấu trúc hình học kết quả không phải là một đa tạp.

Không giống như các khái niệm tổng quát hơn về không gian số liệu hoặc không gian tôpô cũng có ý định mô tả trực giác tự nhiên của chúng ta về một tập hợp các điểm liên tục, một đa tạp được dự định là một thứ đơn giản cục bộ: như không gian vectơ hữu hạn: . Điều này loại trừ các không gian trừu tượng (như không gian kích thước vô hạn) thường không có ý nghĩa cụ thể hình học.Rn

Không giống như một không gian vectơ, đa tạp có thể có nhiều hình dạng khác nhau. Một số đa tạp có thể dễ dàng hình dung (hình cầu, quả bóng ...), một số rất khó hình dung, như chai Klein hoặc mặt phẳng chiếu thực sự .

Trong thống kê, học máy hay toán học ứng dụng nói chung, từ "đa tạp" thường được sử dụng để nói "giống như một không gian con tuyến tính" nhưng có thể bị cong. Bất cứ khi nào bạn viết một phương trình tuyến tính như: bạn sẽ có một không gian con tuyến tính (affine) (ở đây là một mặt phẳng). Thông thường, khi phương trình không tuyến tính như x 2 + 2 y 2 + 3 z 2 = 7 , đây là một đa tạp (ở đây là một hình cầu kéo dài).3x+2y4z=1x2+2y2+3z2=7

Ví dụ: " giả thuyết đa dạng " của ML cho biết "dữ liệu chiều cao là các điểm trong một đa tạp chiều thấp có thêm nhiễu chiều cao". Bạn có thể tưởng tượng các điểm của vòng tròn 1D có thêm một số nhiễu 2D. Mặc dù các điểm không chính xác trên đường tròn, nhưng chúng thỏa mãn thống kê phương trình . Vòng tròn là đa tạp cơ bản: x2+y2=1https://i.stack.imgur.com/iEm2m.png


4
@RiaGeorge Trong hình là bề mặt là một đa tạp. Nó liên tục vì bạn có thể di chuyển xung quanh nó một cách tự do mà không bị gián đoạn và không bao giờ phải nhảy ra khỏi bề mặt để đi giữa hai nơi. Các lỗ hổng mà bạn ám chỉ rất quan trọng trong việc mô tả cách bạn có thể di chuyển trên bề mặt giữa hai điểm bất kỳ theo cách đơn giản nhất và đếm chúng là một kỹ thuật quan trọng trong nghiên cứu đa tạp.
Matthew Drury

4
Giải thích cấu trúc liên kết là gì sẽ là một câu hỏi quá rộng cho trang web này, và hơi lạc đề. Tôi sẽ tìm kiếm trao đổi ngăn xếp toán học để biết thông tin về điều đó. Manifold và cấu trúc liên kết không phải là từ đồng nghĩa: đa tạp là các đối tượng toán học được nghiên cứu với các kỹ thuật cấu trúc liên kết, cấu trúc liên kết là một chủ đề phụ của toán học.
Matthew Drury

1
Câu trả lời bỏ lỡ tất cả các điểm cơ bản tạo nên sự đa dạng như vậy, tôi không hiểu làm thế nào nó có quá nhiều sự ủng hộ. Cấu trúc liên kết, biểu đồ và độ mịn thậm chí không được đề cập và câu trả lời về cơ bản mang lại ấn tượng rằng một đa tạp là một bề mặt, mà nó không phải là .
gents

2
Điểm kỹ thuật, tập hợp giải pháp của một hệ phương trình không cần phải là đa tạp. Đó là một sự đa dạng, vì vậy nó chủ yếu là một đa tạp, nhưng nó có thể có các điểm tự giao nhau trong đó thuộc tính đa tạp không thành công.
Matt Samuel

1
Định nghĩa đa dạng của bạn bao gồm yêu cầu phải có kích thước hữu hạn . Nhưng bạn bao gồm các ví dụ không đáp ứng yêu cầu đó như Đường, mặt phẳng, đường cong và bề mặt. Bạn có thể vui lòng làm rõ những gì bạn có ý nghĩa?
Mowzer

13

Một đa tạp (tôpô) là một không gian là:M

(1) "cục bộ" "tương đương" với đối với một số n .Rnn

"Tại địa phương", "tương đương" có thể được biểu thị thông qua hàm tọa độ, c i : M R , cùng nhau tạo thành hàm "bảo toàn cấu trúc", c : M R n , được gọi là biểu đồ .nci:MRc:MRn

(2) có thể được nhận ra theo cách "bảo tồn cấu trúc" như là một tập hợp con của đối với một số N n . (1) (2)RNNn

Lưu ý rằng để làm cho "cấu trúc" chính xác ở đây, người ta cần hiểu các khái niệm cơ bản về cấu trúc liên kết ( def. ), Cho phép người ta đưa ra các khái niệm chính xác về hành vi "cục bộ" , và do đó "cục bộ" ở trên. Khi tôi nói "tương đương", tôi có nghĩa là cấu trúc topo tương đương ( đồng phôi ), và khi tôi nói "cấu trúc bảo quản" Ý tôi là điều tương tự (tạo ra một cấu trúc topo tương đương).

Cũng lưu ý rằng để thực hiện phép tính trên đa tạp , người ta cần một điều kiện bổ sung không tuân theo hai điều kiện trên, về cơ bản có nội dung như "các biểu đồ được xử lý tốt đủ để cho phép chúng tôi thực hiện phép tính". Đây là những đa tạp thường được sử dụng trong thực tế. Không giống như các đa tạp tôpô nói chung , ngoài tính toán, chúng còn cho phép các tam giác , điều này rất quan trọng trong các ứng dụng như của bạn liên quan đến dữ liệu đám mây điểm .

Lưu ý rằng không phải tất cả mọi người sử dụng cùng một định nghĩa cho đa tạp (tôpô). Một số tác giả sẽ định nghĩa nó là thỏa mãn điều kiện duy nhất (1) ở trên, không nhất thiết là (2). Tuy nhiên, định nghĩa thỏa mãn cả (1) và (2) là hành vi tốt hơn nhiều, do đó hữu ích hơn cho các học viên. Người ta có thể mong đợi theo trực giác rằng (1) ngụ ý (2), nhưng thực tế không phải vậy.

EDIT: Nếu bạn quan tâm đến việc tìm hiểu chính xác "cấu trúc liên kết" là gì, ví dụ quan trọng nhất về cấu trúc liên kết cần hiểu là cấu trúc liên kết Euclide của . Điều này sẽ được đề cập sâu trong bất kỳ cuốn sách giới thiệu (tốt) nào về "phân tích thực" .Rn


Cảm ơn câu trả lời của bạn: Bạn có thể giải thích một cấu trúc liên kết trong thuật ngữ nnon là gì không? Là thuật ngữ cấu trúc liên kết và đa tạp được sử dụng thay thế cho nhau? Có kích thước phải là một số nguyên? Nó là một con số thực sự, sau đó tôi nghĩ rằng cấu trúc được gọi là fractals nếu toàn bộ cấu trúc bao gồm mỗi phần con là tự lặp lại.
Rịa George

1
@RiaGeorge là viết tắt của một số tự nhiên (số nguyên 1 ), cũng như N . Có thể có lý thuyết nâng cao hơn cho các kích thước phân số / giá trị thực, nhưng nó không xuất hiện thường xuyên. "Cấu trúc liên kết" và "đa tạp" có nghĩa là hai điều rất khác biệt, vì vậy chúng không phải là các thuật ngữ có thể hoán đổi cho nhau. Một "đa tạp" có một "cấu trúc liên kết". Lĩnh vực nghiên cứu cấu trúc liên kết không gian có "cấu trúc liên kết", là tập hợp các tập hợp thỏa mãn ba quy tắc / điều kiện. Một mục tiêu của việc nghiên cứu "cấu trúc liên kết" là mô tả một cách nhất quán và có thể lặp lại các khái niệm về hành vi "cục bộ". n1N
Chill2Macht

@RiaGeorge Các tiên đề cho một "cấu trúc liên kết" có thể được tìm thấy trên trang Wikipedia: en.wikipedia.org/wiki/General_topology#A_topology_on_a_set - cũng lưu ý rằng liên kết tôi đưa cho bạn về định nghĩa (tương đương) về "cấu trúc liên kết" của khu phố chỉ vào một cái gì đó liên quan nhưng không giống nhau, tôi đã chỉnh sửa câu trả lời của mình để phản ánh điều này: en.wikipedia.org/wiki/ nam Lưu ý tuy nhiên định nghĩa về các khu phố khó hiểu hơn (tôi tưởng tượng tôi có thể hiểu nó tốt, nhưng tôi cũng không bận tâm, vì tôi lười biếng
Chill2Macht

Vì vậy, dù sao đó là ý kiến ​​thiên vị cá nhân của tôi rằng bạn không cần biết định nghĩa cấu trúc liên kết lân cận - chỉ cần biết rằng định nghĩa đơn giản hơn cung cấp cho bạn tất cả sức mạnh của định nghĩa lân cận về mặt mô tả nghiêm ngặt hành vi địa phương, vì chúng là tương đương). Dù sao, nếu bạn quan tâm đến fractals, có thể bạn sẽ thấy những trang Wikipedia này thú vị - tôi không thể giúp bạn hiểu thêm về điều đó, bởi vì tôi không quen thuộc lắm với lý thuyết và không biết hoặc không hiểu hầu hết định nghĩa - Tôi mới chỉ nghe nói về một số
Chill2Macht

1
Đây là câu trả lời duy nhất cho đến nay chú ý đến ý tưởng toán học hiện đại về lắp ráp một đối tượng toàn cầu từ dữ liệu địa phương. Thật không may, nó không hoàn toàn đạt đến mức độ đơn giản và rõ ràng cần có của một tài khoản "phi kỹ thuật".
whuber

9

Trong bối cảnh này, thuật ngữ đa dạng là chính xác, nhưng là highfalutin không cần thiết. Về mặt kỹ thuật, một đa tạp là bất kỳ không gian nào (tập hợp các điểm có cấu trúc liên kết) đủ mịn và liên tục (theo cách có thể, với một số nỗ lực, được xác định rõ về mặt toán học).

Hãy tưởng tượng không gian của tất cả các giá trị có thể của các yếu tố ban đầu của bạn. Sau một kỹ thuật giảm kích thước, không phải tất cả các điểm trong không gian đó đều có thể đạt được. Thay vào đó, chỉ có thể chỉ ra một số không gian con được nhúng bên trong không gian đó. Không gian con nhúng đó xảy ra để hoàn thành định nghĩa toán học của một đa tạp. Đối với kỹ thuật giảm kích thước tuyến tính như PCA, không gian con đó chỉ là không gian con tuyến tính (ví dụ: siêu phẳng), là một đa tạp tương đối tầm thường. Nhưng đối với kỹ thuật giảm kích thước phi tuyến tính, không gian phụ đó có thể phức tạp hơn (ví dụ: siêu bề mặt cong). Đối với mục đích phân tích dữ liệu, hiểu rằng đây là các không gian con quan trọng hơn nhiều so với bất kỳ suy luận nào bạn sẽ rút ra khi biết rằng chúng hoàn thành định nghĩa về đa tạp.


3
"Highfalutin" ... đã học được một từ mới ngày hôm nay!
Mehrdad

5
Về mặt toán học, một đa tạp là bất kỳ không gian tôpô liên tục cục bộ. Tôi thích ý tưởng cố gắng giải thích mọi thứ bằng ngôn ngữ đơn giản, nhưng đặc tính này thực sự không hiệu quả. Trước hết, tính liên tục luôn là một tài sản cục bộ, vì vậy tôi không chắc ý của bạn là gì liên tục tại địa phương. Ngoài ra, định nghĩa của bạn không loại trừ được nhiều thứ không phải là đa tạp, chẳng hạn như dòng số hữu tỷ hoặc liên kết của hai dòng giao nhau trong mặt phẳng Euclide.
Ben Crowell

4
Tôi đồng ý với Ben, về mặt kỹ thuật, đó là "euclid địa phương". Tôi không chắc có một cách hay để biến nó thành tiếng Anh đơn giản.
Matthew Drury

1
Tôi cũng phải đồng ý mạnh mẽ với hai ý kiến ​​trên. Trong thực tế, câu trả lời tôi viết dưới đây ban đầu có nghĩa là một nhận xét rõ ràng cho câu trả lời này đã trở nên quá dài. Không có khái niệm chính xác về một không gian tôpô "liên tục" (xem tại đây: math.stackexchange.com/questions/1822769/ mẹo ). Xác định đa tạp về các khái niệm không tồn tại, theo tôi, về lâu dài có nhiều khả năng gây nhầm lẫn hơn là làm rõ. Ít nhất, tôi sẽ đề nghị thay thế từ "toán học" trong câu đầu tiên bằng một từ khác.
Chill2Macht

Tôi sẽ sử dụng nhận xét này như một cơ hội để hỏi một câu hỏi nhỏ ... Tôi (nghĩ) Tôi có ý tưởng về đa tạp, nhưng tại sao nó lại "cần thiết" cục bộ? Không phải là một không gian "cục bộ" liên tục ... liên tục như một toàn thể sao?
Paul92
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.