Ai đó có thể giải thích như tôi 5 tuổi về vấn đề này từ Sách Tiếng Anh của HUYỀN THOẠI không?


9

Tôi đang làm việc thông qua cuốn sách tiếng Anh của HYUNDAI và tôi đang gặp khó khăn với Câu hỏi 2.3. Câu hỏi như sau:

nhập mô tả hình ảnh ở đây

Chúng tôi đang xem xét một ước tính lân cận gần nhất tại điểm gốc và khoảng cách trung bình từ điểm gốc đến điểm dữ liệu gần nhất được đưa ra theo phương trình này. Tôi không biết bắt đầu từ đâu trong việc cố gắng rút ra điều này.

Tôi biết rằng hầu hết các điểm dữ liệu gần với ranh giới của không gian mẫu hơn bất kỳ điểm dữ liệu nào khác (lời nguyền về chiều), nhưng tôi gặp khó khăn khi dịch điều này sang ý nghĩa Đại số tuyến tính / Xác suất.

Cảm ơn!


4
"ELI5" trong tiêu đề có nghĩa là gì? Nếu bạn muốn rút ra phương trình đó, bạn sẽ cần bắt đầu với một mô hình xác suất cho các điểm trong quả bóng: mô hình đó là gì? (Vui lòng không yêu cầu độc giả của bạn tham khảo một cuốn sách hoặc một số trang web khác để hiểu câu hỏi của bạn.)
whuber

3
@whuber Tôi đồng ý - Từ viết tắt là một kế hoạch băm khủng khiếp.
Sycorax nói Phục hồi lại

14
Bạn năm tuổi. Tất cả tín dụng cho bạn vì muốn hiểu tiếng Anh, nhưng bạn sẽ phải đợi đến sáu tuổi. Đó là một cuốn sách dành cho những chàng trai và cô gái lớn.
Nick Cox

4
Một đứa trẻ năm tuổi có thể bắt đầu bằng cách nhìn vào trường hợp một chiều (p = 1). Và một khi đã có trong tay, hãy lấy nó từ đó.
Mark L. Stone

3
Nếu chúng ta sắp có ELI5 đánh vần thì còn gì về ESL?
mdewey

Câu trả lời:


15

Đặt là khoảng cách từ gốc và đặt là thể tích của siêu cầu đơn vị theo kích thước . Khi đó, thể tích chứa trong một siêu cầu bán kính làV 0 [ p ] p rrV0[p]pr

V[r]=V0[p]rp

Nếu chúng ta để biểu thị phần nhỏ của âm lượng chứa trong siêu cầu này và xác định , thìR = r pP=V[r]/V0[p]R=rp

P[R]=R

Nếu các điểm dữ liệu được phân bố đều trong đơn vị bóng, sau đó cho công thức trên là một hàm phân phối tích lũy (CDF) cho . Điều này tương đương với mật độ xác suất đồng nhất cho trong khoảng thời gian đơn vị, tức là . Vì vậy, như được gợi ý bởi Mark Stone trong các bình luận, chúng ta có thể giảm trường hợp chiều thành vấn đề 1D tương đương.R R0R1RRpp[R]=P[R]=1p

Bây giờ nếu chúng ta có một điểm duy nhất , thì theo định nghĩa của CDF, chúng ta có và . Nếu là giá trị nhỏ nhất trong số điểm và các điểm đều độc lập, thì CDF được đưa ra bởi (đây là kết quả chuẩn của lý thuyết giá trị cực trị đơn biến ).Pr [ R ρ ] = P [ ρ ] Pr [ R ρ ] = 1 - P [ ρ ] R phút n Pr [ R phútρ ] = PrRPr[Rρ]= =P[ρ]Pr[Rρ]= =1-P[ρ]Rtối thiểun

Pr[Rtối thiểuρ]= =Pr[Rρ]n= =(1-ρ)n

Theo định nghĩa của trung vị, chúng ta có mà chúng ta có thể viết lại thành tương đương với kết quả mong muốn. ( 1 - d p ) n = 1

12= =Pr[(Rtối thiểu)medR]= =(1-R)n
(1-dp)n= =12

EDIT: Cố gắng trả lời kiểu " ELI5 ", trong ba phần.

  1. Đối với trường hợp 1D có một điểm duy nhất, khoảng cách được phân bố đồng đều trên , do đó trung vị sẽ là .1[0,1]12

  2. Trong 1D, phân phối cho tối thiểu trên điểm là trường hợp đầu tiên cho công suất thứ .nnn

  3. Trong kích thước , khoảng cách không được phân bố đồng đều, nhưng là.r r pprrp


1
Ha ha, tôi đã đưa ra nhận xét rằng một đứa trẻ 5 tuổi có thể bắt đầu bằng cách xem xét trường hợp p = 1. Tôi đã nghĩ đến việc thêm một nhận xét rằng một đứa trẻ 4 tuổi có thể không chỉ bắt đầu với trường hợp p = 1, mà còn n = 1. Nhưng tôi đã hình dung rằng tôi sẽ để con số 5 tuổi đó ra.
Mark L. Stone

1
Lưu ý rằng khi tôi trả lời câu hỏi, đó là sau khi được @fcop làm rõ để đọc: "Hãy xem xét các điểm dữ liệu N được phân phối đồng đều trong một quả bóng đơn vị p có tâm ở gốc. Hiển thị khoảng cách trung bình từ gốc đến điểm dữ liệu gần nhất được đưa ra bởi ... ". Vì vậy, một quả bóng đơn vị liên quan đến định mức trong không gian chiều. Sau đó, câu hỏi được đưa trở lại ban đầu, khác biệt và không quá rõ ràng. (Xem chuỗi nhận xét dưới câu hỏi ban đầu.) pL2p
GeoMatt22
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.