Sau khi đơn giản hóa vấn đề bằng các thủ tục thông thường, có thể giải quyết bằng cách chuyển đổi nó thành một chương trình giảm thiểu kép có câu trả lời nổi tiếng với một bằng chứng cơ bản. Có lẽ sự đối ngẫu này là "bước tinh tế" được đề cập trong câu hỏi. Sự bất bình đẳng cũng có thể được thiết lập một cách hoàn toàn cơ học bằng cách tối đa hóathông qua hệ số nhân Lagrange.|Ti|
Trước tiên, tôi cung cấp một giải pháp thanh lịch hơn dựa trên hình học của các hình vuông nhỏ nhất. Nó không đòi hỏi đơn giản hóa sơ bộ và gần như ngay lập tức, cung cấp trực giác trực tiếp vào kết quả. Như được đề xuất trong câu hỏi, vấn đề giảm đến bất đẳng thức Cauchy-Schwarz.
Giải pháp hình học
Cân nhắc như một vector chiều trong không gian Euclide với dấu chấm sản phẩm bình thường. Đặt là vectơ cơ sở và . Viết và cho các phép chiếu trực giao của và vào phần bổ sung trực giao của . (Trong thuật ngữ thống kê, chúng là phần dư đối với phương tiện.) Sau đó, vì vàx=(X1,X2,…,Xn)ny=(0,0,…,0,1,0,…,0)ith1=(1,1,…,1)x^y^xy1Xi−X¯=x^⋅yS=||x^||/n−1−−−−−√ ,
|Ti|=n−1−−−−−√|x^⋅y|||x^||=n−1−−−−−√|x^⋅y^|||x^||
là thành phần của theo hướng . Theo Cauchy-Schwarz, nó được tối đa hóa chính xác khi song song với , trong đó QED.y^x^x^y^=(−1,−1,…,−1,n−1,−1,−1,…,−1)/n
Ti=±n−1−−−−−√y^⋅y^||y^||=±n−1−−−−−√||y^||=±n−1n−−√,
Ngẫu nhiên, giải pháp này cung cấp một đặc tính toàn diện cho tất cả các trường hợp trong đóđược tối đa hóa: tất cả chúng đều có dạng|Ti|
x=σy^+μ1=σ(−1,−1,…,−1,n−1,−1,−1,…,−1)+μ(1,1,…,1)
cho tất cả thực .μ,σ
Phân tích này dễ dàng khái quát hóa cho trường hợp được thay thế bằng bất kỳ bộ hồi quy nào. Rõ ràng mức tối đa của tỷ lệ thuận với độ dài của phần dư của ,.{1}Tiy||y^||
Đơn giản hóa
Vì là bất biến dưới sự thay đổi của vị trí và tỷ lệ, nên chúng tôi có thể giả sử không mất tính tổng quát rằng tổng bằng 0 và bình phương của chúng tổng bằng . Điều này xác địnhvới, vì (bình phương trung bình) là . Tối đa hóa nó tương đương với tối đa hóa . Không có tính tổng quát nào bị mất bằng cách lấy , vì có thể trao đổi.TiXin−1|Ti||Xi|S1|Ti|2=T2i=X2ii=1Xi
Giải pháp thông qua một công thức kép
Một vấn đề kép là sửa giá trị của và hỏi giá trị nào của còn lại là cần thiết để giảm thiểu tổng bình phương cho rằng . Vì được cung cấp, đây là vấn đề tối thiểu hóa cho rằng .X21Xj,j≠1∑nj=1X2j∑nj=1Xj=0X1∑nj=2X2j∑nj=2Xj=−X1
Các giải pháp dễ dàng được tìm thấy theo nhiều cách. Một trong những điều cơ bản nhất là viết
Xj=−X1n−1+εj, j=2,3,…,n
trong đó . Mở rộng hàm mục tiêu và sử dụng danh tính tổng bằng không này để đơn giản hóa nó tạo ra∑nj=2εj=0
∑j=2nX2j=∑j=2n(−X1n−1+εj)2=∑(−X1n−1)2−2X1n−1∑εj+∑ε2j=Constant+∑ε2j,
ngay lập tức hiển thị giải pháp duy nhất là cho tất cả . Đối với giải pháp này,εj=0j
(n−1)S2=X21+(n−1)(−X1n−1)2=(1+1n−1)X21=nn−1X21
và
|Ti|=|X1|S=|X1|n(n−1)2X21−−−−−−−√=n−1n−−√,
QED .
Giải pháp thông qua máy móc
Quay trở lại chương trình đơn giản hóa mà chúng tôi đã bắt đầu với:
Maximize X21
tùy thuộc vào
∑i=1nXi=0 and ∑i=1nX2i−(n−1)=0.
Phương pháp nhân số Lagrange (gần như hoàn toàn là cơ học và đơn giản) đánh đồng tổ hợp tuyến tính không cần thiết của độ dốc của ba hàm này thành 0:
(0,0,…,0)=λ1D(X21)+λ2D(∑i=1nXi)+λ3D(∑i=1nX2i−(n−1)).
Thành phần theo thành phần, các phương trình làn
0000=2λ1X1+==⋯=λ2λ2λ2+2λ3X1+2λ3X2+2λ3Xn.
cuối cùng trong số chúng ngụ ý hoặc . (Chúng tôi có thể loại trừ trường hợp sau bởi vì sau đó phương trình đầu tiên ngụ ý , tầm thường hóa kết hợp tuyến tính.) Ràng buộc tổng bằng không tạo ra . Ràng buộc tổng bình phương cung cấp hai giải phápn−1X2=X3=⋯=Xn=−λ2/(2λ3)λ2=λ3=0λ1=0X1=−(n−1)X2
X1=±n−1n−−√; X2=X3=⋯=Xn=∓1n−−√.
Cả hai đều mang lại
|Ti|=|X1|≤|±n−1n−−√|=n−1n−−√.