Đối với câu hỏi đầu tiên của bạn, người ta nên định nghĩa "tiêu chuẩn" hoặc thừa nhận rằng "mô hình chính tắc" đã dần được thiết lập. Như một nhận xét đã chỉ ra, ít nhất thì cách bạn sử dụng IRWLS là khá chuẩn.
Đối với câu hỏi thứ hai của bạn, "ánh xạ co trong xác suất" có thể được liên kết (tuy nhiên không chính thức) để hội tụ "thuật toán ngẫu nhiên đệ quy". Từ những gì tôi đọc, có một tài liệu khổng lồ về chủ đề chủ yếu trong Kỹ thuật. Trong Kinh tế học, chúng tôi sử dụng một chút xíu của nó, đặc biệt là các tác phẩm tinh xảo của Lennart Ljung - bài báo đầu tiên là Ljung (1977) - cho thấy sự hội tụ (hoặc không) của thuật toán ngẫu nhiên đệ quy có thể được xác định bởi độ ổn định (hoặc không) của một phương trình vi phân thông thường liên quan.
(những gì tiếp theo đã được làm lại sau một cuộc thảo luận hiệu quả với OP trong các bình luận)
Hội tụ
Tôi sẽ sử dụng làm tài liệu tham khảo Saber Elaydi "Giới thiệu về phương trình khác biệt", 2005, 3d ed.
Phân tích có điều kiện trên một số mẫu dữ liệu nhất định, do đó được coi là cố định. x′s
Điều kiện bậc nhất để tối thiểu hóa hàm mục tiêu, được xem như là một hàm đệ quy theo ,
m ( k + 1 ) = N ∑ i = 1 v i [ m ( k ) ] x i ,m
m(k+1)=∑i=1Nvi[m(k)]xi,vi[m(k)]≡wi[m(k)]∑Ni=1wi[m(k)][1]
có một điểm cố định (argmin của hàm mục tiêu). Theo Định lý 1.13 trang 27-28 của Elaydi, nếu đạo hàm đầu tiên liên quan đến của RHS của , được đánh giá tại điểm cố định , ký hiệu là , nhỏ hơn thống nhất trong giá trị tuyệt đối, sau đó là tiệm ổn định (AS). Hơn nữa theo Định lý 4.3 tr.179 chúng ta có điều này cũng ngụ ý rằng điểm cố định là thống nhất AS (UAS).
"Ổn định không có triệu chứng" có nghĩa là đối với một số phạm vi giá trị xung quanh điểm cố định, một vùng lân cận , không nhất thiết phải có kích thước nhỏ, điểm cố định là hấp dẫn[ 1 ] m * Một ' ( m * ) m *m[1]m∗A′(m∗)m∗
(m∗±γ)và do đó, nếu thuật toán đưa ra các giá trị trong vùng lân cận này, nó sẽ hội tụ. Thuộc tính là "thống nhất", có nghĩa là ranh giới của vùng lân cận này, và do đó kích thước của nó, độc lập với giá trị ban đầu của thuật toán. Điểm cố định trở thành UAS toàn cầu , nếu .
Vì vậy, trong trường hợp của chúng tôi, nếu chúng tôi chứng minh rằngγ=∞
|A′(m∗)|≡∣∣∣∣∑i=1N∂vi(m∗)∂mxi∣∣∣∣<1[2]
chúng tôi đã chứng minh tài sản UAS, nhưng không có sự hội tụ toàn cầu. Sau đó, chúng ta có thể cố gắng xác định rằng vùng lân cận thu hút trên thực tế là toàn bộ số thực mở rộng, hoặc, giá trị bắt đầu cụ thể mà OP sử dụng như được đề cập trong các nhận xét (và đó là tiêu chuẩn trong phương pháp IRLS), nghĩa là mẫu của 's, , luôn thuộc vùng lân cận của điểm cố định.xx¯
Chúng tôi tính đạo hàm
∂vi(m∗)∂m=∂wi(m∗)∂m∑Ni=1wi(m∗)−wi(m∗)∑Ni=1∂wi(m∗)∂m(∑Ni=1wi(m∗))2
=1∑Ni=1wi(m∗)⋅[∂wi(m∗)∂m−vi(m∗)∑i=1N∂wi(m∗)∂m]
Sau đó
A′(m∗)=1∑Ni=1wi(m∗)⋅[∑i=1N∂wi(m∗)∂mxi−(∑i=1N∂wi(m∗)∂m)∑i=1Nvi(m∗)xi]
=1∑Ni=1wi(m∗)⋅[∑i=1N∂wi(m∗)∂mxi−(∑i=1N∂wi(m∗)∂m)m∗]
và
|A′(m∗)|<1⇒∣∣∣∣∑i=1N∂wi(m∗)∂m(xi−m∗)∣∣∣∣<∣∣∣∣∑i=1Nwi(m∗)∣∣∣∣[3]
chúng ta có
∂wi(m∗)∂m=−ρ′′(|xi−m∗|)⋅xi−m∗|xi−m∗||xi−m∗|+xi−m∗|xi−m∗|ρ′(|xi−m∗|)|xi−m∗|2=xi−m∗|xi−m∗|3ρ′(|xi−m∗|)−ρ′′(|xi−m∗|)⋅xi−m∗|xi−m∗|2=xi−m∗|xi−m∗|2⋅[ρ′(|xi−m∗|)|xi−m∗|−ρ′′(|xi−m∗|)]=xi−m∗|xi−m∗|2⋅[wi(m∗)−ρ′′(|xi−m∗|)]
Chèn cái này vào chúng ta có[3]
∣∣∣∣∑i=1Nxi−m∗|xi−m∗|2⋅[wi(m∗)−ρ′′(|xi−m∗|)](xi−m∗)∣∣∣∣<∣∣∣∣∑i=1Nwi(m∗)∣∣∣∣
⇒∣∣∣∣∑i=1Nwi(m∗)−∑i=1Nρ′′(|xi−m∗|)∣∣∣∣<∣∣∣∣∑i=1Nwi(m∗)∣∣∣∣[4]
Đây là điều kiện phải được thỏa mãn cho điểm cố định là UAS. Vì trong trường hợp của chúng tôi, hàm hình phạt là lồi, các khoản tiền liên quan là dương. Vì vậy, điều kiện tương đương với[4]
∑i=1Nρ′′(|xi−m∗|)<2∑i=1Nwi(m∗)[5]
Nếu là hàm mất của Hubert, thì chúng ta có một nhánh bậc hai ( ) và nhánh tuyến tính ( ),ρ(|xi−m|)ql
ρ(|xi−m|)=⎧⎩⎨(1/2)|xi−m|2|xi−m|≤δδ(|xi−m|−δ/2)|xi−m|>δ
và
ρ′(|xi−m|)={|xi−m||xi−m|≤δδ|xi−m|>δ
ρ′′(|xi−m|)={1|xi−m|≤δ0|xi−m|>δ
⎧⎩⎨⎪⎪wi,q(m)=1|xi−m|≤δwi,l(m)=δ|xi−m|<1|xi−m|>δ
Vì chúng tôi không biết có bao nhiêuĐặt chúng ta vào nhánh bậc hai và có bao nhiêu trong tuyến tính, chúng ta phân tách điều kiện thành ( )|xi−m∗|[5]Nq+Nl=N
∑i=1Nqρ′′q+∑i=1Nlρ′′l<2[∑i=1Nqwi,q+∑i=1Nlwi,l]
⇒Nq+0<2[Nq+∑i=1Nlwi,l]⇒0<Nq+2∑i=1Nlwi,l
mà giữ. Vì vậy, đối với hàm mất Huber, điểm cố định của thuật toán là ổn định không có triệu chứng, không phụ thuộc vào . Chúng tôi lưu ý rằng đạo hàm đầu tiên nhỏ hơn thống nhất về giá trị tuyệt đối cho bất kỳ , không chỉ điểm cố định. xm
Những gì chúng ta nên làm bây giờ là chứng minh rằng thuộc tính UAS cũng là toàn cục hoặc nếu thì thuộc về vùng lân cận của .m(0)=x¯m(0)m∗