Chính xác thì sự khác biệt giữa mô hình tham số và không tham số là gì?


14

Tôi bối rối với định nghĩa của mô hình không tham số sau khi đọc liên kết này Mô hình tham số so với mô hình không tham sốTrả lời nhận xét về câu hỏi khác của tôi .

Ban đầu tôi nghĩ "tham số so với không tham số" có nghĩa là nếu chúng ta có các giả định phân phối trên mô hình (tương tự như kiểm tra giả thuyết tham số hoặc không tham số). Nhưng cả hai tài nguyên đều tuyên bố "tham số so với không tham số" có thể được xác định bởi nếu số lượng tham số trong mô hình phụ thuộc vào số lượng hàng trong ma trận dữ liệu.

Đối với ước tính mật độ hạt nhân (không tham số), định nghĩa như vậy có thể được áp dụng. Nhưng theo định nghĩa này, làm thế nào một mạng nơ-ron có thể là một mô hình không tham số, vì số lượng tham số trong mô hình phụ thuộc vào cấu trúc mạng thần kinh chứ không phụ thuộc vào số lượng hàng trong ma trận dữ liệu?

Chính xác thì sự khác biệt giữa mô hình tham số và mô hình không tham số là gì?


3
Lưu ý rằng "không tham số" liên quan đến các mô hình phân phối (như trong tài liệu tham khảo của bạn để kiểm tra giả thuyết) liên quan đến số lượng tham số được sử dụng để xác định phân phối ("parametric '= được xác định bởi một số tham số cố định; phương pháp không tham số không có phân phối với một số lượng tham số cố định - chúng có xu hướng có các giả định nhẹ hơn, như tính liên tục hoặc tính đối xứng)
Glen_b -Reinstate Monica

Ý kiến ​​của tôi: dính vào định nghĩa của bạn. Đó là một định nghĩa có hệ thống, như định nghĩa nên có. Một cái khác là run rẩy: trước tiên bạn cần xác định "số lượng tham số hiệu quả" của một thuật toán. Nhưng tôi luôn thấy số lượng này được xác định theo từng trường hợp (ví dụ: bạn có một định nghĩa cho hồi quy tuyến tính, một cho hàng xóm gần nhất, một cho các mạng thần kinh ..). Vì vậy, trừ khi ai đó có thể đưa ra một định nghĩa chung, có hệ thống về số lượng tham số hiệu quả, tôi thực sự không thể coi trọng định nghĩa này.
Adrien

1
Tìm thấy bên dưới liên kết có giải thích tốt về các thuật toán học máy tham số và thuật toán học máy không tham số. machinelearningmastery.com/ từ
Satya

Câu trả lời:


16

Trong một mô hình tham số, số lượng tham số được cố định theo kích thước mẫu. Trong một mô hình không tham số, số lượng tham số (hiệu quả) có thể tăng theo kích thước mẫu.

Trong hồi quy OLS, số lượng tham số sẽ luôn là độ dài , cộng với một tham số cho phương sai. β

Một mạng lưới thần kinh với kiến ​​trúc cố định và không phân rã trọng lượng sẽ là một mô hình tham số.

Nhưng nếu bạn bị phân rã trọng lượng, thì giá trị của tham số phân rã được chọn bằng xác thực chéo thường sẽ nhỏ hơn với nhiều dữ liệu hơn. Điều này có thể được hiểu là sự gia tăng số lượng tham số hiệu quả với tăng kích thước mẫu.


1
Chắc chắn mặc dù tham số phân rã trọng lượng vẫn là một tham số bổ sung duy nhất và không (trừ khi tôi nhầm) thay đổi cấu trúc của mạng. Làm thế nào nó có thể được hiểu là sự gia tăng số lượng tham số khi kích thước mẫu tăng?
Morgan Ball

2
Phân rã trọng lượng là một siêu tham số. Đọc ở đây về mức độ tự do hiệu quả trong chính quy hóa: statweb.stanford.edu/~tibs/sta305files/Rudyuityization.pdf. Trong khi các mạng lưới thần kinh không tuyến tính, phân rã trọng lượng thực hiện chức năng tương tự như một hình phạt bậc hai trong các mô hình này.
generic_user 20/03/2017

Tôi (tất nhiên) đồng ý với trực giác của các tham số hiệu quả, nhưng tôi không đồng ý với việc sử dụng khái niệm này để xác định tham số / không tham số, xem nhận xét của tôi cho câu hỏi.
Adrien

Vâng tôi thấy quan điểm của bạn. Nhưng tôi cho rằng những người hợp lý có thể không đồng ý về việc liệu sự run rẩy của một định nghĩa có khiến nó trở thành một định nghĩa không có ích, ceteris paribus.
generic_user

1
Tôi đã thấy lời giải thích này trước đây và không thích nó. Bằng cách này, tôi có thể gọi một bình phương tối thiểu thông thường với độ co rút là phương pháp Không theo tỷ lệ bởi vì các tham số hiệu quả của Cameron có thể nhỏ hơn hệ số. Tôi nghĩ rằng nó không phải là một phân loại hữu ích vì nó làm mờ Đường giữa các phương pháp thực sự không theo quy chuẩn
Aksakal

1

Tôi nghĩ rằng nếu mô hình được định nghĩa là một tập hợp các phương trình (có thể là một hệ phương trình đồng thời hoặc một phương trình duy nhất), và chúng ta tìm hiểu các tham số của nó, thì đó là tham số. Điều đó bao gồm các phương trình vi phân, và thậm chí phương trình Navier-Stokes. Các mô hình được xác định mô tả, bất kể chúng được giải quyết như thế nào, đều thuộc loại không đối xứng. Do đó, OLS sẽ là tham số và thậm chí là hồi quy lượng tử, mặc dù thuộc về lĩnh vực thống kê phi tham số, là một mô hình tham số.

Mặt khác, khi chúng ta sử dụng SEM (mô hình phương trình cấu trúc) để xác định mô hình, nó sẽ là một mô hình không tham số - cho đến khi chúng ta giải được SEM. PCA sẽ là tham số, bởi vì các phương trình được xác định rõ, nhưng CCA có thể là không tham số, bởi vì chúng tôi đang tìm kiếm mối tương quan trên tất cả các biến và nếu đây là các mối tương quan của Spearman, chúng tôi có một mô hình không tham số. Với mối tương quan của Pearson, chúng tôi ngụ ý một mô hình tham số (tuyến tính). Tôi nghĩ rằng các thuật toán phân cụm sẽ không theo tỷ lệ, trừ khi chúng ta đang tìm kiếm các cụm có hình dạng nhất định.

Và sau đó chúng ta có hồi quy không theo tỷ lệ, đó là hồi quy không theo tỷ lệ và hồi quy LOESS, là tham số, nhưng phục vụ cho cùng một mục đích: chúng ta xác định phương trình và cửa sổ.


3
Mô tả của bạn khá mơ hồ và dường như mâu thuẫn với ý nghĩa thống kê tiêu chuẩn của "tham số" và "không tham số". Cụ thể, bạn đã có một vị trí bất thường liên quan đến một số kỹ thuật cụ thể, chẳng hạn như LOESS, thường được coi là không theo tỷ lệ: xem en.wikipedia.org/wiki/Local_regression chẳng hạn.
whuber

@whuber cảm ơn vì đường link! Bạn đã đúng: LOESS được coi là không tham số. Đó là khá trái ngược với tôi. Điều gì về làm mịn theo cấp số nhân? Có phải là không tham số vì trọng lượng của mỗi điểm là khác nhau? Hoặc là tham số vì alpha là giống nhau cho toàn bộ chuỗi thời gian?
AlexG

Các tham số trong các tình huống tham số không nhất thiết phải đếm một loạt các số. Họ đề cập đến cách người ta phải mô tả một gia đình của các mô hình thống kê. Chẳng hạn, khi một thủ tục phù hợp với một giá trị duy nhất cho dữ liệu (có thể bằng xác thực chéo, có thể bằng các phương tiện khác) nhưng chỉ giả sử rằng dữ liệu là một mẫu ngẫu nhiên từ bất kỳ phân phối nào , quy trình đó là không tham số.
whuber

0

tôiogoddS(G)= =Tôint+mộtx1+bx2+...


1
Tôi cũng có thể viết các phương trình cho các phương pháp ước lượng kernel, không tham số.
HelloWorld

1
sai - bạn có thể viết các phương trình rõ ràng và đơn giản cho trung bình tiên đoán và phương sai dự đoán của các quy trình Gaussian, đây là một trong những phương pháp hồi quy không theo tỷ lệ phổ biến nhất và cho nhiều phương pháp hồi quy không theo tỷ lệ khác.
DeltaIV
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.