Tại sao thống kê tham số bao giờ được ưa thích hơn so với không tham số?


60

Ai đó có thể giải thích cho tôi tại sao mọi người sẽ chọn một tham số qua phương pháp thống kê không theo tỷ lệ để kiểm tra giả thuyết hoặc phân tích hồi quy không?

Trong tâm trí của tôi, nó giống như đi bè và chọn một chiếc đồng hồ không chịu nước, bởi vì bạn có thể không bị ướt. Tại sao không sử dụng công cụ hoạt động vào mọi dịp?


21
Đó là giới thiệu sai lệch quy nạp vào quá trình suy luận thống kê. Đó là một cách nói lạ mắt: nếu bạn biết điều gì đó, hãy cung cấp nó như một gợi ý. Gợi ý này có thể có các hình thức như cung cấp hình thức chức năng của khả năng hoặc phân phối trước trên các tham số. Nếu gợi ý của bạn là tốt thì kết quả sẽ tốt hơn là không có gợi ý, và nếu nó xấu thì kết quả sẽ tệ hơn.
Cagdas Ozgenc

6
Không cần thiết. Về cơ bản bạn đang tìm kiếm một cái gì đó trên một món tráng miệng rất lớn. Nếu ai đó nói với bạn rằng những gì bạn đang tìm kiếm bị giới hạn trong một lãnh thổ nhất định thì cơ hội tìm thấy nó sẽ được cải thiện. Nhưng nếu họ đánh lừa bạn bằng thông tin sai thì cho dù bạn có tìm kiếm lãnh thổ đó bao nhiêu đi chăng nữa, bạn sẽ không tìm thấy nó.
Cagdas Ozgenc

17
Là một thợ mộc, tôi thích sự tương tự ở cuối. Nhà và đồ nội thất được xây dựng tốt và cuối cùng được xây dựng bằng các công cụ chuyên dụng. Các công cụ đa năng rất tốt cho chủ nhà và cho các chuyên gia, những người cần hoàn thành công việc nhanh chóng hoặc khi sử dụng một công cụ thô sơ hoặc không phù hợp sẽ không tạo ra sự khác biệt về chất lượng mà bất cứ ai quan tâm. Thợ thủ công, mặc dù, đạt được kết quả tốt nhất bằng cách sử dụng công cụ phù hợp cho công việc, và thực sự một số điều đơn giản không thể được thực hiện mà không có nó. Chẳng ai từng tạo ra một tấm thảm tốt với một bàn tay đa năng chẳng hạn.
whuber

3
Cho dù bạn đào một con mương bằng một cái thuổng hay một muỗng cà phê bạn sẽ kết thúc với một con mương. Chỉ là nếu bạn sử dụng muỗng cà phê, bạn cũng già hơn.
liên hợp chiến

Câu trả lời:


25

Hiếm khi có một thử nghiệm tham số và thử nghiệm không tham số thực sự có cùng null. -test tham số đang kiểm tra giá trị trung bình của phân phối, giả sử hai khoảnh khắc đầu tiên tồn tại. Bài kiểm tra tổng xếp hạng Wilcoxon không giả sử bất kỳ khoảnh khắc nào và thay vào đó kiểm tra sự bình đẳng của các bản phân phối. Tham số ngụ ý của nó là một chức năng phân phối kỳ lạ, xác suất quan sát từ một mẫu thấp hơn quan sát từ mẫu kia. Bạn có thể sắp xếp cuộc nói chuyện về sự so sánh giữa hai thử nghiệm theo null hoàn toàn được chỉ định của các bản phân phối giống hệt nhau ... nhưng bạn phải nhận ra rằng hai thử nghiệm đang thử nghiệm các giả thuyết khác nhau.t

Thông tin mà các xét nghiệm tham số mang lại cùng với giả định của chúng giúp cải thiện sức mạnh của các xét nghiệm. Tất nhiên thông tin đó tốt hơn là đúng, nhưng có rất ít nếu có bất kỳ lĩnh vực kiến ​​thức nào của con người ngày nay khi thông tin sơ bộ đó không tồn tại. Một ngoại lệ thú vị nói rõ ràng "Tôi không muốn thừa nhận bất cứ điều gì" là phòng xử án nơi các phương pháp phi tham số tiếp tục được phổ biến rộng rãi - và nó có ý nghĩa hoàn hảo cho ứng dụng. Có lẽ có một lý do chính đáng, ý định chơi chữ, rằng Phillip Good là tác giả của những cuốn sách hay về cả thống kê phi tham sốthống kê phòng xử án .

Ngoài ra còn có các tình huống thử nghiệm mà bạn không có quyền truy cập vào microdata cần thiết cho thử nghiệm không theo dõi. Giả sử bạn được yêu cầu so sánh hai nhóm người để đánh giá xem một nhóm có béo phì hơn nhóm kia không. Trong một thế giới lý tưởng, bạn sẽ có số đo chiều cao và cân nặng cho mọi người, và bạn có thể tạo thành một bài kiểm tra hoán vị phân tầng theo chiều cao. Trong một thế giới ít lý tưởng hơn (nghĩa là thực tế), bạn chỉ có thể có chiều cao trung bình và trọng lượng trung bình trong mỗi nhóm (hoặc có thể là một số phạm vi hoặc phương sai của các đặc điểm này trên đầu của mẫu). Đặt cược tốt nhất của bạn là sau đó để tính chỉ số BMI trung bình cho mỗi nhóm và so sánh chúng nếu bạn chỉ có phương tiện; hoặc giả sử bình thường về chiều cao và cân nặng nếu bạn có phương tiện và phương sai (có lẽ bạn phải lấy một mối tương quan từ một số dữ liệu bên ngoài nếu nó không đi kèm với các mẫu của bạn),


3
Tôi hiểu rằng trong trường hợp kiểm tra, bạn không có null giống nhau, mặc dù tôi không chắc liệu có ý nghĩa gì khi nói rằng null tốt hơn null khác không. Nhưng những gì về trường hợp dự đoán? Câu chuyện hoàn toàn khác nhau, vẫn còn nan giải so với tiến thoái lưỡng nan.
en1

22

Như những người khác đã viết: nếu các điều kiện tiên quyết được đáp ứng, bài kiểm tra tham số của bạn sẽ mạnh hơn bài kiểm tra không tham số.

Trong tương tự đồng hồ của bạn, đồng hồ không chịu nước sẽ chính xác hơn nhiều trừ khi nó bị ướt. Ví dụ, đồng hồ chống nước của bạn có thể tắt sau một giờ, trong khi đồng hồ không chịu nước sẽ chính xác ... và bạn cần bắt xe buýt sau chuyến đi bè của mình. Trong trường hợp như vậy, có thể có ý nghĩa khi mang theo chiếc đồng hồ không chịu nước cùng với bạn và đảm bảo nó không bị ướt.


Điểm thưởng: phương pháp không tham số không phải lúc nào cũng dễ dàng. Có, một thử nghiệm hoán vị thay thế cho thử nghiệm là đơn giản. Nhưng một sự thay thế không đối xứng cho một mô hình tuyến tính hỗn hợp với nhiều tương tác hai chiều và các hiệu ứng ngẫu nhiên lồng nhau khó thiết lập hơn một chút so với một cuộc gọi đơn giản nlme(). Tôi đã làm như vậy, bằng cách sử dụng các phép thử hoán vị và theo kinh nghiệm của tôi, các giá trị p của các phép thử tham số và phép hoán vị luôn luôn khá gần nhau, ngay cả khi phần dư từ mô hình tham số khá bất thường. Các xét nghiệm tham số thường có khả năng phục hồi đáng ngạc nhiên trước các lần khởi hành từ các điều kiện tiên quyết của chúng.


Có vẻ như quan điểm phổ biến rằng các phương pháp tham số mạnh hơn khi các giả định của chúng được đáp ứng. Nhưng nếu đó là trường hợp thì tại sao chúng ta có giá trị p để đánh giá kết quả từ cả hai phương pháp? Ý tôi là nếu một bài kiểm tra tham số bác bỏ giả thuyết khống với xác suất ít nhất là 99%, thì làm thế nào tốt hơn từ một bài kiểm tra không tham số bác bỏ giả thuyết khống với xác suất 99%? Là xác suất 0,99 khác nhau trong từng trường hợp? Điều đó sẽ không có ý nghĩa.
en1

1
Các giả thuyết null khác nhau giữa một thử nghiệm tham số và đối tác không tham số của nó. Cụ thể, giả thuyết khống cho một thử nghiệm tham số chứa một giả định tham số cụ thể về phân phối thống kê thử nghiệm (thường cũng sẽ được tính theo các cách khác nhau cho hai thử nghiệm) - đó là lý do tại sao nó được gọi là "tham số"! Vì vậy, hai giá trị p có cùng tên, nhưng được tính toán dựa trên các thống kê kiểm tra khác nhau, có các phân phối khác nhau theo các giả thuyết null khác nhau.
S. Kolassa - Tái lập Monica


3
@StephanKolassa, tôi thực sự bắt đầu viết bình luận cho câu trả lời của bạn và đã được mang đi :)
StasK

12

Mặc dù tôi đồng ý rằng trong nhiều trường hợp, các kỹ thuật phi tham số là thuận lợi, cũng có những tình huống trong đó các phương pháp tham số hữu ích hơn.

Chúng ta hãy tập trung vào cuộc thảo luận "bài kiểm tra t hai mẫu so với bài kiểm tra tổng xếp hạng của Wilcoxon" (nếu không chúng ta phải viết cả một cuốn sách).

  1. Với kích thước nhóm nhỏ 2-3, chỉ có thử nghiệm t về mặt lý thuyết mới có thể đạt được giá trị p dưới 5%. Trong sinh học và hóa học, kích thước nhóm như thế này không phải là hiếm. Tất nhiên là tinh tế khi sử dụng thử nghiệm t trong cài đặt như vậy. Nhưng có lẽ nó tốt hơn không có gì. (Điểm này được liên kết với vấn đề trong hoàn cảnh hoàn hảo, thử nghiệm t có sức mạnh hơn thử nghiệm Wilcoxon).
  2. Với quy mô nhóm khổng lồ, cũng có thể xem thử nghiệm t là không tham số nhờ Định lý giới hạn trung tâm.
  3. Kết quả của bài kiểm tra t phù hợp với khoảng tin cậy của Học sinh về sự khác biệt trung bình.
  4. Nếu phương sai khác nhau giữa các nhóm, thì phiên bản kiểm tra t của Welch cố gắng tính đến điều này, trong khi kiểm tra tổng xếp hạng của Wilcoxon có thể thất bại nặng nề nếu phương tiện được so sánh (ví dụ xác suất lỗi của loại thứ nhất khác nhiều so với mức danh nghĩa ).

2
Tôi sẽ không đồng ý với 1. Đơn giản là sử dụng một thủ tục vì nó cho phép bạn đưa ra quyết định không thực sự là một lý do chính đáng, đặc biệt là khi bạn không có lý do gì để mong đợi thủ tục đó có hiệu lực. Nếu bạn có ít hoặc không có dữ liệu thì chỉ cần đưa ra đánh giá và đừng giả vờ nó dựa trên sự nghiêm ngặt.
DSaxton

5
Tôi đồng ý với bạn. Đây rõ ràng là một lý do tại sao kết quả thường không thể lặp lại, ngay cả khi được công bố trên các tạp chí được xếp hạng cao nhất. Nhưng bạn có những lựa chọn nào với tư cách là một nhà nghiên cứu nếu ngân sách chỉ cho phép các cỡ mẫu nhỏ?
Michael M

1
Re 4 và các vấn đề khi áp dụng Wilcoxon-Mann-Whitney khi có sự khác biệt không đồng đều giữa các nhóm, có những phương pháp không tham số cho phép tính không đồng nhất: Tôi dường như nhớ lại thử nghiệm của Cliff hoặc thử nghiệm Brunner-Munzel. (Tôi không nghĩ rằng chúng tôi có nhiều thông tin về họ trên trang web này.)
Silverfish

@Silverfish: Tôi thường xuyên sử dụng các phương pháp của Brunner và tôi nghĩ bạn đã đúng. Nhưng tôi nghi ngờ rằng họ thực sự so sánh có nghĩa là ngoại lệ khi đưa ra các giả định phân phối mạnh mẽ.
Michael M

1
@MichaelM Có tất nhiên - điều đó quay trở lại câu hỏi về các phương pháp tham số và phi tham số có các giả thuyết khác nhau, tôi đoán vậy.
Cá bạc

9

Trong thử nghiệm giả thuyết, các thử nghiệm không theo tỷ lệ thường kiểm tra các giả thuyết khác nhau, đó là một lý do tại sao người ta không thể luôn luôn chỉ thay thế một thử nghiệm không đối xứng cho một thử nghiệm tham số.

Tổng quát hơn, các thủ tục tham số cung cấp một cách áp đặt cấu trúc lên các vấn đề không có cấu trúc khác. Điều này rất hữu ích và có thể được xem như một loại đơn giản hóa heuristic hơn là một niềm tin rằng mô hình là đúng theo nghĩa đen. Ví dụ, vấn đề dự đoán một phản ứng liên tục dựa trên vectơ của các yếu tố dự đoán sử dụng một hàm hồi quy (thậm chí giả sử rằng hàm đó tồn tại là một loại hạn chế tham số). Nếu chúng ta giả sử hoàn toàn không có gì vềx f f f ( x ) = p j = 1 β j x jyxffsau đó không rõ ràng về cách chúng ta có thể tiến hành ước tính hàm này. Tập hợp các câu trả lời có thể có mà chúng ta cần tìm kiếm là quá lớn. Nhưng nếu chúng ta hạn chế không gian của câu trả lời có thể (ví dụ) tập hợp các tuyến chức năng , sau đó chúng ta có thể thực sự bắt đầu tiến bộ. Chúng ta không cần phải tin rằng mô hình giữ chính xác, chúng ta chỉ đang thực hiện một xấp xỉ do cần phải đi đến một số câu trả lời, tuy nhiên không hoàn hảo.f(x)=j=1pβjxj


Vâng, và điều đó thêm một mô hình thiên vị. Điều đó nói gì về các nhà nghiên cứu giá trị p báo cáo?
Cagdas Ozgenc

@dsaxton những gì bạn nói là đúng về việc kiểm tra các giả thuyết khác nhau nhưng mọi người vẫn diễn giải chúng theo cùng một cách. Sau đó, cũng có hồi quy, trong đó những hiểu biết bạn có được giữa các phân tích không tham số và tham số là khá giống nhau.
en1

@ cagdas-ozgenc Nó cho bạn biết rằng giá trị p là điều kiện trên mô hình. Nhưng không rõ mọi thứ có thể khác như thế nào ...
liên hợp chiến

3
+1 để lưu ý rằng chúng tôi hoàn toàn không có cơ hội ước tính bất cứ thứ gì có giá trị trong hồi quy mà không có một số giả định về hàm hồi quy.
liên hợp chiến

9

Mô hình bán đảo có nhiều lợi thế. Họ cung cấp các thử nghiệm như thử nghiệm Wilcoxon như một trường hợp đặc biệt, nhưng cho phép ước tính tỷ lệ hiệu ứng, lượng tử, phương tiện và xác suất vượt quá. Chúng mở rộng đến dữ liệu theo chiều dọc và bị kiểm duyệt. Chúng mạnh mẽ trong không gian Y và là bất biến chuyển đổi ngoại trừ phương tiện ước tính. Xem liên kết http://biostat.mc.vanderbilt.edu/rms để nhận bản hướng dẫn khóa học để biết ví dụ chi tiết / nghiên cứu trường hợp.

Trái ngược với các phương pháp tham số đầy đủ ( -test, hồi quy bội thông thường, mô hình hiệu ứng hỗn hợp, mô hình tồn tại tham số, v.v.), phương pháp bán tổng thể cho hoặc liên tục không cho rằng phân phối cho cho trước , thậm chí không phải là phân phối là không chính thống hoặc trơn tru. Sự phân phối thậm chí có thể có những đột biến nghiêm trọng bên trong nó hoặc tại các ranh giới. Các mô hình bán tổng thể chỉ giả sử một kết nối (ví dụ: lũy thừa trong trường hợp của mô hình Cox) giữa các bản phân phối cho hai cài đặt hiệp biến khác nhau vàY Y X X 1 X 2tYYXX1X2. Các ví dụ bao gồm mô hình tỷ lệ cược tỷ lệ (trường hợp đặc biệt: Wilcoxon và Kruskal-Wallis) và mô hình mối nguy theo tỷ lệ (trường hợp đặc biệt: kiểm tra thứ hạng log và kiểm tra thứ hạng phân tầng).

Trong thực tế, các mô hình bán tổng thể có rất nhiều chặn. Những chặn này mã hóa phân phối của không theo phương pháp. Tuy nhiên, điều này không tạo ra bất kỳ vấn đề nào với việc quá tham số hóa.Y


1
Tôi đã vật lộn với điều này một chút. Bạn có xem xét nghiệm t là bán tham số hoặc không tham số không? Một mặt, tôi luôn giả định 'ý chính' của bán tham số là như sau: lấy mô hình xác suất "làm việc" cho dữ liệu, ước tính các tham số trong phân phối đó bất kể phân phối có chính xác hay không và cải thiện ước tính lỗi tài khoản cho sự không chắc chắn. (Vì vậy, các lỗi dựa trên sandwich cho các giải pháp cho phương trình điểm Gaussian sẽ là phép thử T bán tham số). Tuy nhiên, bán tham số hầu như luôn liên quan đến việc chia phần / điều chỉnh một cái gì đó, như với các mô hình Cox.
AdamO

Tôi sẽ thêm mô tả vào câu trả lời của tôi để đối phó với điều đó.
Frank Harrell

6

Trong số các câu trả lời được cung cấp, tôi cũng sẽ chú ý đến số liệu thống kê Bayes. Một số vấn đề không thể được trả lời bởi khả năng một mình. Một người thường xuyên sử dụng lý luận trái ngược trong đó "xác suất" đề cập đến các vũ trụ thay thế và khung vũ trụ thay thế không có ý nghĩa gì khi suy ra trạng thái của một cá nhân, chẳng hạn như cảm giác tội lỗi hoặc vô tội của một tên tội phạm, hoặc liệu việc tắc nghẽn tần số gen trong một các loài tiếp xúc với sự thay đổi môi trường lớn dẫn đến sự tuyệt chủng của nó. Trong bối cảnh Bayes, xác suất là "niềm tin" không phải tần số, có thể được áp dụng cho tần số đã kết tủa.

Bây giờ, phần lớn các phương pháp Bayes yêu cầu xác định đầy đủ các mô hình xác suất cho trước và kết quả. Và, hầu hết các mô hình xác suất này là tham số. Phù hợp với những gì người khác đang nói, những điều này không cần phải chính xác để tạo ra các bản tóm tắt có ý nghĩa của dữ liệu. "Tất cả các mô hình đều sai, một số mô hình là hữu ích."

Tất nhiên, có các phương pháp Bayes không định lượng. Chúng có rất nhiều nếp nhăn thống kê và nói chung, đòi hỏi dữ liệu dân số gần như toàn diện được sử dụng một cách có ý nghĩa.


6

Lý do duy nhất tôi trả lời mặc dù tất cả các câu trả lời tốt ở trên là không ai gọi sự chú ý đến lý do số 1 chúng tôi sử dụng các bài kiểm tra tham số (ít nhất là trong phân tích dữ liệu vật lý hạt). Bởi vì chúng tôi biết việc tối ưu hóa dữ liệu. Tât nhiên! Đó là một lợi thế lớn. Bạn đang đưa hàng trăm, hàng ngàn hoặc hàng triệu điểm dữ liệu vào một vài tham số mà bạn quan tâm và mô tả phân phối của mình. Chúng cho bạn biết vật lý cơ bản (hoặc bất cứ thứ gì khoa học cung cấp cho bạn dữ liệu của bạn).

Tất nhiên, nếu bạn không có bất kỳ ý tưởng nào về mật độ xác suất cơ bản thì bạn không có lựa chọn nào khác: sử dụng các xét nghiệm không tham số. Các xét nghiệm phi tham số có ưu điểm là không có bất kỳ sự thiên vị định trước nào, nhưng có thể khó thực hiện hơn - đôi khi khó hơn nhiều.


5

Thống kê phi trắc nghiệm có vấn đề riêng của nó! Một trong số đó là sự nhấn mạnh vào kiểm tra giả thuyết, thường chúng ta cần khoảng ước lượng và khoảng tin cậy, và đưa chúng vào các mô hình phức tạp với các số liệu không đối xứng là --- phức tạp. Có một bài viết blog rất hay về điều này, với thảo luận, tại http://andrewgelman.com/2015/07/13/dont-do-the-wilcoxon/ Cuộc thảo luận dẫn đến bài đăng khác này, http: // notstatschat. tumblr.com/post/63237480043/rock-apers-sc khoa-wilcoxon-test , được khuyến nghị cho một quan điểm rất khác về Wilcoxon. Phiên bản ngắn là: Wilcoxon (và các bài kiểm tra xếp hạng khác) có thể dẫn đến không chuyển dịch.


4
Tôi không chắc chắn rằng tính siêu việt là cuối cùng và là tất cả. Và bạn có thể đảo ngược bài kiểm tra Wilcoxon để có được khoảng tin cậy của trình ước tính vị trí rất mạnh mẽ và hữu ích.
Frank Harrell

2
Không tự nhiên có điểm của nó trong mô hình nguyên nhân, nhưng đối với hai bài kiểm tra mẫu đơn giản về liên kết, tôi không nghĩ đó thực sự là một vấn đề. Ngoài ra, tôi không thấy sự khác biệt trong kiểm tra giả thuyết / ước lượng / khoảng tin cậy giữa các phương pháp không tham số và tham số. Đôi khi, với ước lượng mạnh mẽ, bạn sử dụng mô hình xác suất làm việc để ước lượng tham số tương ứng cung cấp một bản tóm tắt có ý nghĩa của dữ liệu (ngay cả khi đó không phải là mô hình xác suất đúng theo từng se). Có lẽ bạn có thể mở rộng về câu trả lời này?
AdamO

2
Thông thường một số giả định bổ sung được đưa ra cho thử nghiệm Wilcoxon, ví dụ như sự thống trị ngẫu nhiên của một nhóm so với nhóm kia, rằng nếu sự phục hồi thực sự.
Scortchi - Phục hồi Monica

3

Tôi muốn nói rằng các số liệu thống kê phi tham số thường được áp dụng theo nghĩa là chúng đưa ra các giả định ít hơn so với thống kê tham số.

Tuy nhiên, nếu người ta sử dụng số liệu thống kê tham số và các giả định cơ bản được đáp ứng, thì số liệu thống kê tham số sẽ mạnh mẽ hơn so với thông số không tham số.


2

Thống kê tham số thường là những cách để kết hợp kiến ​​thức [với dữ liệu] bên ngoài. Chẳng hạn, bạn biết rằng phân phối lỗi là bình thường và kiến ​​thức này xuất phát từ kinh nghiệm trước đó hoặc một số xem xét khác chứ không phải từ tập dữ liệu. Trong trường hợp này, bằng cách giả sử phân phối bình thường, bạn đang kết hợp kiến ​​thức bên ngoài này vào các ước tính tham số của mình, điều này phải cải thiện các ước tính của bạn.

Trên đồng hồ của bạn tương tự. Ngày nay, hầu hết tất cả các đồng hồ đều có khả năng chống nước ngoại trừ các mảnh đặc biệt với đồ trang sức hoặc vật liệu khác thường như gỗ. Lý do để mặc chúng chính xác là: chúng đặc biệt. Nếu bạn có nghĩa là bằng chứng nước thì nhiều đồng hồ ăn mặc không phải là bằng chứng nước. Lý do để đeo chúng một lần nữa là chức năng của chúng: bạn sẽ không đeo đồng hồ thợ lặn với bộ và cà vạt. Ngoài ra, những ngày này nhiều đồng hồ đã mở trở lại để bạn có thể thưởng thức khi nhìn vào chuyển động thông qua các tinh thể. Đương nhiên, những chiếc đồng hồ này thường không chống nước.


1
Tôi thích phép ẩn dụ này!. Tôi nhớ một giáo sư đã nói với chúng ta rằng chúng ta nên thử các phương pháp thống kê khác nhau trên cùng một thứ để xem liệu chúng ta có thể nhận được kết quả tương tự hay không.
Miền Bắc sâu

2

Đây không phải là kịch bản thử nghiệm giả thuyết, nhưng nó có thể là một ví dụ tốt để trả lời câu hỏi của bạn: hãy xem xét phân tích phân cụm. Có nhiều phương pháp phân cụm "không tham số" như phân cụm theo phân cấp, phương tiện K, v.v., nhưng vấn đề luôn là làm thế nào để đánh giá xem giải pháp phân cụm của bạn có "tốt hơn" hay không, so với giải pháp khả thi khác (và thường có nhiều giải pháp khả thi) . Mỗi thuật toán cung cấp cho bạn thứ tốt nhất có thể nhận được, tuy nhiên làm thế nào bạn biết nếu không có gì tốt hơn ..? Bây giờ, cũng có các cách tiếp cận tham số để phân cụm, nên được gọi là phân cụm dựa trên mô hình, giống như Mô hình hỗn hợp hữu hạn. Với FMM, bạn xây dựng một mô hình thống kê mô tả phân phối dữ liệu của bạn và điều chỉnh nó thành dữ liệu. Khi bạn có mô hình của mình, bạn có thể đánh giá khả năng dữ liệu của bạn được cung cấp cho mô hình này, bạn có thể sử dụng các thử nghiệm tỷ lệ khả năng, so sánh AIC và sử dụng nhiều phương pháp khác để kiểm tra sự phù hợp của mô hình và so sánh mô hình. Các thuật toán phân cụm không tham số chỉ nhóm dữ liệu bằng cách sử dụng một số tiêu chí tương tự, trong khi với việc sử dụng FMM cho phép bạn mô tả và cố gắng hiểu dữ liệu của mình, kiểm tra mức độ phù hợp của nó, đưa ra dự đoán ... Trong thực tế, các phương pháp không tham số là đơn giản, hoạt động vượt trội và khá tốt, trong khi FMM có thể có vấn đề, nhưng các cách tiếp cận dựa trên mô hình thường cung cấp cho bạn đầu ra phong phú hơn.


2

Dự đoán và dự báo dữ liệu mới thường rất khó hoặc không thể đối với các mô hình không tham số. Ví dụ: tôi có thể dự báo số lượng yêu cầu bảo hành trong 10 năm tới bằng mô hình sinh tồn Weibull hoặc Logn normal, tuy nhiên điều này là không thể khi sử dụng mô hình Cox hoặc Kaplan-Meier.

Chỉnh sửa: Hãy để tôi rõ hơn một chút. Nếu một công ty có một sản phẩm bị lỗi thì họ thường quan tâm đến việc đưa ra tỷ lệ yêu cầu bảo hành và CDF trong tương lai dựa trên các yêu cầu bảo hành và dữ liệu bán hàng hiện tại. Điều này có thể giúp họ quyết định có cần thu hồi hay không. Tôi không biết làm thế nào bạn làm điều này bằng cách sử dụng một mô hình không tham số.


7
Tôi có ý kiến ​​khác. Bạn có thể sử dụng mô hình Cox để ước tính số lượng, trung bình (nếu giá trị Y cao nhất không bị kiểm duyệt) và tất cả các loại xác suất. Không thể dự báo vượt quá phạm vi của dữ liệu là một vấn đề (như bạn đã đề cập) nhưng bạn có thể ngoại suy một cách nguy hiểm.
Frank Harrell

@FrankHarrell Có điểm tốt, luôn phải cẩn thận khi ngoại suy.
Glen

Còn về Rừng ngẫu nhiên, Học sâu, hay SVM thì sao? Họ đánh bại hầu hết nếu không phải tất cả các phương pháp tham số để dự đoán.
en1

2
Ngoại trừ thử và đưa ra cây quyết định tìm hiểu ranh giới đường chéo
bill_e

1

Tôi thành thật tin rằng không có câu trả lời đúng cho câu hỏi này. Đánh giá từ các câu trả lời nhất định, sự đồng thuận là các xét nghiệm tham số mạnh hơn so với các tương đương không tham số. Tôi sẽ không tranh luận về quan điểm này nhưng tôi thấy nó giống như một quan điểm giả định hơn là thực tế vì nó không phải là thứ được dạy rõ ràng trong trường học và không có người đánh giá ngang hàng nào sẽ nói với bạn "bài báo của bạn đã bị từ chối vì bạn đã sử dụng các bài kiểm tra không tham số". Câu hỏi này là về một cái gì đó mà thế giới thống kê không thể trả lời rõ ràng nhưng đã được coi là điều hiển nhiên.

Ý kiến ​​cá nhân của tôi là sự ưu tiên của tham số hoặc không tham số có liên quan nhiều đến truyền thống hơn bất cứ điều gì khác (vì thiếu một thuật ngữ tốt hơn). Các kỹ thuật tham số để kiểm tra và dự đoán đã có trước tiên và có một lịch sử lâu dài, vì vậy không dễ để bỏ qua chúng. Dự đoán nói riêng, có một số giải pháp phi trắc nghiệm ấn tượng được sử dụng rộng rãi như một công cụ lựa chọn đầu tiên hiện nay. Tôi nghĩ rằng đây là một trong những lý do mà các kỹ thuật Machine Learning như mạng lưới thần kinh và cây quyết định, vốn không tự nhiên, đã trở nên phổ biến rộng rãi trong những năm gần đây.


3
3/π95%

'Đồng thuận' có nghĩa là 'thỏa thuận chung', không phải quan điểm cá nhân của tôi.
Digio

2
Tôi đã không đề cập đến việc liệu tuyên bố thể hiện quan điểm cá nhân của bạn hay trí tuệ tập thể của người khác, chỉ ra rằng tuyên bố đó chỉ đúng nếu các điều kiện cần thiết cho một bài kiểm tra tham số là đúng . Khi các điều kiện không giữ được, có thể không còn là trường hợp "các xét nghiệm tham số mạnh hơn so với không tham số", và trên thực tế, điều ngược lại có thể là trường hợp (đôi khi bởi một lề rất rộng).
Cá bạc

Cảm động! ..... +1
Digio

0

Đó là một vấn đề của quyền lực thống kê. Các xét nghiệm phi tham số thường có sức mạnh thống kê thấp hơn so với các đối tác tham số của chúng.


6
Các thử nghiệm tham số sẽ có nhiều sức mạnh hơn khi các giả định của chúng được đáp ứng. Khi các giả định của họ không được đáp ứng, các xét nghiệm phi tham số có thể mạnh hơn.
gung - Phục hồi Monica

3
Câu trả lời này rất ngắn và sức mạnh đã được thảo luận trong các câu trả lời trước. Bạn sẽ xem xét mở rộng nó một chút?
Scortchi - Phục hồi Monica

4
Mức tăng công suất từ ​​các thử nghiệm tham số là rất nhỏ khi so sánh với tổn thất điện năng mà chúng phải chịu khi các giả định của chúng không được đáp ứng.
Frank Harrell

Frank, nó phụ thuộc vào bài kiểm tra, một số bài kiểm tra mạnh mẽ hơn để vi phạm các giả định của họ.
Mô hình Markov ẩn

0

Đã có rất nhiều câu trả lời hay nhưng có một số lý do tôi chưa từng đề cập:

  1. Quen thuộc. Tùy thuộc vào đối tượng của bạn, kết quả tham số có thể quen thuộc hơn nhiều so với kết quả không tham số gần tương đương. Nếu hai người đưa ra kết luận tương tự, thì quen biết là tốt.

  2. Sự đơn giản. Đôi khi, kiểm tra tham số đơn giản hơn để thực hiện và báo cáo. Một số phương pháp không tham số rất chuyên sâu máy tính. Tất nhiên, máy tính đã nhanh hơn rất nhiều và thuật toán cũng được cải thiện, nhưng .... dữ liệu đã trở nên "lớn hơn".

    1. Đôi khi những gì thường là nhược điểm của xét nghiệm tham số thực sự là một lợi thế, mặc dù điều này là đặc trưng cho các cặp xét nghiệm cụ thể. Ví dụ, tôi, nói chung, là một fan hâm mộ của hồi quy lượng tử vì nó đưa ra ít giả định hơn các phương pháp thông thường. Nhưng đôi khi bạn thực sự cần phải ước tính giá trị trung bình, hơn là trung bình.
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.