Giới thiệu về thống kê phi tham số


11

Tôi đã nghiên cứu thống kê trong hai năm qua. Hầu hết mọi thứ tôi đã học là về thống kê tham số. Bây giờ tôi muốn tìm hiểu thêm về thống kê không tham số. Bất cứ ai có thể đề nghị một số giới thiệu ngắn gọn (có lẽ cũng có thể đọc được) vào lĩnh vực này?

Câu trả lời:


12

Nó phụ thuộc vào ý của bạn là 'súc tích', mức độ điều trị mà bạn đang tìm kiếm (bao gồm toán học so với khái niệm và trực giác), những kỹ thuật bạn muốn đưa vào.

Tôi thực sự khuyên bạn nên bắt đầu với sách và đọc nhiều hơn một cuốn sách .

" Thống kê phi thực tế " của Conover là tốt, và tôi chắc chắn sẽ nghiêng về bất kỳ danh sách nào.

" Thống kê không áp dụng " của Daniel là rất tốt, hợp lý toàn diện cho kích thước của nó.

Tôi thấy " Các bài kiểm tra không phân phối " của Neave và Worthington rất dễ đọc khi lần đầu tiên ra mắt (và theo nhiều cách nó vẫn còn). Ngày nay, mã trong đó có vẻ hơi lạc hậu, nhưng mặt khác, nó thường có thể đọc đủ để dịch. Nếu bạn có thể tìm thấy nó thì đó là một lời giới thiệu tốt; một thứ đáng giá để nhận đồ cũ nếu bạn không mua nó mới.

Có hàng tá những cuốn sách hay, một số cũ hơn ba cuốn tôi đã đề cập, một số mới hơn; một số có thể phù hợp với bạn tốt hơn bất kỳ tôi đã đề cập. Tôi sẽ bắt đầu với một thư viện đại học và duyệt qua các tìm kiếm với các cụm từ như trong các tiêu đề trên, và nếu có thể, hãy xem những gì gần đó.

Đọc qua một vài trong số họ và tìm thấy một số bạn thích.

Khi tôi học phi khoa như một sinh viên chưa tốt nghiệp, có một cái gì đó giống như tám cuốn sách trong bài đọc được đề nghị, có lẽ nhiều hơn nữa. Mỗi một người trong số họ đều có thứ mà hầu hết những người khác thiếu. Tôi vui vì tôi đã xem tất cả chúng.


4

Nếu lĩnh vực nghiên cứu của bạn thuộc về khoa học mềm (ví dụ: tâm lý học, xã hội học, giáo dục), tôi sẽ đề xuất Thống kê phi trắc nghiệm cho Khoa học hành vi của Siegel và Castellan (Công ty sách McGraw-Hill). (Tôi có phiên bản thứ hai từ năm 1988). Từ lời nói đầu:

Một tính năng đặc biệt [là] phác thảo từng bước ứng dụng của từng thủ tục vào dữ liệu thực tế.


2

Tôi tìm thấy "Hồi quy bán đảo" của Carroll, Wand et al. khá dễ đọc Nó đã lỗi thời, nhưng một điều tốt để bắt đầu trước khi chuyển sang cuốn sách ngắn gọn nhưng dày đặc của Simon Wood về GAMs.

Cả hai cuốn sách này đều tập trung vào các mô hình hồi quy spline bị phạt, không phải là tất cả mọi thứ trong các số liệu thống kê không theo tỷ lệ. Nhưng được cho là hữu ích nhất cho những người áp dụng.


1
20826: bằng cách giải thích, chỉ trong trường hợp bạn thấy câu trả lời này hơi khó hiểu - 'không đối xứng' không chỉ có thể đề cập đến hình thức chức năng không xác định (có khả năng vô hạn) cho phân phối (ví dụ: bạn không chỉ định một dạng tham số cho ), nhưng cũng cho mối quan hệ giữa các biến ( ). Câu trả lời của ACD ở đây đề cập đến điều thứ hai chứ không phải điều thứ nhất. Thực tế có thể áp dụng thuật ngữ 'không đối xứng' liên quan đến các mô hình hồi quy để áp dụng cho cả hai vấn đề hoặc thậm chí cả hai cùng một lúc (mà tôi có xu hướng gọi là 'không đối xứng'). FY(y)E(Y)=g(x)
Glen_b -Reinstate Monica

đúng. chỉ tò mò, một số ví dụ về các trường hợp trong công việc được áp dụng trong đó hình thức đầu tiên trong hai hình thức của công việc không tham số có thể hữu ích là gì? hoặc tôi đoán bootstrap sẽ là một ví dụ, phải không?
generic_user

1
ACD, tôi khuyên bạn nên xem bất kỳ cuốn sách nào được đề cập trong câu trả lời của tôi. Tôi có thể chỉ ra - hoàn toàn theo nghĩa đen - đối với hàng ngàn bài báo áp dụng chúng cho các vấn đề thực sự, bao gồm các xét nghiệm Wilcoxon-Mann-Whitney, mức độ tốt của các xét nghiệm phù hợp như Kolmogorov-Smirnov, các biện pháp tương quan như Kendall và Spearman, hồi quy Theil-Sen , Đường cong sinh tồn Kaplan-Meier (và kiểm tra thứ hạng log), hoán vị / ngẫu nhiên (+ phương pháp lấy mẫu khác) và nhiều thứ khác như vậy. Nhìn chung, tôi thực sự có thể được áp dụng thường xuyên hơn một chút so với ý nghĩa bạn sử dụng nó. Có, bootstrap được bao gồm.
Glen_b -Reinstate Monica

1
(ctd) ... diện tích khá lớn; Nếu bạn thu hẹp nó xuống một chút, tôi có thể tìm thấy cho bạn một số ứng dụng cụ thể.
Glen_b -Reinstate Monica

1
Phải, do đó, các xét nghiệm nói chung không dựa trên các giả định phân phối. Tôi đoán tôi tự hỏi liệu người ta có thể ước tính phân phối không theo tỷ lệ cho một mô hình cùng lúc với việc ước tính mối quan hệ giữa các biến (có thể có nhiều dữ liệu). Nhưng, như bạn chỉ ra, có rất nhiều thứ để đọc.
generic_user 16/03 '

2

Tôi đã rất ngạc nhiên khi không thấy Tất cả các số liệu thống kê không đối xứng của Larry Wasserman được đề cập.

Tôi nghĩ rằng nó là một cuốn sách tuyệt vời với kích thước ngắn gọn tương đối. Đặc biệt là nếu ai đó đã có một số nền tảng về Thống kê tham số, cuốn sách này cung cấp một cái nhìn rất mới về " phương pháp thống kê nhằm giữ cho số lượng các giả định cơ bản yếu nhất có thể ". Tôi thấy nó ít dài dòng hơn những cuốn sách giới thiệu / mồi khác; điều này có thể là tốt hay xấu tùy theo sở thích của một người. "Delta" duy nhất cuốn sách này có nó là nó không thực sự bao gồm các bài kiểm tra xếp hạng.


(+1) Dường như cuốn sách "Tất cả các số liệu thống kê" của Wasserman cũng chứa một số, mặc dù ngắn hơn, đối xử với các số liệu thống kê không tham số. Cả hai cuốn sách đó, cũng như nhiều cuốn khác, đều hay, nhưng IMHO quá mức cần thiết cho các nhà nghiên cứu / nhà khoa học ứng dụng ở một mức độ nào đó. Chắc chắn, sẽ không đau khi biết tất cả các định lý và bằng chứng, nhưng đó là "tốt để có" chứ không phải là "phải có", xem xét giới hạn thời gian và phạm vi. Tôi vẫn chưa tìm thấy các cuốn sách thống kê cân bằng cho các nhà khoa học ứng dụng (nghĩa là đủ nghiêm ngặt mà không đi sâu vào chi tiết cũng như hữu ích từ góc độ ứng dụng).
Alexanderr Blekh
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.