Có phải chúng ta đang phóng đại tầm quan trọng của giả định và đánh giá mô hình trong thời đại khi các phân tích thường được thực hiện bởi các giáo dân


54

Tóm lại , tôi càng tìm hiểu về thống kê, tôi càng ít tin tưởng các bài báo được xuất bản trong lĩnh vực của mình; Tôi chỉ đơn giản tin rằng các nhà nghiên cứu không làm đủ số liệu thống kê của họ.


Tôi là một giáo dân, có thể nói như vậy. Tôi được đào tạo về sinh học nhưng tôi không được giáo dục chính thức về thống kê hay toán học. Tôi thích R và thường nỗ lực để đọc (và hiểu ...) một số nền tảng lý thuyết của các phương pháp mà tôi áp dụng khi thực hiện nghiên cứu. Tôi sẽ không ngạc nhiên nếu phần lớn những người thực hiện phân tích ngày nay không thực sự được đào tạo. Tôi đã xuất bản khoảng 20 bài báo gốc, một số trong đó đã được các tạp chí và nhà thống kê công nhận thường xuyên tham gia vào quá trình xem xét. Các phân tích của tôi thường bao gồm phân tích sinh tồn, hồi quy tuyến tính, hồi quy logistic, mô hình hỗn hợp. Không bao giờ có một nhà phê bình hỏi về các giả định mô hình, phù hợp hoặc đánh giá.

Vì vậy, tôi không bao giờ thực sự bận tâm quá nhiều về các giả định mô hình, sự phù hợp và đánh giá. Tôi bắt đầu với một giả thuyết, thực hiện hồi quy và sau đó trình bày kết quả. Trong một số trường hợp, tôi đã nỗ lực để đánh giá những điều này, nhưng tôi luôn kết thúc với " nó cũng không hoàn thành tất cả các giả định, nhưng tôi tin tưởng vào kết quả (" kiến ​​thức chủ đề ") và chúng rất hợp lý, vì vậy nó vẫn ổn " và Khi tư vấn một nhà thống kê họ dường như luôn đồng ý.

Bây giờ, tôi đã nói chuyện với các nhà thống kê và phi thống kê khác (nhà hóa học, bác sĩ và nhà sinh học), những người thực hiện phân tích chính họ; Dường như mọi người không thực sự bận tâm quá nhiều về tất cả các giả định và đánh giá chính thức này. Nhưng ở đây trên CV, có rất nhiều người hỏi về số dư, mức độ phù hợp với mô hình, cách đánh giá nó, giá trị bản địa, vectơ và danh sách tiếp tục. Hãy để tôi nói theo cách này, khi lme4 cảnh báo về giá trị bản địa lớn, tôi thực sự nghi ngờ rằng nhiều người dùng của nó quan tâm để giải quyết rằng ...

Có đáng để nỗ lực thêm không? Có phải không có khả năng là phần lớn của tất cả các kết quả được công bố không tôn trọng các giả định này và có lẽ thậm chí không đánh giá chúng? Đây có lẽ là một vấn đề đang gia tăng vì cơ sở dữ liệu phát triển lớn hơn mỗi ngày và có một quan niệm rằng dữ liệu càng lớn thì càng ít quan trọng là các giả định và đánh giá.

Tôi có thể hoàn toàn sai, nhưng đây là cách tôi đã nhận thức được điều này.

Cập nhật: Trích dẫn mượn từ StasK (bên dưới): http://www.nature.com/news/science-joins-push-to-screen-statistic-in- con -.15509


34
Tôi muốn cảnh báo rằng việc đóng câu hỏi này sẽ tắt một cơ hội quan trọng để thảo luận về cách sử dụng số liệu thống kê trong "thế giới thực" bên ngoài bức tường của các bộ phận thống kê. CV là một trong số ít địa điểm là những người trong thế giới thực và các nhà thống kê hòa nhập, và giữ cho các đường dây liên lạc mở là một nhiệm vụ quan trọng, mặc dù là ẩn ý của CV. Tôi hoàn toàn đồng ý với những người bấm "đóng" vì điều này rất rộng và dựa trên quan điểm, nhưng tôi vẫn hy vọng chúng ta có thể tiếp tục cuộc thảo luận này.
StasK

5
Có phải thực tế là nhiều ấn phẩm, nhà nghiên cứu hoặc thậm chí toàn bộ lĩnh vực đối xử với các giả định tình cờ đề nghị chúng ta không quan tâm đúng mức ? Cũng có thể các nhà thống kê và sách giáo khoa phóng đại tầm quan trọng của họ nhưng chắc chắn sự phổ biến của họ với các học viên và giáo dân không thể là nền tảng cho điều đó. Ngoài ra các quy ước và tiêu chuẩn khác nhau khá nhiều. Một số ngành học có thể quan tâm nhiều hơn về vấn đề này so với những ngành bạn quen thuộc, trong khi những ngành khác có thể không quan tâm nhiều đến những điều rất quan trọng để được xuất bản trong lĩnh vực của bạn.
Gala

6
Đã viết một bài bình luận chỉ trích một nghiên cứu trước đây trong đó các giả định mô hình đã cố tình vi phạm và đưa ra kết luận không chính xác, lời khuyên của tôi là không nên tin vào kết quả và tự phê bình như bạn có thể.
Dikran Marsupial

7
"Dữ liệu càng lớn, các giả định càng ít quan trọng" không phù hợp với sự tăng trưởng thực tế của dữ liệu: Sự tăng trưởng là gì (chủ yếu) số lượng quan sát / tính năng phụ thuộc do những tiến bộ trong kỹ thuật đo lường. Ngược lại, số lượng các quan sát độc lập, tức là các đơn vị thử nghiệm hoặc các thiết bị thử nghiệm, vẫn còn khá hạn chế (vì dân số không tăng theo các tiến bộ kỹ thuật ...). Thật không may, chỉ có sự độc lập dữ liệu lớn mới làm cho các giả định (thường, không phải luôn luôn) ít quan trọng hơn do định lý giới hạn trung tâm.
Horst Grünbusch

3
@AdamRobinsson: Tôi thích kết luận bạn đã đăng ở đầu câu hỏi của bạn. Tôi thậm chí sẽ cảnh giác hơn với các bài báo được xuất bản bởi Big Name hoặc được hỗ trợ bởi các tổ chức lớn. Khi tôi nhìn thấy giấy tờ với 15 tác giả cấp cao của các tổ chức tôn trọng trên các tạp chí hàng đầu, bản năng đầu tiên của tôi là thực sự để nghiên cứu kỹ lưỡng giấy thậm chí nhiều hơn , bởi vì có một khả năng rằng giấy được công bố vì ảnh hưởng các tác giả '/ tổ chức'. Những giấy tờ này cũng có xu hướng có ý nghĩa chính sách sâu rộng. Một ví dụ từ lĩnh vực của tôi (sức khỏe cộng đồng) là cắt bao quy đầu ở nam giới cho các nghiên cứu phòng chống HIV (tt)
Hầu tước de Carabas

Câu trả lời:


26

Tôi được đào tạo như một nhà thống kê không phải là một nhà sinh học hay bác sĩ y khoa. Nhưng tôi làm khá nhiều nghiên cứu y học (làm việc với các nhà sinh học và bác sĩ y khoa), như một phần trong nghiên cứu của tôi, tôi đã học được khá nhiều về việc điều trị một số bệnh khác nhau. Điều này có nghĩa là nếu một người bạn hỏi tôi về một căn bệnh mà tôi đã nghiên cứu rằng tôi chỉ có thể viết cho họ một đơn thuốc cho một loại thuốc mà tôi biết thường được sử dụng cho căn bệnh đặc biệt đó? Nếu tôi làm điều này (tôi không), thì trong nhiều trường hợp có lẽ nó sẽ ổn (vì một bác sĩ y khoa sẽ chỉ kê cùng một loại thuốc), nhưng luôn có khả năng họ bị dị ứng / thuốc tương tác / khác mà một bác sĩ sẽ biết để hỏi về, rằng tôi không và cuối cùng gây ra nhiều tác hại hơn là tốt.

Nếu bạn đang làm thống kê mà không hiểu những gì bạn đang giả định và những gì có thể sai (hoặc tham khảo ý kiến ​​với một nhà thống kê trên đường sẽ tìm kiếm những điều này) thì bạn đang thực hành sai lầm thống kê. Hầu hết thời gian có thể sẽ ổn, nhưng còn về dịp mà một giả định quan trọng không giữ được, nhưng bạn chỉ cần bỏ qua nó?

Tôi làm việc với một số bác sĩ có khả năng thống kê hợp lý và có thể thực hiện nhiều phân tích của riêng họ, nhưng họ vẫn sẽ điều hành nó qua tôi. Thường thì tôi xác nhận rằng họ đã làm đúng và họ có thể tự phân tích (và họ thường biết ơn vì đã xác nhận) nhưng đôi khi họ sẽ làm một việc phức tạp hơn và khi tôi đề cập đến một cách tiếp cận tốt hơn họ thường sẽ chuyển phân tích cho tôi hoặc nhóm của tôi, hoặc ít nhất mang lại cho tôi một vai trò tích cực hơn.

Vì vậy, câu trả lời của tôi cho câu hỏi tiêu đề của bạn là "Không", chúng tôi không phóng đại, thay vào đó chúng tôi nên nhấn mạnh một số điều nữa để giáo dân sẽ có ít nhất kiểm tra lại các thủ tục / kết quả của họ với một thống kê.

Biên tập

Đây là một bổ sung dựa trên nhận xét của Adam bên dưới (sẽ hơi lâu cho một nhận xét khác).

Adam, Cảm ơn bình luận của bạn. Câu trả lời ngắn gọn là "Tôi không biết". Tôi nghĩ rằng tiến bộ đang được thực hiện trong việc cải thiện chất lượng thống kê của các bài báo, nhưng mọi thứ đã diễn ra quá nhanh theo nhiều cách khác nhau mà sẽ mất một thời gian để bắt kịp và đảm bảo chất lượng. Một phần của giải pháp là tập trung vào các giả định và hậu quả của các vi phạm trong các khóa học thống kê giới thiệu. Điều này có nhiều khả năng xảy ra khi các lớp học được dạy bởi các nhà thống kê, nhưng cần phải xảy ra trong tất cả các lớp.

Một số tạp chí đang làm tốt hơn, nhưng tôi muốn thấy một nhà phê bình thống kê cụ thể trở thành tiêu chuẩn. Có một bài báo cách đây vài năm (xin lỗi không có tài liệu tham khảo hữu ích, nhưng trong JAMA hoặc Tạp chí Y học New England) cho thấy xác suất xuất bản cao hơn (mặc dù không phải là một sự khác biệt lớn như nó nên được) trong JAMA hoặc NEJM nếu một nhà sinh học hoặc nhà dịch tễ học là một trong những đồng tác giả.

Một bài viết thú vị xuất hiện gần đây là: http://www.nature.com/news/statistic-p-values-are-just-the-tip-of-the-iceberg-1.17412 trong đó thảo luận về một số vấn đề tương tự.


1
Tôi chia sẻ quan điểm của bạn, Greg. Tôi nghĩ rằng câu trả lời của bạn giải thích nó rõ ràng. Nhưng tôi muốn trích dẫn bạn: "[...] sau đó bạn đang thực hành sai sót thống kê. Hầu hết thời gian có thể sẽ ổn". Có một rủi ro là khái niệm này đang lan rộng và mọi người nhận thức nó là: bất kỳ ai cũng có thể làm thống kê (điều này về cơ bản là sai nếu bạn hỏi tôi, người đã cào một chút trên bề mặt thống kê). Câu hỏi là, làm thế nào để chúng tôi đảm bảo rằng công việc được công bố là chính xác về mặt phân tích thống kê? Bởi vì tôi bắt đầu tự hỏi có bao nhiêu bài báo ngoài kia không vượt qua được một thống kê ...
Adam Robinsson

@AdamRobinsson, xem phần bổ sung của tôi ở trên.
Greg Snow

Đây là khá tinh hoa. Tôi đồng ý rằng các nhà thống kê chuyên nghiệp có thể có năng lực và chuyên môn để thực hiện các phân tích thống kê, nhưng các nhà khoa học cũng vậy. Thật vậy, một số tiến bộ đột phá trong thống kê đến từ các nhà khoa học (ví dụ: Fisher & Jeffrey) thực hành thống kê trong thế giới thực.
innisfree

Thật kỳ lạ khi nói rằng những gì cấu thành sai lầm thống kê không chỉ phụ thuộc vào chất lượng hoặc kết quả của phân tích thống kê mà còn dựa trên những đánh giá chủ quan về sức mạnh của các nhà phân tích hiểu về thống kê
innisfree

@innisfree, tôi không hiểu ý kiến ​​của bạn, hoặc có thể bạn không hiểu vị trí của tôi. Tôi không nói rằng chỉ có các nhà thống kê mới có thể xem xét các giả định / điều kiện, chỉ là chúng quan trọng và một nhà thống kê nên được tư vấn, hoặc (các) nhà khoa học không thống kê nên học đủ số liệu thống kê để hiểu các vấn đề ngoài việc chỉ cắm các con số vào một công thức / máy tính. Cá nhân tôi muốn thấy nhiều trẻ vị thành niên thống kê có chuyên môn về y học / kỹ thuật / v.v., nhưng cũng hiểu rõ hơn về các ý tưởng đằng sau thống kê.
Greg Snow

28

Vâng, vâng, các giả định có vấn đề - nếu chúng không quan trọng, chúng ta sẽ không cần phải làm chúng, phải không?

Câu hỏi đặt ra là chúng quan trọng đến mức nào - điều này khác nhau giữa các thủ tục và giả định và những gì bạn muốn yêu cầu về kết quả của bạn (và cả mức độ chấp nhận của đối tượng của bạn là gần đúng - thậm chí không chính xác - trong các khiếu nại như vậy).

Vì vậy, đối với một ví dụ về tình huống trong đó một giả định là quan trọng, hãy xem xét giả định về tính quy tắc trong phép thử F của phương sai; ngay cả những thay đổi khá khiêm tốn trong phân phối có thể có tác động khá lớn đến các tính chất (mức ý nghĩa thực tế và sức mạnh) của thủ tục. Nếu bạn cho rằng bạn đang thực hiện một bài kiểm tra ở mức 5% khi nó thực sự ở mức 28%, thì bạn hoàn toàn có thể làm điều tương tự như nói dối về cách bạn tiến hành thí nghiệm. Nếu bạn không nghĩ những vấn đề thống kê như vậy là quan trọng, hãy đưa ra những lập luận không dựa vào chúng. Mặt khác, nếu bạn muốn sử dụng thông tin thống kê làm hỗ trợ, bạn không thể trình bày sai về hỗ trợ đó.

Trong các trường hợp khác, các giả định cụ thể có thể ít quan trọng hơn nhiều. Nếu bạn đang ước tính hệ số theo hồi quy tuyến tính và bạn không quan tâm nếu nó có ý nghĩa thống kê và bạn không quan tâm đến hiệu quả, thì điều đó không nhất thiết nếu giả định homoskedasticity giữ vững. Nhưng nếu bạn muốn nói nó có ý nghĩa thống kê, hoặc hiển thị khoảng tin cậy, vâng, điều đó chắc chắn có thể quan trọng.


2
Nhận xét của Glen_b được nói rõ từ cách tiếp cận thống kê đến tầm quan trọng của các giả định. Tuy nhiên, tôi nghĩ cũng cần lưu ý rằng vì mục đích xuất bản, việc kiểm tra các giả định là một vấn đề hơi khác, trong đó việc vi phạm các giả định chỉ quan trọng như các nhà phê bình hoặc biên tập viên quan tâm đến chúng. Như một ví dụ, lý thuyết đằng sau kết quả này có thể cung cấp đủ công đức cho xuất bản, trong đó hy vọng là các vấn đề với phân tích có thể được giải quyết bằng các ấn phẩm trong tương lai.
Jonathan Lisic

Vâng, ngay cả khi các nhà phê bình kiểm tra giấy, trách nhiệm với lỗi vẫn thuộc về các tác giả. Vì vậy, vì lợi ích riêng, bạn nên kiểm tra ...
kjetil b halvorsen

Thật vậy, trách nhiệm sẽ luôn ở lại với các tác giả. Nhưng các tác giả ngày nay bị thúc đẩy bởi các trình điều khiển không phù hợp buộc họ phải xuất bản, không hiếm khi một cách nhanh chóng và bẩn thỉu. Tôi muốn thấy một quy trình xem xét bắt buộc phải khai báo các giả định thống kê quan trọng nhất. Ngày nay, người ta tin rằng phân tích thống kê đã được thực hiện theo cuốn sách, nhưng tôi tin rằng nó hiếm hơn phổ biến.
Adam Robinsson

3
+1 "Câu hỏi là chúng quan trọng đến mức nào" - điều đó về cơ bản đặt toàn bộ vấn đề một cách ngắn gọn. Tôi cũng nên chỉ ra rằng trong việc áp dụng suy luận thống kê, không thể biết mức độ mà các giả định thống kê nhất định bị vi phạm. Chúng tôi chỉ có thể định nghĩa hoặc xem xét tính mạnh mẽ của phân tích nếu có, và đây là khía cạnh thiết yếu nhưng thường bị bỏ qua của thực tiễn thống kê.
heropup

18

Trong khi Glen_b đưa ra một câu trả lời tuyệt vời , tôi muốn thêm một vài xu vào đó.

Một điều cần cân nhắc là liệu bạn có thực sự muốn có được sự thật khoa học hay không, điều này đòi hỏi phải đánh bóng kết quả của bạn và tìm ra tất cả các chi tiết về cách tiếp cận của bạn có thể phòng thủ được hay không, so với việc xuất bản trong "à, không ai kiểm tra các giá trị bản địa này trong môn học của tôi" chế độ. Nói cách khác, bạn phải hỏi lương tâm nghề nghiệp bên trong của bạn xem bạn có đang làm công việc tốt nhất có thể không. Đề cập đến kiến ​​thức thống kê thấp và thực hành thống kê lỏng lẻo trong ngành học của bạn không đưa ra một lập luận thuyết phục. Những người đánh giá thường có ích một nửa tốt nhất nếu họ đến từ cùng một chuyên ngành với các tiêu chuẩn lỏng lẻo này, mặc dù một số cửa hàng hàng đầu có những sáng kiến ​​rõ ràng để đưa chuyên môn thống kê vào quá trình đánh giá.

Nhưng ngay cả khi bạn là một người cắt lát salami "xuất bản hoặc hư hỏng", sự cân nhắc khác về cơ bản là sự an toàn cho danh tiếng nghiên cứu của bạn. Nếu mô hình của bạn thất bại và bạn không biết điều đó, bạn sẽ phải đối mặt với nguy cơ bị từ chối bởi những người có thể đến và lái rìu vào vết nứt của kiểm tra mô hình bằng các dụng cụ tinh tế hơn. Cấp, khả năng đó dường như là thấp, vì cộng đồng khoa học, mặc dù các yêu cầu triết học danh nghĩa về uy tín và khả năng tái sản xuất, hiếm khi tham gia vào nỗ lực tái tạo nghiên cứu của người khác. (Tôi đã tham gia viết một vài bài về cơ bản bắt đầu bằng "ôi Chúa ơi, họ có thực sựviết cái đó? ", và đưa ra một lời phê bình và sàng lọc một cách tiếp cận bán thống kê được công bố ngang hàng.) Tuy nhiên, những thất bại của các phân tích thống kê, khi được đưa ra , thường tạo ra những vụ nổ lớn và khó chịu.


Tôi thực sự thích cách tiếp cận: lương tâm nghề nghiệp, và tôi tin rằng nhiều người có lương tâm nhưng vẫn thiếu kiến ​​thức; nhưng nó sẽ không ngăn họ trình bày dữ liệu như thể nó đã được thực hiện một cách hoàn hảo. Thật thú vị, bạn đang trích dẫn một bài báo Khoa học đánh vần rõ ràng: "[...] mối quan tâm rộng rãi rằng những sai lầm cơ bản trong phân tích dữ liệu đang góp phần vào sự không thể thực hiện được của nhiều kết quả nghiên cứu được công bố." Tôi thực sự nghĩ rằng chúng ta là giáo dân, chúng ta không thực sự tôn trọng sự khó khăn của các phương pháp thống kê và nó sẽ là một vấn đề ngày càng tăng như đã giải thích ở trên.
Adam Robinsson

1
Trong nhóm nghiên cứu hiện tại của tôi, chúng tôi là 15 nhà nghiên cứu (nhà sinh học, bác sĩ) và một số trong số họ thực sự có năng suất nhưng không ai là nhà thống kê. Tất cả các nhà nghiên cứu cơ sở đã cài đặt R hoặc SAS và thực hiện các tính toán, thường là sau khi đọc chỉ một vài hướng dẫn trên Internet. Đây là một vấn đề lớn.
Adam Robinsson

4
@AdamRobinsson, thực tế mà bạn hỏi về điều này trên CV có nói lên lương tâm của bạn. Thêm một liên kết Tự nhiên để bạn xem xét, về một vấn đề hơi liên quan đến điện toán khoa học (và thiếu triển khai các thực tiễn tốt nhất trong phát triển phần mềm do các nhà khoa học viết mã C / Fortran / R của riêng họ) - Nature.com/news/2010 / 101013/full/467775a.html .
StasK

3
với tư cách là cộng đồng khoa học, mặc dù các yêu cầu triết học danh nghĩa về uy tín và khả năng tái sản xuất, hiếm khi tham gia vào nỗ lực tái tạo nghiên cứu của người khác, tôi hoàn toàn đồng ý với tuyên bố đó.
Robert Smith

software-carpentry.org , "một tổ chức phi lợi nhuận tình nguyện chuyên giảng dạy các kỹ năng tính toán cơ bản cho các nhà nghiên cứu", có các hướng dẫn và hội thảo khá tốt.
denis

9

Bản chất của vi phạm các giả định có thể là một đầu mối quan trọng cho nghiên cứu trong tương lai. Ví dụ, việc vi phạm giả định về các mối nguy theo tỷ lệ trong phân tích tỷ lệ sống của Cox có thể là do một biến có ảnh hưởng lớn đến sự tồn tại ngắn hạn nhưng ít ảnh hưởng trong dài hạn. Đó là loại thông tin bất ngờ nhưng có khả năng quan trọng mà bạn có thể nhận được bằng cách kiểm tra tính hợp lệ của các giả định của bạn trong một bài kiểm tra thống kê.

Vì vậy, bạn tự làm, không chỉ là tài liệu, một dịch vụ tiềm năng nếu bạn không kiểm tra các giả định cơ bản. Khi các tạp chí chất lượng cao bắt đầu yêu cầu đánh giá thống kê tinh vi hơn, bạn sẽ thấy mình được gọi thường xuyên hơn để làm như vậy. Bạn không muốn ở trong một vị trí mà một bài kiểm tra theo yêu cầu của người đánh giá thống kê làm suy yếu những gì bạn nghĩ là điểm chính của bài báo của bạn.


Tôi hoàn toàn đồng ý với nhận xét này, điều mà tôi nghĩ là rất quan trọng.
Adam Robinsson

9

Tôi sẽ trả lời từ góc độ trung gian. Tôi không phải là một nhà thống kê, tôi là nhà hóa học. Tuy nhiên, tôi đã dành 10 năm qua chuyên về hóa học = phân tích dữ liệu thống kê cho dữ liệu liên quan đến hóa học.

Tôi chỉ đơn giản tin rằng các nhà nghiên cứu không làm đủ số liệu thống kê của họ.

Đó có lẽ là trường hợp.


Phiên bản ngắn:

Bây giờ về các giả định. IMHO tình hình ở đây là quá không đồng nhất để giải quyết nó trong một tuyên bố. Hiểu về cả hai chính xác giả định là cần thiết và theo cách nào có khả năng bị vi phạm bởi ứng dụng là cần thiết để đánh giá liệu vi phạm là vô hại hay nghiêm trọng. Và điều này cần cả số liệu thống kê cũng như kiến ​​thức ứng dụng.
Tuy nhiên, với tư cách là một học viên phải đối mặt với những giả định không thể giải quyết được, tôi cũng cần một thứ khác: tôi muốn có một "tuyến phòng thủ thứ 2", ví dụ như cho phép tôi đánh giá liệu vi phạm có thực sự gây rắc rối hay không.


Phiên bản dài:

  • Từ quan điểm thực tế, một số giả định điển hình gần như không bao giờ được đáp ứng. Đôi khi tôi có thể hình thành các giả định hợp lý về dữ liệu, nhưng thường thì các vấn đề trở nên quá phức tạp theo quan điểm thống kê rằng các giải pháp chưa được biết đến. Đến bây giờ tôi tin rằng làm khoa học có nghĩa là bạn sẽ đạt được biên giới của những gì được biết đến không chỉ trong ngành học cụ thể của bạn mà còn có thể trong các ngành khác (ở đây: thống kê áp dụng).

  • Có những tình huống khác mà các vi phạm nhất định thường là vô hại - ví dụ: tính quy tắc đa biến với hiệp phương sai cho LDA là cần thiết để chỉ ra rằng LDA là tối ưu, nhưng người ta biết rằng phép chiếu theo phương pháp heuristic thường thực hiện tốt nếu giả định không được đáp ứng. Và những vi phạm nào có khả năng gây rắc rối: Người ta cũng biết rằng những cái đuôi nặng nề trong phân phối dẫn đến các vấn đề với LDA trong thực tế.
    Thật không may, kiến ​​thức như vậy hiếm khi đưa nó vào văn bản cô đọng, vì vậy người đọc không biết liệu các tác giả có quyết định cho mô hình của họ hay không sau khi xem xét các tính chất của ứng dụng cũng như của mô hình hoặc liệu họ có chọn bất kỳ mô hình nào không họ đã đi qua

  • Đôi khi các cách tiếp cận thực tế (heuristic) phát triển hóa ra lại rất hữu ích theo quan điểm thực tế, ngay cả khi phải mất hàng thập kỷ cho đến khi các đặc tính thống kê của chúng được hiểu (tôi đang nghĩ về PLS).

  • Một điều khác xảy ra (và nên xảy ra nhiều hơn) là các hậu quả có thể xảy ra của vi phạm có thể được theo dõi (đo lường), cho phép quyết định xem có vấn đề gì hay không. Đối với ứng dụng, có lẽ tôi không quan tâm liệu mô hình của mình có tối ưu hay không miễn là nó đủ tốt.
    Trong hóa học, chúng tôi tập trung khá mạnh vào dự đoán. Và điều này cung cấp một lối thoát rất hay trong trường hợp các giả định mô hình không được đáp ứng: bất kể các giả định đó, chúng ta có thể đo xem mô hình có hoạt động tốt hay không. Từ quan điểm của một người thực hành, tôi muốn nói rằng bạn được phép làm bất cứ điều gì bạn thích trong quá trình làm mẫu nếu bạn làm và báo cáo một xác nhận hiện đại trung thực.
    Để phân tích hóa học dữ liệu quang phổ, chúng ta tại một điểm mà chúng ta không nhìn vào phần dư vì chúng ta biết rằng các mô hình rất dễ phù hợp. Thay vào đó, chúng tôi xem xét hiệu suất dữ liệu thử nghiệm (và có thể là sự khác biệt để đào tạo hiệu suất dự đoán dữ liệu).

  • Có những tình huống khác trong khi chúng ta không thể dự đoán chính xác mức độ vi phạm của giả định nào dẫn đến sự cố mô hình, nhưng chúng ta có thể đo lường hậu quả của việc vi phạm nghiêm trọng giả định thay vì trực tiếp.
    Ví dụ tiếp theo: dữ liệu nghiên cứu mà tôi thường xử lý là các đơn đặt hàng có độ lớn dưới kích thước mẫu mà quy tắc thống kê khuyến nghị cho các trường hợp trên mỗi phương sai (để đảm bảo ước tính ổn định). Nhưng các sách thống kê thường không quan tâm nhiều đến những việc cần làm trong thực tế nếu giả định này không thể được đáp ứng. Cũng không làm thế nào để đo lường nếu bạn thực sự gặp rắc rối về mặt này. Nhưng: những câu hỏi như vậy được xử lý trong các ngành áp dụng nhiều hơn. Hóa ra, thường khá dễ dàng để đo trực tiếp độ ổn định của mô hình hoặc ít nhất là liệu dự đoán của bạn có không ổn định hay không (đọc ở đây trên CV về xác thực lại mẫu và độ ổn định của mô hình). Và có nhiều cách để ổn định các mô hình không ổn định (ví dụ như đóng bao).

  • Như một ví dụ về "tuyến phòng thủ thứ 2", hãy xem xét xác nhận lại mô hình. Giả định thông thường và mạnh nhất là tất cả các mô hình thay thế đều tương đương với một mô hình được đào tạo trên toàn bộ tập dữ liệu. Nếu giả định này bị vi phạm, chúng ta sẽ có sự thiên vị bi quan nổi tiếng. Dòng thứ 2 là ít nhất các mô hình thay thế tương đương với nhau, vì vậy chúng ta có thể gộp các kết quả kiểm tra.


Cuối cùng nhưng không kém phần quan trọng, tôi muốn khuyến khích các "nhà khoa học khách hàng" và các nhà thống kê nói chuyện với nhau nhiều hơn . Phân tích dữ liệu thống kê IMHO không phải là thứ có thể được thực hiện theo cách một chiều. Tại một số điểm, mỗi bên sẽ cần có được một số kiến ​​thức về phía bên kia. Đôi khi tôi giúp "dịch" giữa các nhà thống kê, nhà hóa học và nhà sinh học. Một nhà thống kê có thể biết rằng mô hình cần chính quy. Nhưng để chọn, giả sử, giữa LASSO và một sườn núi, họ cần biết các thuộc tính của dữ liệu mà chỉ nhà hóa học, vật lý học hoặc nhà sinh học mới có thể biết.


6

Cho rằng CV được các nhà thống kê và những người tò mò, nếu không có thẩm quyền, về thống kê, tôi không ngạc nhiên về tất cả các câu trả lời nhấn mạnh sự cần thiết phải hiểu các giả định. Tôi cũng đồng ý với những câu trả lời về nguyên tắc.

Tuy nhiên, khi tính đến áp lực phải công bố và tiêu chuẩn thấp về tính toàn vẹn thống kê hiện nay, tôi phải nói rằng những câu trả lời này khá ngây thơ. Chúng tôi có thể nói với mọi người những gì họ nên làm cả ngày (ví dụ: kiểm tra giả định của bạn), nhưng những gì họ sẽ làm chỉ phụ thuộc vào các ưu đãi của tổ chức. Bản thân OP tuyên bố rằng ông quản lý để xuất bản 20 bài báo mà không hiểu giả định của mô hình. Với kinh nghiệm của riêng tôi, tôi không thấy khó tin.

Vì vậy, tôi muốn đóng vai người ủng hộ của quỷ, trực tiếp trả lời câu hỏi của OP. Đây không phải là một câu trả lời thúc đẩy "thực hành tốt", nhưng nó là một câu trả lời phản ánh cách mọi thứ được thực hành với một gợi ý châm biếm.

Có đáng để nỗ lực thêm không?

Không, nếu mục tiêu là xuất bản, sẽ không đáng để dành toàn bộ thời gian để hiểu mô hình. Chỉ cần làm theo mô hình phổ biến trong các tài liệu. Bằng cách đó, 1) bài viết của bạn sẽ vượt qua các đánh giá dễ dàng hơn và 2) nguy cơ bị lộ vì "không đủ năng lực thống kê" là nhỏ, bởi vì phơi bày bạn có nghĩa là phơi bày toàn bộ lĩnh vực, bao gồm nhiều người cao cấp.

Có phải không có khả năng là phần lớn của tất cả các kết quả được công bố không tôn trọng các giả định này và có lẽ thậm chí không đánh giá chúng? Đây có lẽ là một vấn đề đang gia tăng vì cơ sở dữ liệu phát triển lớn hơn mỗi ngày và có một quan niệm rằng dữ liệu càng lớn thì càng ít quan trọng là các giả định và đánh giá.

Có, có vẻ như hầu hết các kết quả được công bố là không đúng sự thật. Càng tham gia nhiều vào nghiên cứu thực tế, tôi càng nghĩ nó có khả năng.


1
Tôi nghĩ rằng bạn có một số điểm rất tốt mà không được đề cập ở trên; cụ thể là áp lực xuất bản và áp lực tạp chí để tìm bài báo để điền vào tạp chí. Đó là một cơn ác mộng đối với các biên tập viên khi không có bài báo để xuất bản và các nhà nghiên cứu phải xuất bản cho sự tồn tại đơn thuần của họ. Tuy nhiên, từ quan điểm phương pháp luận, tôi càng tham gia vào nghiên cứu, tôi càng tin rằng hầu hết các phát hiện được công bố là sai / ít đúng / không hoàn hảo ở một mức độ khác nhau (từ quan điểm thống kê).
Adam Robinsson

4

Câu trả lời ngắn gọn là không." Phương pháp thống kê được phát triển theo các giả định cần được đáp ứng để kết quả có giá trị. Do đó, lý do là nếu các giả định không được đáp ứng, kết quả có thể không hợp lệ. Tất nhiên, một số ước tính vẫn có thể mạnh mẽ mặc dù vi phạm các giả định mô hình. Ví dụ, logit đa phương dường như hoạt động tốt mặc dù vi phạm giả định IIA (xem luận án [2011] của Kropko trong tài liệu tham khảo bên dưới).

Là nhà khoa học, chúng tôi có nghĩa vụ đảm bảo rằng kết quả chúng tôi đưa ra là hợp lệ, ngay cả khi những người trong lĩnh vực này không quan tâm liệu các giả định đã được đáp ứng hay chưa. Điều này là do khoa học được xây dựng dựa trên giả định rằng các nhà khoa học sẽ làm mọi thứ đúng cách trong quá trình theo đuổi sự thật. Chúng tôi tin tưởng các đồng nghiệp của mình để kiểm tra công việc của họ trước khi gửi nó đến các tạp chí. Chúng tôi tin tưởng các trọng tài sẽ rà soát một bản thảo trước khi nó được xuất bản. Chúng tôi giả sửrằng cả các nhà nghiên cứu và các trọng tài đều biết những gì họ đang làm, do đó, kết quả trong các bài báo được công bố trên các tạp chí đánh giá ngang hàng có thể được tin cậy. Chúng tôi biết điều này không phải lúc nào cũng đúng trong thế giới thực dựa trên số lượng bài báo khổng lồ trong tài liệu mà cuối cùng bạn lắc đầu và đảo mắt trước kết quả rõ ràng là anh đào trong các tạp chí đáng kính (" Jama đã xuất bản bài báo này ?! ").

Vì vậy, không, tầm quan trọng không thể được phóng đại, đặc biệt là khi mọi người tin tưởng bạn - chuyên gia - đã thực hiện sự siêng năng của bạn. Ít nhất bạn có thể làm là nói về những vi phạm này trong phần "giới hạn" trong bài viết của bạn để giúp mọi người giải thích tính hợp lệ của kết quả của bạn.

Tài liệu tham khảo

Kropko, J. 2011. Phương pháp tiếp cận mới đối với sự lựa chọn rời rạc và phương pháp cắt ngang theo chuỗi thời gian cho nghiên cứu chính trị (luận văn). UNC-Đồi Chapel, Đồi Chapel, NC.


Tôi đồng ý với những ý kiến ​​có giá trị. Nhưng đừng nghĩ rằng "có thể" trong "có thể không hợp lệ" là lý do mà mọi người có thể không bận tâm quá nhiều về họ. Tôi tin rằng sự tồn tại đơn thuần của một giả thuyết có thể gây ra sai lệch phân tích có liên quan đến vấn đề này.
Adam Robinsson

TIL Kropko là một người dùng CV.
Phục hồi

@AdamRobinsson, tôi nghĩ mọi người không bận tâm đến họ vì họ không hiểu đầy đủ về cách thức hoặc lý do tại sao kết quả có thể không hợp lệ. Một phần lớn của vấn đề nằm ở giáo dục thống kê trong một lĩnh vực "ứng dụng". Đào tạo của riêng tôi là trong một lĩnh vực ứng dụng. Các lớp học kinh tế lượng kinh tế học của tôi không giả vờ về việc các lớp kinh tế lượng đầy đủ và được gọi là "phương pháp nghiên cứu tiên tiến" hoặc đại loại như thế. Bởi vì không có điều kiện tiên quyết thống kê, các giáo sư sẽ che đậy các giả định của mô hình để ủng hộ việc dành nhiều thời gian hơn cho các lệnh Stata và giải thích kết quả.
Hầu tước de Carabas

@AdamRobinsson, Lần đầu tiên tôi tham gia chương trình sau đại học, nó cũng dành cho một lĩnh vực ứng dụng, nhưng các lớp học được giảng dạy bởi các nhà sinh học. Các nhà sinh học đã dạy sâu về các giả định mô hình và các kiểm tra khác nhau mà chúng tôi phải làm, bởi vì một số sinh viên trong lớp là sinh viên thống kê sinh học. Tuy nhiên, rõ ràng là những học sinh còn lại trong các lớp này không hiểu tại sao chúng tôi kiểm tra những giả định đó, bởi vì các giáo sư không truyền đạt tầm quan trọng trong ngôn ngữ mà các sinh viên hiểu.
Hầu tước de Carabas

1
@marquisdecarabas, đã đồng ý. Không hiểu họ là một vấn đề cơ bản, rõ ràng. Tuy nhiên, đôi khi tôi tự hỏi liệu đó có phải là do lượng thời gian khổng lồ dành cho thao tác dữ liệu hay không, điều đó rút cạn những ham muốn để đảm nhận các giả định.
Adam Robinsson

2

Nếu bạn cần số liệu thống kê rất tiên tiến thì rất có thể là do dữ liệu của bạn là một mớ hỗn độn, đó là trường hợp của hầu hết các ngành khoa học xã hội, không đề cập đến tâm lý học. Trong những lĩnh vực mà bạn có dữ liệu tốt, bạn cần rất ít số liệu thống kê. Vật lý là một ví dụ rất tốt.

Hãy xem xét câu nói này của Galileo về thí nghiệm gia tốc hấp dẫn nổi tiếng của ông:

Một mảnh đúc hoặc scantling bằng gỗ, dài khoảng 12 khối, rộng một nửa khối và dày ba ngón tay, đã được lấy; trên cạnh của nó đã bị cắt một kênh nhiều hơn một ngón tay theo chiều rộng; đã làm cho rãnh này rất thẳng, mịn và được đánh bóng, và được lót bằng giấy da, cũng mịn và bóng nhất có thể, chúng tôi lăn dọc theo nó một quả bóng đồng cứng, mịn và rất tròn. Khi đặt tấm ván này ở vị trí dốc, bằng cách nâng một đầu một hoặc hai khối lên trên đầu kia, chúng tôi lăn quả bóng, như tôi vừa nói, dọc theo kênh, lưu ý, theo cách hiện tại được mô tả, thời gian cần thiết để làm cho hậu duệ. Chúng tôi đã lặp lại thí nghiệm này hơn một lần để đo thời gian với độ chính xác sao cho độ lệch giữa hai lần quan sát không bao giờ vượt quá một phần mười nhịp đập. Đã thực hiện thao tác này và tự đảm bảo độ tin cậy của nó, giờ đây chúng tôi đã lăn quả bóng chỉ bằng một phần tư chiều dài của kênh; và khi đo thời gian gốc của nó, chúng tôi thấy nó chính xác bằng một nửa so với trước đây. Tiếp theo, chúng tôi đã thử các khoảng cách khác, so sánh thời gian cho toàn bộ chiều dài với một nửa hoặc với khoảng cách đó cho hai phần ba, hoặc ba phần tư, hoặc thực sự cho bất kỳ phân số nào; trong các thí nghiệm như vậy, lặp đi lặp lại cả trăm lần, chúng tôi luôn thấy rằng các không gian đi qua nhau là bình phương của thời đại, và điều này đúng với mọi khuynh hướng của mặt phẳng, tức là của kênh, dọc theo đó chúng tôi lăn trái bóng. Chúng tôi cũng quan sát thấy rằng thời gian hạ xuống, đối với các độ nghiêng khác nhau của mặt phẳng, mang lại cho nhau chính xác tỷ lệ đó, như chúng ta sẽ thấy sau này,

Để đo thời gian, chúng tôi sử dụng một bình nước lớn đặt ở vị trí cao; dưới đáy của con tàu này được hàn một ống có đường kính nhỏ tạo ra một tia nước mỏng mà chúng tôi thu được trong một chiếc cốc nhỏ trong suốt thời gian của mỗi lần hạ xuống, cho dù là toàn bộ chiều dài của kênh hay cho một phần chiều dài của nó; Do đó, nước được thu thập được cân, sau mỗi lần hạ xuống, trên một sự cân bằng rất chính xác; sự khác biệt và tỷ lệ của các trọng số này đã cho chúng tôi sự khác biệt và tỷ lệ của thời đại, và điều này với độ chính xác đến mức mặc dù hoạt động được lặp lại nhiều lần, nhiều lần, không có sự khác biệt đáng kể nào trong kết quả .

Lưu ý các văn bản được tô sáng bởi tôi. Đây là những gì dữ liệu tốt. Nó xuất phát từ một thí nghiệm được lên kế hoạch tốt dựa trên một lý thuyết tốt. Bạn không cần số liệu thống kê để trích xuất những gì bạn quan tâm. Không có số liệu thống kê tại thời điểm đó, cũng không có máy tính. Kết quả? Một mối quan hệ khá cơ bản, vẫn còn giữ, và có thể được kiểm tra tại nhà bởi một học sinh lớp 6.

Tôi đã đánh cắp các trích dẫn từ trang tuyệt vời này .

CẬP NHẬT: Để nhận xét @Silverfish, đây là một ví dụ về thống kê trong vật lý hạt thực nghiệm. Khá cơ bản hả? Không quá trình độ MBA. Lưu ý, cách họ yêu :) Hãy xem, các nhà thống kê!χ2


2
"Trong những lĩnh vực mà bạn có dữ liệu tốt, bạn cần rất ít số liệu thống kê. Vật lý là một ví dụ rất hay." Tôi có thể thấy vấn đề, nhưng đáng để chỉ ra rằng các nhà vật lý hạt có cả dữ liệu phong phú và đã phát triển một loạt các kỹ thuật thống kê tiên tiến để phân tích chúng.
Cá bạc

@Silverfish, bạn có thể cho tôi ví dụ về số liệu thống kê nâng cao ở đó không? Những gì tôi đã thấy không gây ấn tượng với tôi nhiều. Theo tôi, một sinh viên tiến sĩ econ trung bình sẽ biết nhiều chỉ số hơn nhà vật lý hạt đẳng cấp thế giới, theo ý kiến ​​của tôi. Những gì các nhà vật lý thực sự giỏi là những thứ như cơ học thống kê, nhưng điều đó rất khác so với những gì chúng ta gọi là "số liệu thống kê nâng cao". Tôi hoàn toàn đồng ý với bạn rằng các bộ dữ liệu của họ rất khó chịu, họ đã bắt đầu dữ liệu lớn trước khi "dữ liệu lớn" trở thành một từ gây phiền nhiễu.
Aksakal

1
Họ có một khoảng thời gian khá thú vị về "khoảng tin cậy" đặc biệt đối với các tham số không thể âm, xem ví dụ en.wikipedia.org/wiki/CLs_upper_limits_%28particle_physics%29
Silverfish

(Tôi nghĩ rằng có thể không công bằng khi lấy Ngày 1 của khóa học giới thiệu làm đại diện cho tất cả các chỉ số bạn cần để trở thành nhà vật lý hạt!)
Silverfish

@Aksakal, sự hiểu biết cá nhân của tôi là các phương pháp Bayes làm nên điều kỳ diệu khi có ít sự không chắc chắn về mô hình, tức là khoa học cứng trong đó các mô hình là bất cứ phương trình Schrodinger nào mang lại cho bạn, sau khi tích hợp 5.000 chiều. Trong kinh tế học, cách tiếp cận Bayes sẽ khó tồn tại với sự tập trung của các nhà nghiên cứu thực nghiệm vào suy luận mạnh mẽ đối với các lỗi chính tả mô hình chính tiềm năng. (Tôi là một nhà vật lý bằng đại học, mặc dù đã không thực hiện bất kỳ vật lý nào trong hơn 20 năm qua và là một nhà khoa học xã hội định lượng theo dòng công việc hiện nay.)
StasK

2

Câu hỏi này dường như là một trường hợp toàn vẹn chuyên nghiệp.

Vấn đề dường như là: (a) không đủ đánh giá quan trọng về phân tích thống kê của giáo dân hoặc (b) một trường hợp kiến ​​thức phổ biến là không đủ để xác định lỗi thống kê (như lỗi Loại 2)?

Tôi biết đủ về lĩnh vực chuyên môn của mình để yêu cầu một chuyên gia đầu vào khi tôi ở gần ranh giới của chuyên môn đó. Tôi đã thấy mọi người sử dụng những thứ như F-test (và R-squared trong Excel) mà không có đủ kiến ​​thức.

Theo kinh nghiệm của tôi, các hệ thống giáo dục, trong sự háo hức của chúng tôi để thúc đẩy thống kê, đã đơn giản hóa quá mức các công cụ và đánh giá thấp các rủi ro / giới hạn. Đây có phải là một chủ đề phổ biến mà những người khác đã trải nghiệm và sẽ giải thích tình hình?

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.