Có phải tất cả các mô hình đều vô dụng? Có bất kỳ mô hình chính xác nào có thể - hoặc hữu ích?


45

Câu hỏi này đã được tổ chức trong tâm trí của tôi trong hơn một tháng. Tạp chí Amstat News số tháng 2 năm 2015 có một bài viết của Giáo sư Berkeley Mark van der Laan mắng người ta sử dụng các mô hình không chính xác. Ông nói rằng bằng cách sử dụng các mô hình, thống kê sau đó là một nghệ thuật chứ không phải là một khoa học. Theo ông, người ta luôn có thể sử dụng "mô hình chính xác" và việc chúng ta không làm như vậy góp phần vào "sự thiếu nghiêm ngặt ... Tôi sợ rằng sự đại diện của chúng ta trong khoa học dữ liệu đang trở nên yếu thế".

Tôi đồng ý rằng chúng ta có nguy cơ bị thiệt thòi, nhưng mối đe dọa thường đến từ những người tuyên bố (nghe có vẻ giống giáo sư van der Laan, dường như) rằng họ không sử dụng một phương pháp gần đúng nào, nhưng thực tế phương pháp của họ ít hơn nhiều nghiêm ngặt hơn là các mô hình thống kê được áp dụng cẩn thận - ngay cả những mô hình sai.

Tôi nghĩ thật công bằng khi nói rằng Giáo sư van der Laan khá khinh bỉ những người lặp lại câu nói được sử dụng của Box, "tất cả các mô hình đều sai, nhưng một số là hữu ích." Về cơ bản, khi tôi đọc nó, ông nói rằng tất cả các mô hình đều sai, và tất cả đều vô dụng. Bây giờ, tôi là ai mà không đồng ý với một giáo sư Berkeley? Mặt khác, anh ta là ai mà ung dung bác bỏ quan điểm của một trong những người khổng lồ thực sự trong lĩnh vực của chúng ta?

Khi giải thích, Tiến sĩ van der Laan tuyên bố rằng "hoàn toàn vô nghĩa khi tuyên bố rằng tất cả các mô hình đều sai, ... Ví dụ, một mô hình thống kê không đưa ra giả định nào luôn đúng." Ông tiếp tục: "Nhưng thông thường, chúng tôi có thể làm tốt hơn thế nhiều: Chúng tôi có thể biết rằng dữ liệu là kết quả của thí nghiệm giống hệt nhau độc lập." Tôi không thấy làm thế nào người ta có thể biết điều đó ngoại trừ trong các thiết lập thử nghiệm ngẫu nhiên hoặc lấy mẫu ngẫu nhiên rất hẹp. Tác giả chỉ ra công việc của mình trong việc học khả năng tối đa nhắm mục tiêu và học tập dựa trên tổn thất tối thiểu nhắm mục tiêu, trong đó "tích hợp trạng thái của nghệ thuật trong ước lượng thích ứng máy học / dữ liệu, tất cả những tiến bộ đáng kinh ngạc trong suy luận nguyên nhân, dữ liệu bị kiểm duyệt, hiệu quả và thực nghiệm lý thuyết quá trình trong khi vẫn cung cấp suy luận thống kê chính thức. "n

Cũng có một số tuyên bố tôi đồng ý với. Ông nói rằng chúng ta cần phải thực hiện công việc của mình, vai trò của một nhà thống kê và các cộng tác viên khoa học của chúng ta một cách nghiêm túc. Nghe nghe! Đó chắc chắn là tin xấu khi mọi người thường xuyên sử dụng mô hình hồi quy logistic, hoặc bất cứ điều gì, mà không xem xét cẩn thận liệu nó có đủ để trả lời câu hỏi khoa học hoặc nếu nó phù hợp với dữ liệu. Và tôi thấy rất nhiều sự lạm dụng như vậy trong các câu hỏi được đăng trong diễn đàn này. Nhưng tôi cũng thấy việc sử dụng hiệu quả và có giá trị của các mô hình không chính xác, thậm chí cả các mô hình tham số. Và trái với những gì anh ấy nói, tôi hiếm khi "chán đến chết bởi một mô hình hồi quy logistic khác". Đó là sự ngây thơ của tôi, tôi đoán.

Vì vậy, đây là những câu hỏi của tôi:

  1. Những suy luận thống kê hữu ích nào có thể được thực hiện bằng cách sử dụng một mô hình mà không có giả định nào cả?
  2. Có tồn tại một nghiên cứu trường hợp, với dữ liệu thực tế quan trọng trong việc sử dụng khả năng tối đa được nhắm mục tiêu? Là những phương pháp được sử dụng rộng rãi và được chấp nhận?
  3. Có phải tất cả các mô hình không chính xác thực sự vô dụng?
  4. Có thể biết rằng bạn có mô hình chính xác khác với các trường hợp tầm thường?
  5. Nếu điều này quá dựa trên quan điểm và do đó lạc đề, nó có thể được thảo luận ở đâu? Bởi vì bài báo của Tiến sĩ van der Laan chắc chắn cần một số thảo luận.

13
Tôi muốn nói rằng một mô hình không có giả định hầu như luôn vô dụng, nhưng van der Laan chắc chắn đang đưa ra các giả định mà không thừa nhận nó. Chúng tôi thực sự không biết nhiều điều vì vậy "Chúng tôi có thể biết rằng dữ liệu là kết quả của n thí nghiệm giống hệt nhau độc lập" trên thực tế là một giả định , hoặc ít nhất là một phần như vậy. Chúng ta có thể có lý do chính đáng để cho rằng chúng giống hệt nhau và độc lập nhưng trong thực tế chúng ta thấy rằng rất thường thì nó không thực sự như vậy (và nếu chúng ta phát hiện ra rằng đôi khi, đôi khi nó phải được phát hiện ra, có lẽ thường xuyên hơn ).
Glen_b

19
Một mô hình không có giả định chỉ là một bản sao của datamatrix của bạn. Đó là sự thật, nhưng cũng là một sự trùng lặp vô ích của nỗ lực. Người ta cũng có thể lập luận rằng một mô hình như vậy không phải là một mô hình: Một định nghĩa của một mô hình là nó là một sự đơn giản hóa của thực tế. Vì vậy, một mô hình không đơn giản hóa là theo định nghĩa không phải là một mô hình. Sự đơn giản hóa đó có một mục đích: nó giúp chúng ta hiểu rõ những gì đang diễn ra; nó cho chúng ta một câu chuyện chính Nếu bạn không quan tâm đến việc hiểu lý do tại sao mọi thứ xảy ra và chỉ muốn dự đoán, câu chuyện chính đó là không liên quan. Tuy nhiên, một số người muốn làm nhiều hơn là tạo ra một quả bóng cristal ...
Maarten Buis

8
Một mô hình không có giả định không phải là một mô hình. Mô hình IS là một tập hợp các giả định. Ngoài ra, như @Glen_b nói, giả định của iid khá mạnh và tôi không thể nghĩ ra một ví dụ nào là "đúng". Ngay cả khi liên tục lật một đồng xu, vẫn có mối tương quan (xem tác phẩm của Diaconis). Tôi chỉ đọc lướt qua bài báo nhưng có vẻ thiển cận.
P.Windridge

11
Ví dụ đầu tiên của tác giả về việc bay lên sao Hỏa là không có thật. Cơ học Newton (được dựa trên nhiều khía cạnh của các sứ mệnh không gian) là một mô hình sai , nhưng chúng tôi dựa vào nó và nó rất hữu ích.
P.Windridge

6
Vâng, cơ học Newton là một ví dụ tuyệt vời về quan điểm của George Box.
Glen_b

Câu trả lời:


15

Bài báo được trích dẫn dường như dựa trên nỗi sợ rằng các nhà thống kê "sẽ không phải là một phần nội tại của nhóm khoa học và các nhà khoa học sẽ nghi ngờ về các phương pháp được sử dụng" và rằng "các cộng tác viên sẽ xem chúng tôi là kỹ thuật viên mà họ có thể điều khiển để có được kết quả khoa học của họ được công bố. " Nhận xét của tôi về các câu hỏi do @rvl đặt ra xuất phát từ quan điểm của một nhà khoa học sinh học phi thống kê, người đã bị buộc phải vật lộn với các vấn đề thống kê ngày càng phức tạp khi tôi chuyển từ nghiên cứu băng ghế sang nghiên cứu lâm sàng / dịch thuật trong vài năm qua. Câu hỏi 5 được trả lời rõ ràng bằng nhiều câu trả lời ngay bây giờ trên trang này; Tôi sẽ đi theo thứ tự ngược lại từ đó.

4) Thực sự không tồn tại "mô hình chính xác" có tồn tại hay không, bởi vì ngay cả khi nó có lẽ tôi sẽ không đủ khả năng để thực hiện nghiên cứu. Hãy xem xét vấn đề này trong bối cảnh thảo luận: Chúng ta có thực sự cần đưa vào tất cả các dự đoán có liên quan hay không? Ngay cả khi chúng ta có thể xác định "tất cả các dự đoán có liên quan" vẫn sẽ có vấn đề thu thập đủ dữ liệu để cung cấp mức độ tự do để kết hợp tất cả đều đáng tin cậy vào mô hình. Điều đó đủ khó trong các nghiên cứu thực nghiệm có kiểm soát, chứ chưa nói đến nghiên cứu hồi cứu hoặc dân số. Có thể trong một số loại "Dữ liệu lớn" ít xảy ra sự cố, nhưng đó là cho tôi và các đồng nghiệp của tôi. Sẽ luôn có nhu cầu "thông minh về điều đó", vì @Aksakal đưa ra câu trả lời trên trang đó.

Để công bằng cho Giáo sư van der Laan, ông không sử dụng từ "chính xác" trong bài viết được trích dẫn, ít nhất là trong phiên bản hiện có sẵn trên dòng từ liên kết . Ông nói về các mô hình "thực tế". Đó là một sự khác biệt quan trọng.

Sau đó, một lần nữa, Giáo sư van der Laan phàn nàn rằng "Thống kê bây giờ là một nghệ thuật, không phải là một khoa học", điều này hơi bất công về phía ông. Hãy xem xét cách anh ấy đề xuất để làm việc với các cộng tác viên:

... Chúng ta cần phải lấy dữ liệu, danh tính của chúng tôi như một nhà thống kê và các cộng tác viên khoa học của chúng tôi một cách nghiêm túc. Chúng ta cần tìm hiểu càng nhiều càng tốt về cách dữ liệu được tạo ra. Khi chúng tôi đã đưa ra một mô hình thống kê thực tế, chúng tôi cần trích xuất từ ​​các cộng tác viên của mình những gì ước tính và đại diện tốt nhất cho câu trả lời cho câu hỏi khoa học quan tâm của họ. Đây là rất nhiều công việc. Thật khó Nó đòi hỏi một sự hiểu biết hợp lý về lý thuyết thống kê. Đó là một doanh nghiệp học tập xứng đáng!

Việc áp dụng các nguyên tắc khoa học này vào các vấn đề trong thế giới thực dường như đòi hỏi rất nhiều "nghệ thuật", như với công việc trong bất kỳ doanh nghiệp khoa học nào. Tôi đã biết một số nhà khoa học rất thành công, nhiều người khác đã làm được, và một số thất bại. Theo kinh nghiệm của tôi, sự khác biệt dường như nằm ở "nghệ thuật" theo đuổi các mục tiêu khoa học. Kết quả có thể là khoa học, nhưng quá trình là một cái gì đó nhiều hơn.

3) Một lần nữa, một phần của vấn đề là thuật ngữ; có một sự khác biệt lớn giữa một mô hình "chính xác" và mô hình "thực tế" mà giáo sư van der Laan tìm kiếm. Yêu cầu của ông là nhiều mô hình thống kê tiêu chuẩn đủ phi thực tế để tạo ra kết quả "không đáng tin cậy". Cụ thể: "Ước tính của một ước tính được xác định trong một mô hình thống kê trung thực có thể được ước tính hợp lý dựa trên các mô hình tham số." Đó là những vấn đề để thử nghiệm, không phải ý kiến.

Công việc của chính ông nhận ra rõ ràng rằng các mô hình chính xác không phải lúc nào cũng có thể. Xem xét bản thảo này về các ước tính khả năng tối đa được nhắm mục tiêu (TMLE) trong bối cảnh thiếu các biến kết quả. Nó dựa trên một giả định về kết quả bị mất một cách ngẫu nhiên, điều này có thể không bao giờ có thể kiểm chứng được trong thực tế: "... chúng tôi cho rằng không có yếu tố gây nhiễu nào cho mối quan hệ giữa mất tích ... và kết quả." Đây là một ví dụ khác về khó khăn trong việc bao gồm "tất cả các dự đoán có liên quan." Tuy nhiên, một điểm mạnh của TMLE là dường như nó giúp đánh giá "giả định tích cực" về sự hỗ trợ đầy đủ trong dữ liệu để ước tính tham số đích trong ngữ cảnh này. Mục tiêu là đến càng gần càng tốt với một mô hình thực tế của dữ liệu.

2) TMLE đã được thảo luận về Xác thực chéo trước đây. Tôi không biết sử dụng rộng rãi trên dữ liệu thực. Hôm nay, Google Scholar đã cho thấy 258 trích dẫn về những gì dường như là báo cáo ban đầu , nhưng thoạt nhìn dường như không có gì trên các tập dữ liệu trong thế giới thực lớn. Các Tạp chí thống kê bài viết phần mềm trên bao bì R đi kèm chỉ cho thấy 27 Google Scholar trích dẫn ngày hôm nay. Tuy nhiên, điều đó không nên được coi là bằng chứng về giá trị của TMLE. Việc tập trung vào việc có được các ước tính không thiên vị đáng tin cậy về "ước tính" thực tế, thường là một vấn đề với các ước tính bổ trợ có nguồn gốc từ các mô hình thống kê tiêu chuẩn, dường như có giá trị.

1) Tuyên bố: "một mô hình thống kê làm cho không có giả định nào luôn luôn đúng" dường như được dự định là một người rơm, một tautology. Các dữ liệu là dữ liệu. Tôi cho rằng có những quy luật của vũ trụ vẫn nhất quán từ ngày này qua ngày khác. Phương thức TMLE có lẽ chứa các giả định về độ lồi trong không gian tìm kiếm và như đã lưu ý ở trên ứng dụng của nó trong một ngữ cảnh cụ thể có thể yêu cầu các giả định bổ sung.

Ngay cả giáo sư van der Laan cũng đồng ý rằng một số giả định là cần thiết. Ý thức của tôi là anh ấy muốn giảm thiểu số lượng giả định và tránh những điều không thực tế. Cho dù điều đó thực sự đòi hỏi phải từ bỏ các mô hình tham số, như ông dường như tuyên bố, là câu hỏi quan trọng.


Câu trả lời rất hay. Cuốn sách Targeted Learning là một nơi tốt để tìm hiểu thêm. Ngoài lý thuyết, nó còn chứa một số nghiên cứu điển hình.
NRH

12

Có thể tôi đã bỏ lỡ vấn đề, nhưng tôi nghĩ bạn phải lùi lại một chút.

Tôi nghĩ rằng quan điểm của ông là lạm dụng các công cụ dễ tiếp cận mà không có thêm kiến ​​thức. Điều này cũng đúng với một bài kiểm tra t đơn giản: chỉ cần cung cấp thuật toán với dữ liệu của bạn, nhận p <0,05 và nghĩ rằng luận án của bạn là đúng. Hoàn toàn sai. Bạn, tất nhiên, phải biết thêm về dữ liệu của bạn.

Bước xa hơn nữa: Không có gì giống như một mô hình chính xác ( nhà vật lý ở đây). Nhưng một số đồng ý rất tốt với các phép đo của chúng tôi. Điều chính xác duy nhất là toán học. Mà không có gì để làm với thực tế hoặc mô hình của nó . Mọi thứ khác (và mọi mô hình của thực tế) là "sai" (như được trích dẫn rất thường xuyên).

Nhưng điều gì có nghĩa là "sai" và hữu ích? Thẩm phán một mình:

TẤT CẢ các công nghệ cao hiện tại của chúng tôi (máy tính, tên lửa, phóng xạ, v.v.) đều dựa trên các mô hình sai này. Thậm chí có thể được tính toán bằng mô phỏng "sai" với các mô hình "sai".
-> Tập trung nhiều hơn vào "hữu ích" thay vì "sai";)

Rõ ràng hơn cho câu hỏi của bạn:

  1. Đừng biết, xin lỗi!
  2. Đúng. Một ví dụ: trong vật lý hạt, bạn muốn phát hiện các hạt nhất định (giả sử là electron, proton, v.v.). Mỗi hạt để lại một dấu vết đặc trưng trong máy dò (và do đó là dữ liệu), nhưng thay đổi ngay cả đối với cùng một hạt (theo bản chất của nó). Ngày nay, hầu hết mọi người sử dụng học máy để đạt được mục tiêu này (đây là một sự đơn giản hóa rất lớn, nhưng nó khá giống như thế này) và có sự gia tăng hiệu quả từ 20% -50% so với thực hiện bằng thống kê bằng tay .
  3. Không ai thực sự tuyên bố điều này! Đừng kết luận sai! (a: tất cả các mô hình đều không chính xác và b: một số là hữu ích. Đừng nhầm lẫn mọi thứ)
  4. Không có gì là một mô hình chính xác ( ngoại trừ trong toán học, nhưng không thực sự trong thống kê vì có các điểm chính xác trên một đường thẳng và "khớp" một đường thẳng qua nó có thể chính xác ... nhưng đó là trường hợp đặc biệt không thú vị không bao giờ xảy ra) .
  5. Đừng biết :) Nhưng IMHO tôi thấy điều này nhiều hơn là "chỉ vì mọi trẻ em đều có thể sử dụng nó, không phải ai cũng nên" và đừng lạm dụng nó một cách mù quáng.

Tôi sẽ xem xét điểm của bạn, nhưng trên (3) và (4), tôi khuyên bạn nên xem bài viết của van der Laan, cũng như câu hỏi của tôi, bởi vì bài báo nói khá rõ rằng anh ta không sử dụng cho các mô hình không chính xác, và nhiều lần đề cập đến "mô hình chính xác". Vì vậy, có, tôi muốn nói rằng ai đó thực sự nói rằng. Tôi khá đồng ý với những gì bạn nói về các mô hình, cũng như ứng dụng cơ học của các phương pháp; và vì vậy tôi không nghĩ đó là tôi mà bạn muốn yêu cầu lùi lại.
rvl

Vâng, cho tất cả. Và chủ yếu, tôi có nghĩa là anh ta lùi lại, chắc chắn;) Tôi nghĩ, những gì tôi đã không đề cập, để xây dựng các mô hình lý thuyết (toán học), tất nhiên bạn cần mô hình "chính xác". Vì vậy, để "phát minh" các mô hình và công cụ thống kê tốt hơn, bạn cần các mô hình xác định (hoặc chính xác) làm cơ sở. Ngay cả học tập mục tiêu bột cũng không phải là "không chính xác" theo nghĩa này, tôi nghĩ.
Mayou36

6

Trong econ, người ta nói nhiều về việc hiểu 'quy trình tạo dữ liệu'. Tôi không chắc chính xác mô hình 'chính xác' nghĩa là gì, nhưng trong econ nó có thể giống với mô hình 'được chỉ định chính xác'.

Chắc chắn, bạn muốn biết nhiều về quá trình tạo dữ liệu như bạn có thể trước khi thử một mô hình, phải không? Tôi nghĩ rằng khó khăn đến từ a) chúng ta có thể không có manh mối về DGP thực và b) ngay cả khi chúng ta biết DGP thực sự có thể không thể mô hình hóa và ước tính (vì nhiều lý do.)

Vì vậy, bạn đưa ra các giả định để đơn giản hóa các vấn đề và giảm các yêu cầu ước tính. Bạn có thể biết liệu giả định của bạn có chính xác không? Bạn có thể có được bằng chứng ủng hộ họ, nhưng IMO thật khó để chắc chắn trong một số trường hợp.

Tôi phải lọc tất cả những điều này về cả lý thuyết đã được thiết lập cũng như thực tiễn. Nếu bạn đưa ra một giả định phù hợp với lý thuyết và giả định đó mua cho bạn hiệu suất ước lượng tốt hơn (hiệu quả, chính xác, nhất quán, bất cứ điều gì) thì tôi không có lý do gì để tránh nó, ngay cả khi nó làm cho mô hình 'không chính xác'.

Thành thật mà nói, tôi nghĩ rằng bài viết có ý nghĩa kích thích những người làm việc với dữ liệu suy nghĩ kỹ hơn về toàn bộ quá trình mô hình hóa. Rõ ràng là van der Laan đưa ra các giả định trong công việc của mình . Trong ví dụ này , trên thực tế, van der Laan dường như loại bỏ mọi mối quan tâm đối với một mô hình chính xác, và thay vào đó sử dụng một mớ hỗn độn các thủ tục để tối đa hóa hiệu suất. Điều này khiến tôi tự tin hơn rằng anh ấy đã nêu ra trích dẫn của Box với mục đích ngăn chặn mọi người sử dụng nó như một lối thoát khỏi công việc khó khăn để hiểu vấn đề.

Hãy đối mặt với nó, thế giới đầy rẫy những lạm dụng và lạm dụng các mô hình thống kê. Mọi người áp dụng một cách mù quáng bất cứ điều gì họ biết cách làm, và tệ hơn, những người khác thường diễn giải kết quả theo cách mong muốn nhất. Bài viết này là một lời nhắc tốt để cẩn thận, nhưng tôi không nghĩ chúng ta nên đưa nó đến mức cực đoan.

Ý nghĩa của câu hỏi trên đối với câu hỏi của bạn:

  1. Tôi đồng ý với những người khác về bài đăng này đã xác định một mô hình là một tập hợp các giả định. Với định nghĩa đó, một mô hình không có giả định thực sự không phải là một mô hình. Ngay cả phân tích dữ liệu thăm dò (tức là mô hình miễn phí) yêu cầu các giả định. Ví dụ, hầu hết mọi người cho rằng dữ liệu được đo chính xác.
  2. Tôi không biết về TMLE, nhưng về kinh tế học, có nhiều bài viết sử dụng cùng một triết lý cơ bản để suy luận về tác động nhân quả đối với một mẫu phản tác dụng không quan sát được. Tuy nhiên, trong những trường hợp đó, việc điều trị không độc lập với các biến khác trong mô hình (không giống như TMLE), và vì vậy các nhà kinh tế sử dụng rộng rãi mô hình hóa. Có một vài trường hợp nghiên cứu cho các mô hình cấu trúc, chẳng hạn như nghiên cứu này , nơi các tác giả đã thuyết phục một công ty thực hiện mô hình của họ và tìm thấy kết quả tốt.
  3. Tôi nghĩ rằng tất cả các mô hình là không chính xác, nhưng một lần nữa, thuật ngữ này là một chút mờ nhạt. IMO, đây là cốt lõi của trích dẫn của Box. Tôi sẽ khôi phục sự hiểu biết của tôi về Box theo cách này: 'không mô hình nào có thể nắm bắt được bản chất chính xác của thực tế, nhưng một số mô hình nắm bắt được một biến quan tâm, vì vậy theo nghĩa đó bạn có thể sử dụng chúng.'
  4. Tôi đã giải quyết điều này ở trên. Nói tóm lại, tôi không nghĩ vậy.
  5. Tôi không chắc. Tôi thích nó ngay tại đây.

5

Để giải quyết điểm 3, câu trả lời, rõ ràng là không. Gần như mọi doanh nghiệp của con người đều dựa trên một mô hình đơn giản hóa tại một số điểm: nấu ăn, xây dựng, mối quan hệ giữa các cá nhân đều liên quan đến con người hành động trên một số loại dữ liệu + giả định. Không ai từng xây dựng một mô hình mà họ không có ý định sử dụng. Để khẳng định khác là nhà sư phạm nhàn rỗi.

Thật thú vị và ngộ nghĩnh hơn, và hữu ích khi hỏi khi các mô hình không chính xác không hữu ích, tại sao chúng thất bại trong tính hữu dụng của chúng và điều gì xảy ra khi chúng ta dựa vào các mô hình hóa ra không hữu ích. Bất kỳ nhà nghiên cứu nào, dù là trong học viện hay ngành công nghiệp, đều phải hỏi câu hỏi đó một cách sắc sảo và thường xuyên.

Tôi không nghĩ rằng câu hỏi có thể được trả lời chung chung, nhưng các nguyên tắc lan truyền lỗi sẽ thông báo câu trả lời. Các mô hình không chính xác bị phá vỡ khi hành vi mà họ dự đoán không phản ánh hành vi trong thế giới thực. Hiểu cách các lỗi lan truyền qua một hệ thống có thể giúp người ta hiểu mức độ chính xác là cần thiết trong việc mô hình hóa hệ thống.

Ví dụ, một quả cầu cứng thường không phải là mô hình xấu cho bóng chày. Nhưng khi bạn đang thiết kế mitt của người bắt, mô hình này sẽ làm bạn thất vọng và khiến bạn thiết kế sai. Các giả định đơn giản hóa của bạn về vật lý bóng chày lan truyền qua hệ thống bóng chày của bạn và khiến bạn rút ra kết luận sai.


5

1) Những suy luận thống kê hữu ích nào có thể được thực hiện bằng cách sử dụng một mô hình không có giả định nào cả?

Một mô hình theo định nghĩa là khái quát hóa những gì bạn đang quan sát có thể được nắm bắt bởi các yếu tố nguyên nhân nhất định mà lần lượt có thể giải thích và ước tính sự kiện bạn đang quan sát. Cho rằng tất cả các thuật toán tổng quát hóa có một số loại giả định cơ bản. Tôi không chắc những gì còn lại của một mô hình nếu bạn không có giả định nào. Tôi nghĩ rằng bạn còn lại với dữ liệu gốc và không có mô hình.

2) Có tồn tại một nghiên cứu trường hợp, với dữ liệu thực, quan trọng trong việc sử dụng khả năng tối đa được nhắm mục tiêu không? Là những phương pháp được sử dụng rộng rãi và được chấp nhận?

Tôi không biết. Khả năng tối đa được sử dụng tất cả các thời gian. Các mô hình logit dựa trên những mô hình đó cũng như nhiều mô hình khác. Chúng không khác nhau nhiều so với OLS tiêu chuẩn nơi bạn tập trung vào việc giảm tổng bình phương của phần dư. Tôi không chắc chắn mục tiêu tối đa khả năng là gì. Và, nó khác với khả năng tối đa truyền thống như thế nào.

3) Có phải tất cả các mô hình không chính xác thực sự vô dụng?

Tuyệt đối không. Các mô hình không chính xác có thể rất hữu ích. Đầu tiên, họ góp phần hiểu rõ hơn hoặc giải thích một hiện tượng. Điêu đo cung co chut gia trị. Thứ hai, họ có thể cung cấp ước tính gốc và dự báo với Khoảng tin cậy có liên quan để nắm bắt sự không chắc chắn xung quanh ước tính. Điều đó có thể cung cấp rất nhiều thông tin về những gì bạn đang học.

Vấn đề "không chính xác" cũng đặt ra vấn đề về sự căng thẳng giữa sự kỳ thị và sự phù hợp. Bạn có thể có một mô hình đơn giản với 5 biến là "không chính xác" nhưng thực hiện công việc khá tốt là nắm bắt và giải thích xu hướng chung của biến phụ thuộc. Bạn có thể có một mô hình phức tạp hơn với 10 biến "chính xác" hơn mô hình đầu tiên (Quảng trường R được điều chỉnh cao hơn, Lỗi tiêu chuẩn thấp hơn, v.v.). Tuy nhiên, mô hình phức tạp thứ hai này có thể thực sự sụp đổ khi bạn kiểm tra nó bằng cách sử dụng mẫu Hold Out. Và, trong trường hợp như vậy, có thể mô hình "không chính xác" thực sự hoạt động tốt hơn rất nhiều trong mẫu Hold Out. Điều này xảy ra theo nghĩa đen mọi lúc trong kinh tế lượng và tôi nghi ngờ trong nhiều ngành khoa học xã hội khác. Cẩn thận với các mô hình "chính xác".

4) Có thể biết rằng bạn có mô hình chính xác khác với các trường hợp tầm thường không?

Không thể biết rằng bạn có mô hình chính xác. Nhưng, có thể biết bạn có một mô hình khá tốt. Các biện pháp tiêu chí thông tin (AIC, BIC, SIC) có thể cung cấp cho bạn nhiều thông tin cho phép so sánh và đánh giá hiệu suất tương đối của các mô hình khác nhau. Ngoài ra, bài kiểm tra LINK cũng có thể giúp về vấn đề đó.

5) Nếu điều này quá dựa trên quan điểm và do đó lạc đề, nó có thể được thảo luận ở đâu? Bởi vì bài báo của Tiến sĩ van der Laan chắc chắn cần một số thảo luận.

Tôi nghĩ rằng đây là một diễn đàn thích hợp để thảo luận về vấn đề này như bất cứ nơi nào khác. Đây là một vấn đề khá thú vị đối với hầu hết chúng ta.


5

(Tôi không thấy cụm từ "mô hình chính xác" trong bài viết (mặc dù được trích dẫn ở trên))

1) Những suy luận thống kê hữu ích nào có thể được thực hiện bằng cách sử dụng một mô hình không có giả định nào cả?

Bạn phải bắt đầu từ đâu đó. Nếu đó là tất cả những gì bạn có (không có gì), nó có thể là điểm khởi đầu.

2) Có tồn tại một nghiên cứu trường hợp, với dữ liệu thực, quan trọng trong việc sử dụng khả năng tối đa được nhắm mục tiêu không? Là những phương pháp được sử dụng rộng rãi và được chấp nhận?

Để trả lời câu hỏi thứ hai, Khả năng tối đa được nhắm mục tiêu tăng lên trong 93/1143281 (~ .008%) của các bài báo trong arxiv.org. Vì vậy, không có lẽ là một ước tính tốt (không có giả định) cho cái đó.

3) Có phải tất cả các mô hình không chính xác thực sự vô dụng?

Không. Đôi khi bạn chỉ quan tâm đến một khía cạnh của một mô hình. Khía cạnh đó có thể rất tốt và phần còn lại rất không chính xác.

4) Có thể biết rằng bạn có mô hình chính xác khác với các trường hợp tầm thường không?

Các tốt nhất mô hình là mô hình mà tốt nhất câu trả lời câu hỏi của bạn. Điều đó có thể có nghĩa là để lại một cái gì đó ra. Những gì bạn muốn tránh, tốt nhất có thể, là giả định vi phạm.

5) Giờ hạnh phúc . Và đồ uống rẻ hơn để khởi động!

Tôi thấy việc sử dụng từ "chính xác" một chút đáng lo ngại. Đó không phải là một cuộc nói chuyện giống như thống kê. Thiếu chính xác? Sự biến đổi, biến hoá, thay đổi? Cảm ơn GV! Đó là lý do tại sao tất cả chúng ta đều ở đây. Tôi nghĩ rằng cụm từ "Tất cả các mô hình đều sai ..." là được, nhưng chỉ trong công ty phù hợp. Các nhà thống kê hiểu ý nghĩa của nó, nhưng ít người khác làm.


Điểm hay về cụm từ "mô hình chính xác." Ông nói những điều về mô hình "thật" và "thực tế" tương đương nhau, đặc biệt là với bối cảnh và giọng điệu của bài viết, nhưng bạn nói đúng, trích dẫn không "chính xác" (ý định chơi chữ).
SQLServerSteve

Lỗi của tôi. Tôi nên trích dẫn anh ta một cách chính xác.
rvl

Tôi cảm thấy rằng cố gắng để đạt được mô hình thực sự hoặc thực tế bỏ lỡ điểm của bài tập. Tôi nghĩ những gì anh ấy thực sự đang cố gắng thảo luận là những mô hình xấu.
mandata

Vâng, bài báo đưa ra nhiều điểm tốt, nhưng anh ta xen kẽ rất nhiều bình luận cực đoan như "Hoàn toàn vô nghĩa khi nói rằng tất cả các mô hình đều sai", trong khi thực tế chúng đều sai ở một mức độ nào đó. Thật là vô nghĩa khi nói khác. Anh ấy chắc chắn có một vị trí cực đoan. Rvl hoàn toàn đúng khi đưa ra điều này và gọi anh ta ra (đừng đổ mồ hôi trích dẫn Ryl, điều quan trọng là bạn đã nắm bắt được ý nghĩa chính xác).
SQLServerSteve

4

Nói bài viết dường như là một bài viết trung thực nhưng chính trị, một cuộc bút chiến chân thành . Như vậy, nó chứa rất nhiều đoạn đam mê không có ý nghĩa khoa học, tuy nhiên điều đó có thể có hiệu quả trong việc khuấy động các cuộc trò chuyện và cân nhắc hữu ích về các vấn đề quan trọng.

Có rất nhiều câu trả lời hay ở đây vì vậy tôi xin chỉ trích dẫn vài dòng trong bài báo để chỉ ra rằng Giáo sư Laan chắc chắn không sử dụng bất kỳ loại "mô hình chính xác" nào trong công việc của mình (và nhân tiện, ai nói rằng "chính xác mô hình "là một khái niệm tương đương với cơ chế tạo dữ liệu thực tế?)

Trích dẫn (nhấn mạnh nhấn mạnh của tôi)

"Một khi chúng tôi đã đưa ra một mô hình thống kê thực tế , chúng tôi cần trích xuất từ ​​các cộng tác viên của mình những gì ước tính và đại diện tốt nhất cho câu trả lời cho câu hỏi khoa học quan tâm của họ. "

Nhận xét: "thực tế" được loại bỏ khỏi "chính xác" như sao Hỏa từ Trái đất. Cả hai đều quay quanh Mặt trời, vì vậy đối với một số mục đích, người ta chọn hành tinh nào không quan trọng. Đối với các mục đích khác, nó không thành vấn đề. Ngoài ra "tốt nhất" là một khái niệm tương đối. "Chính xác" thì không.

"Ước tính của một ước tính được xác định trong một mô hình thống kê trung thực có thể được ước tính hợp lý dựa trên các mô hình tham số ...

Nhận xét: Trung thực là chính sách tốt nhất thực sự, nhưng chắc chắn nó không được đảm bảo là "chính xác". Ngoài ra, "ước lượng hợp lý" dường như là một kết quả rất loãng nếu người ta sử dụng "mô hình chính xác".

" Để đối phó với việc phải giải quyết những vấn đề ước lượng khó khăn này một cách tốt nhất có thể , chúng tôi đã phát triển một phương pháp thống kê chung ... "

Nhận xét: OK. Chúng tôi đang "làm tốt nhất có thể". Như hầu hết mọi người đang nghĩ về chính mình. Nhưng "tốt nhất chúng ta có thể" không phải là "chính xác".


2

Tôi sẽ tiếp cận điều này từ hướng thay thế của triết học, theo các nguyên tắc thực sự hữu ích của Quản lý không chắc chắn được thảo luận trong các cuốn sách của George F. Klir về các bộ mờ. Tôi không thể đưa ra tính chính xác của van der Laan, nhưng tôi có thể cung cấp một trường hợp hơi mệt mỏi vì lý do tại sao mục tiêu của anh ta là không thể; điều đó sẽ kêu gọi một cuộc thảo luận dài tham chiếu đến các lĩnh vực khác, vì vậy hãy đồng ý với tôi.

Klir và các đồng tác giả của ông chia sự không chắc chắn thành một số tiểu loại, chẳng hạn như không đặc hiệu (nghĩa là khi bạn có một tập hợp thay thế không xác định, xử lý thông qua các phương tiện như Hàm Hartley); sự thiếu chính xác trong các định nghĩa (nghĩa là "độ mờ" được mô hình hóa và định lượng trong các tập mờ); xung đột hoặc bất hòa trong bằng chứng (được đề cập trong Lý thuyết chứng cứ Dempster-Shafer); cộng với lý thuyết xác suất, lý thuyết khả năng và độ không đảm bảo đo, trong đó mục tiêu là có một phạm vi thích hợp để thu thập các bằng chứng liên quan, trong khi giảm thiểu sai sót. Tôi xem xét toàn bộ hộp công cụ của các kỹ thuật thống kê như là phương tiện thay thế phân vùng không chắc chắn theo các cách khác nhau, giống như một công cụ cắt cookie; khoảng tin cậy và giá trị p kiểm dịch sự không chắc chắn theo một cách, trong khi các biện pháp như Entropy của Shannon làm giảm nó từ một góc độ khác. Những gì họ có thể ' Tuy nhiên, làm là loại bỏ nó hoàn toàn. Để đạt được một "mô hình chính xác" của loại van der Laan dường như được mô tả, chúng ta cần giảm tất cả các loại không chắc chắn này xuống 0, để không còn phân vùng nữa. Một mô hình thực sự "chính xác" sẽ luôn có các giá trị xác suất và khả năng là 1, điểm không đặc hiệu bằng 0 và không có gì không chắc chắn trong các định nghĩa về thuật ngữ, phạm vi của các giá trị hoặc thang đo. Sẽ không có bất hòa trong các nguồn chứng cứ thay thế. Các dự đoán được đưa ra bởi một mô hình như vậy sẽ luôn chính xác 100%; các mô hình dự đoán về cơ bản phân vùng sự không chắc chắn của chúng trong tương lai, nhưng sẽ không còn gì để đưa ra. Quan điểm không chắc chắn có một số ý nghĩa quan trọng: của loại van der Laan dường như mô tả, chúng ta cần giảm tất cả các loại không chắc chắn này xuống 0, để không còn phân vùng nữa. Một mô hình thực sự "chính xác" sẽ luôn có các giá trị xác suất và khả năng là 1, điểm không đặc hiệu bằng 0 và không có gì không chắc chắn trong các định nghĩa về thuật ngữ, phạm vi của các giá trị hoặc thang đo. Sẽ không có bất hòa trong các nguồn chứng cứ thay thế. Các dự đoán được đưa ra bởi một mô hình như vậy sẽ luôn chính xác 100%; các mô hình dự đoán về cơ bản phân vùng sự không chắc chắn của chúng trong tương lai, nhưng sẽ không còn gì để đưa ra. Quan điểm không chắc chắn có một số ý nghĩa quan trọng: của loại van der Laan dường như mô tả, chúng ta cần giảm tất cả các loại không chắc chắn này xuống 0, để không còn phân vùng nữa. Một mô hình thực sự "chính xác" sẽ luôn có các giá trị xác suất và khả năng là 1, điểm không đặc hiệu bằng 0 và không có gì không chắc chắn trong các định nghĩa về thuật ngữ, phạm vi của các giá trị hoặc thang đo. Sẽ không có bất hòa trong các nguồn chứng cứ thay thế. Các dự đoán được đưa ra bởi một mô hình như vậy sẽ luôn chính xác 100%; các mô hình dự đoán về cơ bản phân vùng sự không chắc chắn của chúng trong tương lai, nhưng sẽ không còn gì để đưa ra. Quan điểm không chắc chắn có một số ý nghĩa quan trọng: Một mô hình thực sự "chính xác" sẽ luôn có các giá trị xác suất và khả năng là 1, điểm không đặc hiệu bằng 0 và không có gì không chắc chắn trong các định nghĩa về thuật ngữ, phạm vi của các giá trị hoặc thang đo. Sẽ không có bất hòa trong các nguồn chứng cứ thay thế. Các dự đoán được đưa ra bởi một mô hình như vậy sẽ luôn chính xác 100%; các mô hình dự đoán về cơ bản phân vùng sự không chắc chắn của chúng trong tương lai, nhưng sẽ không còn gì để đưa ra. Quan điểm không chắc chắn có một số ý nghĩa quan trọng: Một mô hình thực sự "chính xác" sẽ luôn có các giá trị xác suất và khả năng là 1, điểm không đặc hiệu bằng 0 và không có gì không chắc chắn trong các định nghĩa về thuật ngữ, phạm vi của các giá trị hoặc thang đo. Sẽ không có bất hòa trong các nguồn chứng cứ thay thế. Các dự đoán được đưa ra bởi một mô hình như vậy sẽ luôn chính xác 100%; các mô hình dự đoán về cơ bản phân vùng sự không chắc chắn của chúng trong tương lai, nhưng sẽ không còn gì để đưa ra. Quan điểm không chắc chắn có một số ý nghĩa quan trọng: Các dự đoán được đưa ra bởi một mô hình như vậy sẽ luôn chính xác 100%; các mô hình dự đoán về cơ bản phân vùng sự không chắc chắn của chúng trong tương lai, nhưng sẽ không còn gì để đưa ra. Quan điểm không chắc chắn có một số ý nghĩa quan trọng: Các dự đoán được đưa ra bởi một mô hình như vậy sẽ luôn chính xác 100%; các mô hình dự đoán về cơ bản phân vùng sự không chắc chắn của chúng trong tương lai, nhưng sẽ không còn gì để đưa ra. Quan điểm không chắc chắn có một số ý nghĩa quan trọng:

• Thứ tự cao này không chỉ bất khả thi về mặt vật lý, mà thực sự là không thể. Rõ ràng, chúng ta không thể đạt được các thang đo liên tục hoàn hảo với các mức độ vô hạn, bằng cách thu thập các quan sát hữu hạn bằng cách sử dụng các thiết bị khoa học vật lý có thể đọc được; sẽ luôn có sự không chắc chắn về quy mô đo lường. Tương tự như vậy, sẽ luôn có một số mờ nhạt xung quanh chính các định nghĩa chúng ta sử dụng trong các thí nghiệm của mình. Tương lai vốn dĩ không chắc chắn, do đó, những dự đoán được cho là hoàn hảo của các mô hình "chính xác" của chúng ta sẽ phải được coi là không hoàn hảo cho đến khi được chứng minh bằng cách khác - sẽ mất một thời gian.

• Để làm cho vấn đề tồi tệ hơn, không có kỹ thuật đo lường nào không có lỗi 100 phần trăm tại một số điểm trong quy trình, và cũng không thể thực hiện đủ toàn diện để nắm lấy tất cả các thông tin có thể xung đột trong vũ trụ. Hơn nữa, việc loại bỏ các biến gây nhiễu có thể và độc lập có điều kiện hoàn toàn có thể được chứng minh một cách triệt để mà không cần kiểm tra tất cả các quá trình vật lý khác ảnh hưởng đến quá trình chúng ta đang kiểm tra, cũng như các biến ảnh hưởng đến các quá trình thứ cấp này, v.v.

• Chính xác chỉ có thể có trong logic thuần túy và tập hợp con của nó, toán học, chính xác bởi vì sự trừu tượng được tách ra khỏi các mối quan tâm trong thế giới thực như những nguồn không chắc chắn này. Ví dụ: bằng logic suy diễn thuần túy, chúng ta có thể chứng minh rằng 2 + 2 = 4 và bất kỳ câu trả lời nào khác là không chính xác 100 phần trăm. Chúng ta cũng có thể đưa ra dự đoán hoàn toàn chính xác rằng nó sẽ luôn bằng 4. Loại chính xác này chỉ có thể có trong thống kê khi chúng ta xử lý trừu tượng. Số liệu thống kê cực kỳ hữu ích khi áp dụng vào thế giới thực, nhưng chính điều đó làm cho nó hữu ích tiêm ít nhất một mức độ không chắc chắn không thể giải thích được, do đó khiến nó không chính xác. Đó là một vấn đề nan giải không thể tránh khỏi.

• Hơn nữa, Peter Chu nêu ra những hạn chế bổ sung trong phần bình luận của bài viết rvl được liên kết đến. Anh ấy đặt nó tốt hơn tôi có thể:

"Bề mặt giải pháp của các vấn đề NP-hard thường đầy rẫy với nhiều tối ưu cục bộ và trong hầu hết các trường hợp không thể tính toán được vấn đề tức là tìm giải pháp tối ưu toàn cầu nói chung. Do đó, mỗi nhà lập mô hình đang sử dụng một số kỹ thuật mô hình hóa (heuristic), tốt nhất, để tìm giải pháp tối ưu cục bộ đầy đủ trong không gian giải pháp rộng lớn của hàm mục tiêu phức tạp này. "

• Tất cả điều này có nghĩa là bản thân khoa học không thể hoàn toàn chính xác, mặc dù van der Laan dường như nói về nó theo cách này trong bài viết của mình; phương pháp khoa học như một quá trình trừu tượng là chính xác có thể xác định được, nhưng sự bất khả thi của phép đo chính xác phổ quát và hoàn hảo có nghĩa là nó không thể tạo ra các mô hình chính xác mà không có sự không chắc chắn. Khoa học là một công cụ tuyệt vời, nhưng nó có giới hạn.

• Nó trở nên tồi tệ hơn từ đó: Ngay cả khi có thể đo chính xác tất cả các lực tác động lên mọi quark và gluon cấu thành trong vũ trụ, một số điều không chắc chắn vẫn còn tồn tại. Đầu tiên, bất kỳ dự đoán nào được đưa ra bởi một mô hình hoàn chỉnh như vậy vẫn sẽ không chắc chắn do sự tồn tại của nhiều giải pháp cho phương trình tinh túy và đa thức cao hơn. Thứ hai, chúng ta không thể hoàn toàn chắc chắn rằng sự hoài nghi cực đoan trong câu hỏi kinh điển "có thể đây chỉ là một giấc mơ hay ảo giác" không phải là sự phản ánh của thực tế - trong trường hợp tất cả các mô hình của chúng ta thực sự sai theo cách tồi tệ nhất có thể . Điều này về cơ bản tương đương với một cách giải thích bản thể học cực đoan hơn về các công thức nhận thức luận nguyên thủy của các triết học như chủ nghĩa hiện tượng, chủ nghĩa duy tâm và chủ nghĩa duy ngã.

• Trong Chính thống giáo cổ điển năm 1909 của mìnhGK Chesterton lưu ý rằng các phiên bản cực đoan của những triết lý này thực sự có thể được đánh giá, nhưng bằng cách họ có lái những tín đồ của họ vào các viện tâm thần hay không; chủ nghĩa duy ngã bản thể, ví dụ, thực sự là một dấu hiệu của tâm thần phân liệt, như một số anh em họ của nó. Điều tốt nhất mà chúng ta có thể đạt được trong thế giới này là loại bỏ sự nghi ngờ hợp lý; nghi ngờ vô lý của loại đáng lo ngại này có thể được thực hiện nghiêm ngặt, ngay cả trong một thế giới giả thuyết của các mô hình chính xác, các phép đo toàn diện và không có lỗi. Nếu van der Laan nhằm mục đích gạt bỏ chúng ta về sự nghi ngờ vô lý thì anh ta đang chơi với lửa. Bằng cách nắm bắt sự hoàn hảo, những điều tốt đẹp hữu hạn mà chúng ta có thể làm sẽ lướt qua những ngón tay của chúng ta; chúng ta là những sinh vật hữu hạn tồn tại trong một thế giới vô tận, điều đó có nghĩa là loại kiến ​​thức hoàn chỉnh và hoàn toàn chắc chắn mà van der Laan lập luận cho là vĩnh viễn nằm ngoài tầm hiểu biết của chúng ta. Cách duy nhất chúng ta có thể đạt được sự chắc chắn đó là rút lui khỏi thế giới đó vào giới hạn hẹp hơn của cái hoàn toàn trừu tượng mà chúng ta gọi là "toán học thuần túy". Tuy nhiên, điều này không có nghĩa là việc rút lui vào toán học thuần túy là giải pháp để loại bỏ sự không chắc chắn. Đây thực chất là cách tiếp cận được thực hiện bởi những người kế vị của Ludwig Wittgenstein (1889-1951), người đã rút cạn triết lý của mình về chủ nghĩa thực chứng logic của bất kỳ ý nghĩa thông thường nào bằng cách bác bỏ hoàn toàn siêu hình học và rút lui hoàn toàn vào toán học và khoa học thuần túy, cũng như sự hoài nghi cực đoan, quá mức chuyên môn hóa và quá tập trung vào tính chính xác trên tính hữu ích. Trong quá trình đó, họ đã phá hủy kỷ luật triết học bằng cách hòa tan nó thành một mớ hỗn độn về các định nghĩa và cái nhìn rốn, do đó làm cho nó không liên quan đến phần còn lại của giới hàn lâm. Điều này về cơ bản đã giết chết toàn bộ ngành học, vốn vẫn đi đầu trong các cuộc tranh luận học thuật cho đến đầu thế kỷ 20, đến mức nó vẫn thu hút được sự chú ý của truyền thông và một số nhà lãnh đạo của nó là tên hộ gia đình. Họ nắm bắt được một lời giải thích hoàn hảo, lịch sự về thế giới và nó lướt qua ngón tay của họ - giống như những gì bệnh nhân tâm thần mà GKC đã nói đến. Nó cũng sẽ tuột khỏi tầm ngắm của van der Laan, người đã từ chối quan điểm của riêng mình, như được thảo luận dưới đây. Việc theo đuổi các mô hình quá chính xác không chỉ là không thể; nó có thể nguy hiểm, nếu được đưa đến mức ám ảnh tự đánh bại. Việc theo đuổi loại tinh khiết đó hiếm khi kết thúc tốt đẹp; nó thường tự đánh bại bản thân như những kẻ phỉ báng chà tay mạnh mẽ đến nỗi cuối cùng họ bị vết thương nhiễm trùng. Nó ' Chúng gợi nhớ đến Icarus đang cố gắng đánh cắp lửa từ Mặt trời: là những sinh vật hữu hạn, chúng ta chỉ có thể có một sự hiểu biết hữu hạn về mọi thứ. Như Chesterton cũng nói trong Chính thống giáo, "Chính nhà logic học tìm cách đưa thiên đàng vào đầu anh ta. Và đó là đầu anh ta tách ra."

Dưới ánh sáng ở trên, hãy để tôi giải quyết một số câu hỏi cụ thể được liệt kê bởi rvl:

1) Một mô hình không có giả định nào là a) không biết về các giả định của chính mình hoặc b) phải được phân tách rõ ràng khỏi các cân nhắc đưa ra độ không đảm bảo, chẳng hạn như sai số đo, tính toán cho từng biến gây nhiễu duy nhất, thang đo liên tục hoàn hảo và như.

2) Tôi vẫn là người mới khi ước tính khả năng tối đa (MLE), vì vậy tôi không thể nhận xét về cơ chế của khả năng mục tiêu, ngoại trừ chỉ ra điều hiển nhiên: khả năng chỉ là, khả năng, không phải là sự chắc chắn . Để có được một mô hình chính xác đòi hỏi phải loại bỏ hoàn toàn sự không chắc chắn, điều mà logic xác suất hiếm khi có thể làm được, nếu có.

3) Tất nhiên là không. Vì tất cả các mô hình đều có một số điểm không chắc chắn và do đó không chính xác (trừ trường hợp toán học thuần túy, đã ly dị với các phép đo vật lý trong thế giới thực), loài người sẽ không thể đạt được bất kỳ tiến bộ công nghệ nào cho đến nay - hoặc thực sự, bất kỳ tiến bộ nào khác tại tất cả. Nếu các mô hình không chính xác luôn vô dụng, chúng ta sẽ có cuộc trò chuyện này trong một hang động, thay vì kỳ công tuyệt vời này được gọi là Internet, tất cả đều được thực hiện thông qua mô hình không chính xác.

Trớ trêu thay, mô hình riêng của van der Laan là một ví dụ chính về sự không chính xác. Bài viết của chính ông phác thảo một mô hình về cách thức lĩnh vực thống kê phải được quản lý, với mục tiêu hướng tới các mô hình chính xác; Vẫn chưa có con số nào gắn liền với "mô hình" này, không có sự đo lường nào về việc hầu hết các mô hình hiện tại không chính xác hay vô dụng như thế nào, không có sự định lượng nào về việc chúng ta cách xa tầm nhìn của anh ta, nhưng tôi cho rằng người ta có thể nghĩ ra những thử nghiệm cho những điều đó . Tuy nhiên, khi nó đứng, mô hình của ông là không chính xác. Nếu nó không hữu ích, điều đó có nghĩa là quan điểm của anh ta là sai; nếu nó hữu ích, nó đánh bại điểm chính của anh ta rằng các mô hình không chính xác không hữu ích. Dù bằng cách nào, anh ta bác bỏ lập luận của riêng mình.

4) Có lẽ là không, bởi vì chúng tôi không thể có thông tin đầy đủ để kiểm tra mô hình của chúng tôi, vì những lý do tương tự mà chúng tôi không thể rút ra được một mô hình chính xác ngay từ đầu. Một mô hình chính xác theo định nghĩa sẽ yêu cầu khả năng dự đoán hoàn hảo, nhưng ngay cả khi 100 thử nghiệm đầu tiên có độ chính xác 100%, thì 101 có thể không. Sau đó, toàn bộ vấn đề của thang đo vô hạn. Sau đó, chúng tôi nhận được tất cả các nguồn không chắc chắn khác, điều này sẽ làm ô nhiễm bất kỳ đánh giá Tháp Ngà nào về mô hình Tháp Ngà của chúng tôi.

5) Để giải quyết vấn đề này, tôi đã phải đặt nó trong bối cảnh rộng lớn hơn về các vấn đề triết học lớn hơn thường gây tranh cãi, vì vậy tôi không nghĩ rằng có thể thảo luận về vấn đề này mà không cần phải đưa ra ý kiến ​​(lưu ý rằng chính nó là một vấn đề khác nguồn gốc của sự không chắc chắn) nhưng bạn đã đúng, bài viết này xứng đáng được trả lời. Rất nhiều điều ông nói về các chủ đề khác đang đi đúng hướng, chẳng hạn như cần phải thống kê liên quan đến Dữ liệu lớn, nhưng có một số chủ nghĩa cực đoan không thực tế được trộn lẫn trong đó cần được sửa chữa.


1
Những "người kế vị của Wittgenstein" là ai đã "phá hủy kỷ luật triết học"!? Xu hướng của triết học phân tích sau chiến tranh - nghĩ về Wittgenstein, Austin, Quine, Kenny, Goodman, Lewis, Davidson, Rorty - dường như đang bác bỏ các nguyên lý của chủ nghĩa thực chứng logic, phục hồi siêu hình học, và rút lui khỏi khoa học. (Nhận xét của Rorty về Nietzsche & Loyola cho thấy anh ta có thể đã đồng ý với quan điểm của Chesterton.) Về lý do tại sao Kim Kardashian là một hộ gia đình chứ không phải Saul Kripke, tôi nghi ngờ các xu hướng khác đã hoạt động từ đầu thế kỷ 20.
Scortchi - Phục hồi Monica

Những nhà cải cách sau chiến tranh này không được biết đến bên ngoài lĩnh vực của họ một cách chính xác bởi vì họ đến sau khi kỷ luật đã rút đi vào những năm 20/30 (sau một thế kỷ suy giảm kéo dài, các nhà thực chứng logic cực đoan chỉ tăng tốc) thành một sự không liên quan mà nó chưa bao giờ hồi phục. Các thiệt hại đã được thực hiện. Vào thập niên 50, các ngành học thuật khác đã không còn tìm đến triết lý lãnh đạo và từ đó thường đối xử với nó bằng sự khinh miệt hoàn toàn, vì sự lạc lõng, giáo dục sai lầm .. Tôi ước điều đó không đúng. Hình ảnh có thể không phản ánh thực tế của triết học, nhưng vẫn còn mờ nhạt.
SQLServerSteve

Tôi rất vui được thảo luận về vấn đề này trong cuộc trò chuyện vào tuần tới nếu bạn có thời gian, tôi không muốn tiếp tục với chủ đề này, nhưng tôi nghi ngờ vị trí của chúng tôi không cách xa nhau. Tôi nghĩ rằng bạn hoàn toàn đúng, phong trào dẫn đến Kardashian, v.v. đã được tiến hành từ đầu thế kỷ 20 - chính xác là thời điểm mà ngành học triết học rơi vào nhật thực (liệu nó có xứng đáng hay không là một vấn đề khác; thực tế và mong muốn nó vẫn được đánh giá cao).
SQLServerSteve

Bình luận không dành cho thảo luận mở rộng; cuộc trò chuyện này đã được chuyển sang trò chuyện .
Scortchi - Phục hồi Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.