Bạn có thể nói rằng số liệu thống kê và xác suất giống như cảm ứng và khấu trừ?


17

Tôi đã đọc qua chủ đề này và có vẻ như tôi có thể nói rằng:

  • thống kê = cảm ứng?
  • xác suất = khấu trừ?

Nhưng tôi tự hỏi nếu có thể có thêm một số chi tiết về so sánh mà tôi đang thiếu. Ví dụ, là số liệu thống kê bằng với cảm ứng, hay nó chỉ là một trường hợp cụ thể của nó? Dường như xác suất là một trường hợp phụ của suy luận (vì nó là trường hợp phụ của tư duy toán học).

Tôi biết đây là một câu hỏi khó, nhưng theo một nghĩa nào đó thì đây là lý do tại sao tôi hỏi nó - bởi vì tôi muốn chắc chắn làm thế nào những thuật ngữ này có thể được so sánh chính xác.


Không phải vì nó trả lời câu hỏi của bạn mà bởi vì chúng được kết nối: stats.stackexchange.com/questions/665/ (Tôi thực sự thích câu trả lời của Mark / Peter) và stats.stackexchange.com/questions/2641/ Khăn
robin girard

Câu trả lời:


15

Tôi nghĩ rằng tốt nhất là nhanh chóng tóm tắt lại ý nghĩa của lý luận quy nạp và suy diễn trước khi trả lời câu hỏi của bạn.

  • Lý luận suy diễn: "Các lý lẽ suy diễn là cố gắng chỉ ra rằng một kết luận nhất thiết phải xuất phát từ một tập hợp các tiền đề. Một lập luận suy diễn là hợp lệ nếu kết luận đó nhất thiết phải tuân theo các tiền đề, nghĩa là, nếu kết luận phải đúng với điều kiện là các tiền đề là đúng Đối số suy diễn là âm thanh nếu nó hợp lệ và tiền đề của nó là đúng. Đối số suy diễn là hợp lệ hoặc không hợp lệ, âm thanh hoặc không có căn cứ, nhưng không bao giờ sai hoặc đúng. " ( trích dẫn từ wikipedia , nhấn mạnh thêm).

  • "Lập luận quy nạp, hay còn gọi là cảm ứng hoặc logic quy nạp, hoặc đoán giáo dục bằng tiếng Anh thông tục, là một loại lý luận cho phép khả năng kết luận thậm chí còn sai mà tất cả các cơ sở là đúng sự thật. Các cơ sở của một cuộc tranh cãi logic quy nạp chỉ ra một số mức độ hỗ trợ (xác suất quy nạp) cho kết luận nhưng không đòi hỏi nó; nghĩa là họ không đảm bảo sự thật của nó. "( từ wikipedia , nhấn mạnh thêm)

Để nhấn mạnh sự khác biệt chính: Trong khi suy luận suy diễn chuyển sự thật từ tiền đề sang kết luận, lý luận quy nạp thì không. Đó là, trong khi đối với lý luận suy diễn, bạn không bao giờ mở rộng kiến ​​thức của mình (nghĩa là mọi thứ đều ở trong cơ sở, nhưng đôi khi bị ẩn và cần được chứng minh qua bằng chứng), lý luận quy nạp cho phép bạn mở rộng kiến ​​thức của mình (nghĩa là bạn có thể có được những hiểu biết mới không được chứa trong các cơ sở, tuy nhiên, với chi phí không biết sự thật của họ).

Làm thế nào điều này liên quan đến xác suất và thống kê?

Trong mắt tôi, xác suất là nhất thiết phải suy diễn. Nó là một nhánh của toán học. Vì vậy, dựa trên một số tiên đề hoặc ý tưởng (được cho là đúng), nó suy ra các lý thuyết.

Tuy nhiên, thống kê không nhất thiết phải quy nạp. Chỉ khi bạn cố gắng sử dụng nó để tạo kiến ​​thức về các thực thể không quan sát được (tức là theo đuổi số liệu thống kê suy luận, hãy xem câu trả lời của onestop). Tuy nhiên, nếu bạn sử dụng số liệu thống kê để mô tả mẫu (nghĩa là số liệu thống kê giải mã) hoặc nếu bạn đã lấy mẫu toàn bộ dân số, thì vẫn còn suy diễn khi bạn không có thêm kiến ​​thức hoặc thông tin nào như đã có trong mẫu.

Vì vậy, nếu bạn nghĩ rằng thống kê là nỗ lực anh hùng của các nhà khoa học đang cố gắng sử dụng các phương pháp toán học để tìm ra sự đều đặn chi phối sự tương tác của các thực thể thực nghiệm trên thế giới, thực tế là không bao giờ thành công các lý thuyết của chúng tôi là đúng), sau đó, yeah, đây là cảm ứng. Đó cũng là Phương pháp khoa học được phát biểu bởi Francis Bacon, theo đó khoa học thực nghiệm hiện đại được thành lập. Phương pháp này dẫn đến kết luận quy nạp có khả năng cao nhất, mặc dù không chắc chắn. Điều này dẫn đến sự hiểu lầm giữa những người không phải là nhà khoa học về ý nghĩa của một lý thuyết khoa học và một bằng chứng khoa học.


Cập nhật: Sau khi đọc câu trả lời của Conjugate Prior (và sau khi suy nghĩ qua đêm) tôi muốn thêm một cái gì đó. Tôi nghĩ rằng câu hỏi về lý luận thống kê (suy luận) là suy diễn hay quy nạp phụ thuộc vào chính xác những gì bạn quan tâm, tức là, loại kết luận nào bạn đang phấn đấu.

Nếu bạn quan tâm đến kết luận xác suất, thì lý luận thống kê là suy diễn. Điều này có nghĩa là, nếu bạn muốn biết, ví dụ, trong 95 trên 100 trường hợp, giá trị dân số nằm trong một khoảng nhất định (nghĩa là khoảng tin cậy), thì bạn có thể nhận được giá trị thật (đúng hoặc không đúng) cho tuyên bố này. Bạn có thể nói (nếu các giả định là đúng) rằng trong 95 trên 100 trường hợp, giá trị dân số nằm trong khoảng. Tuy nhiên, không có trường hợp thực nghiệm nào bạn sẽ biết nếu giá trị dân số nằm trong CI thu được của bạn. Dù có hay không, nhưng không có cách nào để chắc chắn. Lý do tương tự áp dụng cho xác suất trong thống kê p-value cổ điển và thống kê Bayes. Bạn có thể chắc chắn về xác suất.

Tuy nhiên, nếu bạn quan tâm đến kết luận về các thực thể thực nghiệm (ví dụ, giá trị dân số ở đâu), bạn chỉ có thể lập luận quy nạp. Bạn có thể sử dụng tất cả các phương pháp thống kê có sẵn để tích lũy bằng chứng hỗ trợ các đề xuất nhất định về các thực thể thực nghiệm hoặc các cơ chế nhân quả mà chúng tương tác. Nhưng bạn sẽ không bao giờ chắc chắn về bất kỳ đề xuất nào.

Tóm lại: Điểm tôi muốn làm cho nó quan trọng ở những gì bạn đang tìm kiếm. Xác suất bạn có thể suy luận, nhưng đối với mọi đề xuất nhất định về những điều bạn chỉ có thể tìm thấy bằng chứng ủng hộ. Không hơn. Xem thêm liên kết của onestop với vấn đề cảm ứng.


Cảm ơn Henrik - sự khác biệt giữa các định nghĩa (và suy nghĩ của bạn về chúng) rất hữu ích.
Tal Galili

Cập nhật của bạn đã rõ ràng và đến điểm. Nếu tôi có thể cho bạn một cái khác (+1), tôi sẽ làm thế.
Tal Galili

7

Thống kê là cách tiếp cận suy diễn. Hãy xem xét hai cách tiếp cận chính để suy luận thống kê: Người thường xuyên và Bayes.

Giả sử bạn là người thường xuyên (theo phong cách của Fisher, thay vì Neyman để thuận tiện). Bạn tự hỏi liệu một tham số quan tâm thực sự có một giá trị cụ thể hay không, vì vậy bạn xây dựng một mô hình, chọn một thống kê liên quan đến tham số đó và thực hiện kiểm tra. Giá trị p được tạo bởi thử nghiệm của bạn cho thấy xác suất nhìn thấy một thống kê là cực đoan hơn so với thống kê được tính từ mẫu bạn có, giả sử rằng mô hình của bạn là chính xác. Bạn nhận được một giá trị p đủ nhỏ để bạn từ chối giả thuyết rằng tham số đó lấy giá trị đó. Lý luận của bạn là suy diễn: Giả sử mô hình là chính xác, hoặc tham số thực sự có giá trị quan tâm thực sự nhưng của bạn là một mẫu không thể nhìn thấy, hoặc thực tế nó không lấy giá trị đó.

Chuyển từ kiểm tra giả thuyết sang các khoảng tin cậy: bạn có khoảng tin cậy 95% cho tham số của bạn không chứa giá trị quan tâm đáng kể. Lý luận của bạn là một lần nữa suy diễn: giả sử mô hình là chính xác, đây là một trong những khoảng thời gian hiếm hoi đó sẽ xuất hiện 1 trong 20 lần khi tham số thực sự có giá trị quan tâm thực sự (vì mẫu của bạn là không chắc chắn), hoặc tham số thực tế không có giá trị đó.

Bây giờ giả sử bạn là người Bayes (theo phong cách Laplace chứ không phải Gelman). Các giả định và tính toán mô hình của bạn cung cấp cho bạn phân phối xác suất (sau) trên giá trị tham số. Hầu hết khối lượng của phân phối này khác xa với giá trị quan tâm thực sự, vì vậy bạn kết luận rằng tham số có thể không có giá trị này. Lý luận của bạn là một lần nữa suy diễn: giả sử mô hình của bạn là chính xác và nếu phân phối trước đó thể hiện niềm tin của bạn về tham số, thì niềm tin của bạn về ánh sáng của dữ liệu được mô tả bởi phân phối sau của bạn, điều này đặt rất ít xác suất vào giá trị đó. Vì phân phối này cung cấp ít hỗ trợ cho giá trị của lãi suất thực, bạn có thể kết luận rằng tham số trên thực tế không có giá trị. (Hoặc bạn có thể hài lòng để xác định xác suất xảy ra).

Trong cả ba trường hợp, bạn nhận được một sự phân biệt logic để dựa trên hành động của mình dựa trên suy diễn / toán học từ các giả định. Những giả định này thường là về một mô hình về cách dữ liệu được tạo ra, nhưng cũng có thể là niềm tin trước về số lượng khác.


1
Cảm ơn bạn Cp, bạn làm cho một điểm thú vị. Mặc dù, từ quan điểm của câu trả lời của Henrik ở trên, bạn vẫn ở trong vương quốc của quy nạp, vì lý do thống kê mà bạn mô tả là một vấn đề liên quan đến sự không chắc chắn.
Tal Galili

Xin vui lòng xem bản cập nhật (hy vọng có thể hiểu được) cho câu trả lời của tôi, nơi tôi cố gắng giải quyết vấn đề được đưa ra ở đây.
Henrik

@Henrik Điều đó rõ ràng hơn (với tôi ít nhất). Chỉ cần một chút thận trọng: Không hoàn toàn là trường hợp "lý do tương tự áp dụng cho xác suất trong giá trị p cổ điển và thống kê Bayes". Cái sau sẽ cung cấp cho bạn xác suất sự kiện duy nhất, ví dụ như xác suất trung bình thực nằm giữa một số giá trị và một số giá trị khác (mặc dù tất cả các cảnh báo khác của bạn đều áp dụng) trong khi các phương pháp thường xuyên 'cổ điển' như khoảng tin cậy thậm chí sẽ không làm được điều đó, mặc dù thích và hy vọng rộng rãi mà họ làm. Giải thích của họ thực sự là như bạn mô tả nó.
liên hợp chiến binh

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.