Sự khác biệt giữa thống kê mô tả và suy luận là gì?


21

Sự hiểu biết của tôi là các số liệu thống kê mô tả được mô tả một cách định lượng các tính năng của một mẫu dữ liệu, trong khi các số liệu thống kê suy luận đưa ra các suy luận về các quần thể mà từ đó các mẫu được rút ra.

Tuy nhiên, trang wikipedia cho các suy luận thống kê nêu:

Đối với hầu hết các phần, suy luận thống kê đưa ra các đề xuất về dân số, sử dụng dữ liệu được rút ra từ dân số quan tâm thông qua một số hình thức lấy mẫu ngẫu nhiên.

"Phần lớn" đã khiến tôi nghĩ rằng có lẽ tôi không hiểu đúng các khái niệm này. Có những ví dụ về thống kê suy luận không đưa ra các đề xuất về dân số?


Thống kê mô tả: Một đồng xu đã được ném mười lần và rơi xuống đầu sáu lần. Suy luận thống kê: Ước tính khả năng tối đa của xác suất của Người đứng đầu là hoặc, Thông tin này không đủ để bác bỏ giả thuyết rằng đồng xu là một đồng tiền công bằng. 0,6
Dilip Sarwate

2
Suy luận không có khái niệm "dân số": Giả sử dữ liệu của bạn được tạo bởi một số cơ chế / quy tắc ngẫu nhiên chưa biết (một phần). Phương pháp suy luận cho phép đánh giá các thuộc tính của cơ chế này dựa trên dữ liệu. Ví dụ: Bạn muốn xác minh một công thức điện-vật lý dựa trên các kết quả có thể được đo chỉ xấp xỉ hoặc trong các điều kiện không hoàn hảo.
Michael M

1
@Michael: Vâng; hoặc thực sự làm cho dữ liệu của bạn được tạo ra bởi một cơ chế ngẫu nhiên đã biết - chỉ định ngẫu nhiên các phương pháp điều trị thử nghiệm.
Scortchi - Phục hồi Monica

Câu trả lời:


19

Xuất phát từ một nền tảng khoa học hành vi, tôi liên kết thuật ngữ này đặc biệt với sách giáo khoa thống kê giới thiệu. Trong bối cảnh này, sự khác biệt là:

  • Thống kê mô tả là các chức năng của dữ liệu mẫu thực sự thú vị trong việc mô tả một số tính năng của dữ liệu. Thống kê mô tả cổ điển bao gồm trung bình, tối thiểu, tối đa, độ lệch chuẩn, trung vị, độ lệch, kurtosis.
  • Thống kê suy luận là một chức năng của dữ liệu mẫu hỗ trợ bạn rút ra một suy luận liên quan đến một giả thuyết về một tham số dân số. Thống kê suy luận cổ điển bao gồm z, t, , tỷ lệ F, v.v.χ2

Điểm quan trọng là bất kỳ thống kê, suy luận hoặc mô tả, là một chức năng của dữ liệu mẫu. Tham số là một hàm của dân số, trong đó thuật ngữ dân số giống như nói quá trình tạo dữ liệu cơ bản.

Từ quan điểm này, trạng thái của một chức năng nhất định của dữ liệu là một thống kê mô tả hoặc suy luận phụ thuộc vào mục đích mà bạn đang sử dụng nó.

Điều đó nói rằng, một số thống kê rõ ràng hữu ích hơn trong việc mô tả các tính năng có liên quan của dữ liệu và một số thống kê rất phù hợp để hỗ trợ suy luận.

  • Thống kê suy luận: Thống kê kiểm tra tiêu chuẩn như t và z, đối với quy trình tạo dữ liệu nhất định, trong đó giả thuyết null là sai, giá trị mong đợi bị ảnh hưởng mạnh bởi kích thước mẫu. Hầu hết các nhà nghiên cứu sẽ không thấy số liệu thống kê như ước tính một tham số dân số về lợi ích nội tại.
  • Thống kê mô tả : Ngược lại, thống kê mô tả làm ước tính các tham số dân số thường là lợi ích nội tại. Ví dụ, giá trị trung bình mẫu và độ lệch chuẩn cung cấp các ước tính của các tham số dân số tương đương. Ngay cả các thống kê mô tả như tối thiểu và tối đa cũng cung cấp thông tin về các thông số dân số tương đương hoặc tương tự, mặc dù tất nhiên trong trường hợp này, cần phải chăm sóc nhiều hơn nữa. Hơn nữa, nhiều số liệu thống kê mô tả có thể bị sai lệch hoặc ít hơn các công cụ ước tính lý tưởng. Tuy nhiên, họ vẫn có một số tiện ích trong việc ước tính một tham số dân số quan tâm.

Vì vậy, từ quan điểm này, những điều quan trọng để hiểu là:

  • thống kê : chức năng của dữ liệu mẫu
  • tham số : chức năng của dân số (quá trình tạo dữ liệu)
  • công cụ ước tính : chức năng của dữ liệu mẫu được sử dụng để cung cấp ước tính của một tham số
  • suy luận : quá trình đi đến kết luận về một tham số

Do đó, bạn có thể xác định sự khác biệt giữa mô tả và suy luận dựa trên ý định của nhà nghiên cứu sử dụng thống kê hoặc bạn có thể xác định một thống kê dựa trên cách sử dụng thông thường.


Làm thế nào là nó chứng minh lời kêu gọi t hoặc F điểm (chứ không phải là ví dụ T- test ) thống kê suy luận?
jona

@jona Điểm t là "thống kê" được sử dụng trong bài kiểm tra t, do đó người ta có thể mô tả điểm t là một thống kê suy luận khi được sử dụng như một phần của quá trình suy luận như vậy. Tôi đoán tôi đã bắt đầu với giả định rằng một thống kê là một chức năng của dữ liệu. Nhưng có lẽ bạn đang ám chỉ đến điểm mà chúng ta thường nghĩ về thống kê suy luận là tập hợp rộng hơn các kỹ thuật được sử dụng để suy luận?
Jeromy Anglim

Hãy để tôi diễn đạt nó theo cách khác - không phải là thống kê t mô tả mẫu, chứ không phải là tuyên bố suy luận (chẳng hạn như giá trị p)?
jona

Vâng, một chức năng của dữ liệu tương đương với mô tả của một mẫu. Tôi đoán rằng tôi đã nghĩ rằng các số liệu thống kê như vậy được sử dụng trong một quá trình suy luận (ví dụ: các nhà nghiên cứu liên kết thống kê t với phân phối t để có giá trị p và sau đó liên kết p với alpha để rút ra suy luận). Tôi thường thấy sách giáo khoa sử dụng những ví dụ này. Nhưng tôi cho rằng giá trị p và suy luận nhị phân có thể được xem như là số liệu thống kê (nghĩa là các hàm của dữ liệu mẫu). Và chính suy luận nhị phân có thể được xem là phù hợp rõ ràng nhất với suy luận. Đó có phải là những gì bạn đang nhận được?
Jeromy Anglim

1
Vì vậy, ví dụ, bạn sử dụng dữ liệu để đến t có liên quan đến phân phối, cung cấp cho bạn p , từ đó mang lại một suy luận nhị phân về một tham số dân số. Vì vậy, từ quan điểm thường xuyên, t, p và suy luận nhị phân đều là các biến ngẫu nhiên. Tất cả đều tham gia vào quá trình suy luận. Tôi không chắc những ưu và nhược điểm của việc dán nhãn tất cả hoặc chỉ một số thống kê như là suy luận.
Jeromy Anglim

8

Một dạng suy luận dựa trên sự phân công ngẫu nhiên các phương pháp điều trị thử nghiệm, & không dựa trên việc lấy mẫu ngẫu nhiên từ dân số (thậm chí theo giả thuyết). Oscar Kempthorne là một người ủng hộ.

MộtBtt10/252= =0,04

Dự đoán là một lĩnh vực khác mà bạn không nhất thiết phải đưa ra các đề xuất về dân số. (Tôi không biết rằng mọi người đều muốn gọi dự đoán là "suy luận", nhưng có Geisser (1993), Suy luận dự đoán: Giới thiệu ). Thường dự đoán theo mô hình dân số được trang bị, nhưng không phải lúc nào cũng vậy; ví dụ: ví dụ phân loại của @ Matt, tính trung bình của mô hình (Bayes hoặc dựa trên trọng số Akaike) hoặc các thuật toán dự báo như làm mịn theo cấp số nhân.

NB Tôi nghĩ rằng "thống kê suy luận so với mô tả" thường đề cập đến Thống kê kỷ luật hơn là số lượng tính toán từ các mẫu. Không có sự khác biệt cơ bản giữa một thống kê suy luận & mô tả; như @Jeremy đã chỉ ra, vấn đề là bạn sử dụng nó vào mục đích gì.


2

Tôi không chắc rằng phân loại nhất thiết phải đưa ra tuyên bố về (các) dân số mà từ đó các điểm dữ liệu được rút ra. Phân loại, như bạn có thể biết, sử dụng dữ liệu huấn luyện bao gồm một số vectơ "tính năng", mỗi vectơ được gắn nhãn với một lớp cụ thể, để dự đoán các nhãn lớp thuộc các vectơ đặc trưng không được gắn nhãn khác. Ví dụ: chúng tôi có thể sử dụng các dấu hiệu sinh tồn của bệnh nhân và chẩn đoán của bác sĩ để dự đoán liệu các bệnh nhân khác khỏe mạnh hay ốm yếu.

P(lớp học= =c|Tính năng, đặc điểm)c

Tuy nhiên, các phân loại khác tìm kiếm sự khác biệt giữa các lớp mà không tự mô hình hóa các lớp; chúng được gọi là phân loại phân biệt đối xử. Một ví dụ kinh điển là trình phân loại lân cận gần nhất, gán một ví dụ chưa được gắn nhãn cho lớp của hàng xóm gần nhất của nó (trong đó đóng được xác định theo một cách hợp lý nào đó cho vấn đề). Điều này dường như không chứa nhiều thông tin về các quần thể mà các điểm dữ liệu được rút ra.

t


0

Trong một dòng, được cung cấp dữ liệu, thống kê mô tả cố gắng tóm tắt nội dung dữ liệu của bạn với sự mất thông tin tối thiểu (tùy thuộc vào biện pháp bạn sử dụng). Bạn có thể xem địa lý của dữ liệu. (Một cái gì đó giống như, xem biểu đồ hiệu suất của lớp và cho biết ai ở trên cùng, dưới cùng và vv)

Trong một dòng, được cung cấp dữ liệu, bạn cố gắng ước tính và suy ra các thuộc tính của dân số giả thuyết mà dữ liệu đến từ đó. (Một cái gì đó giống như, hiểu học sinh lớp 7 thông qua mẫu tốt từ lớp, giả sử rằng dân số cơ bản đủ lớn để bạn không thể tính đến chúng trong tổng số)


3
Tôi không nghĩ đó là một định nghĩa hoặc đặc trưng của thống kê mô tả mà họ nhắm đến việc mất thông tin tối thiểu. Hoàn toàn có thể có các số liệu thống kê mô tả mà bỏ qua chi tiết thực sự quan trọng và đó thường là một vấn đề.
Nick Cox

0

Nói ngắn gọn

Thống kê mô tả là phân tích dữ liệu mô tả, hiển thị hoặc tóm tắt dữ liệu một cách có ý nghĩa; nó chỉ đơn giản là một cách để mô tả dữ liệu của chúng tôi / nói về toàn bộ dân số. một số trong số đó là các biện pháp của xu hướng trung tâm và Biện pháp phân tán

Thống kê suy luận là kỹ thuật cho phép chúng tôi sử dụng các mẫu để tổng quát hóa về các quần thể mà từ đó các mẫu được rút ra. Thử nghiệm giả thuyết mẫu và


0

thống kê mô tả là phân tích dữ liệu mô tả, hiển thị hoặc tóm tắt dữ liệu một cách có ý nghĩa; nó chỉ đơn giản là một cách để mô tả dữ liệu của chúng tôi / nói về toàn bộ dân số. một số trong số đó là các biện pháp của xu hướng trung tâm và Biện pháp phân tán

Thống kê suy luận là kỹ thuật cho phép chúng tôi sử dụng các mẫu để tổng quát hóa về các quần thể mà từ đó các mẫu được rút ra. Ví dụ thử nghiệm giả thuyết và chia sẻ câu trả lời này


Chào mừng bạn đến với Xác thực chéo ! Xin vui lòng dành một chút thời gian để xem tour du lịch của chúng tôi . Có vẻ như bạn sắp hoàn thành một câu trả lời tốt nhưng điều gì đó đã xảy ra. hãy chỉnh sửa câu trả lời của bạn để hoàn thành suy nghĩ của bạn. Bạn cũng có thể muốn cải thiện câu trả lời của mình bằng cách thêm vào trích dẫn / tài liệu tham khảo cộng tác với những gì bạn đã đặt ở đây. Bạn cũng cần trả lời câu hỏi "Có ví dụ nào về thống kê suy luận không đưa ra các đề xuất về dân số không?"
Tavrock
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.