Làm thế nào để mô tả số liệu thống kê trong một câu?


27

Khi tôi lần đầu tiên bắt đầu học thống kê, các quy trình như kiểm tra t, ANOVA, hồi quy chi bình phương và hồi quy tuyến tính mỗi lần xuất hiện là những sinh vật rất khác nhau. Nhưng bây giờ tôi nhận ra các thủ tục này từng làm ít nhiều cùng một điều. Và tương tự, các giá trị như phương sai, số dư, sai số chuẩn và giá trị trung bình cũng đo lường ít nhiều cùng một thứ.

Vì vậy, tôi nghĩ tất cả các thủ tục và giá trị này, và thực sự là tất cả các số liệu thống kê, có thể được mô tả chỉ trong một câu đơn giản:

Giá trị mong đợi là gì và sự thay đổi xung quanh giá trị này là gì?

Từ dự kiến ​​có thể được thay thế bằng bất kỳ từ nào trong số này: giả thuyết, dự đoán hoặc trung tâm.

Làm thế nào những người khác mô tả số liệu thống kê trong một câu?


10
@Trynna Sự mô tả này là xa quá hẹp: nó đặc trưng chỉ ước lượng điểm. Nó giống như mô tả toán học như thêm và nhân số - rất có thể là viễn cảnh của một người đã học số học trong một vài năm ở trường - nhưng lại thua xa những gì lĩnh vực này bao gồm.
whuber

Câu trả lời:


26

Thống kê cung cấp lý do và phương pháp để sản xuất và hiểu dữ liệu.

Hiệp hội thống kê Mỹ


+1 Tôi đã cố gắng đưa ra một biểu hiện của một cái gì đó rất gần với khái niệm này. Tôi đã thêm một cái gì đó về việc đi đến kết luận trên cơ sở dữ liệu, nhưng nó không hoàn toàn ngắn gọn.
Glen_b -Reinstate Monica

3
@Glen Bạn có thể nói rằng rất nhiều suy nghĩ đã được đưa vào đặc tính này. Tôi thích có nó ở đây ở đâu đó trên trang web của chúng tôi. Điều đó, và một mô tả tương tự về học máy, nên thuộc về các trang trợ giúp của chúng tôi.
whuber

2
Tôi không chắc chắn tôi đồng ý với trích dẫn (mặc dù đó là một khát vọng đáng yêu). Là một nhà dịch tễ học, tôi biết rằng tôi biết những điều về thiết kế nghiên cứu và sản xuất dữ liệu và suy luận nguyên nhân xung quanh cùng nằm ngoài ken của nhiều nhà thống kê tốt xung quanh tôi. Thật vậy, suy luận nhân quả ưa thích cho đồ thị nhân quả đệ quy bắt nguồn từ ba lĩnh vực không được đặt tên thống kê (dịch tễ học, khoa học máy tính và xã hội học, như tôi hiểu). Không nêu lên điều này trong một tinh thần hiếu chiến, nhưng vì câu trích dẫn mô tả phần lớn khoa học , và không làm giảm số liệu thống kê mỗi se .
Alexis

3
Mô tả ASA nói nhiều về thống kê như là một lĩnh vực của kiến ​​thức và hoạt động của con người, không đánh dấu ai là "nhà thống kê". Cho đến khi các nhà thống kê chuyên nghiệp WW2 là rất hiếm, nhưng điều đó không có nghĩa là số liệu thống kê không được áp dụng trong môi trường thương mại và học thuật. Tôi không nghĩ rằng một định nghĩa tốt về thống kê có thể bị giới hạn trong những gì các nhà thống kê chuyên nghiệp làm.
Cá bạc

1
@Alexis Có lẽ có một số khó khăn với mức độ hiểu được ngụ ý bởi từ "hiểu", mà định nghĩa ASA để lại khá mơ hồ trong sự ngắn gọn của nó. Một cách giải thích rộng hơn có thể là bao quát quá mức. Chắc chắn nếu chúng ta bao gồm sự diễn giải thực tế hoặc xã hội và các cơ chế cơ bản như là một phần của "sự hiểu biết", thì nó vượt xa các thống kê "đơn thuần". Mặt khác, tôi không rõ tại sao suy luận từ dữ liệu, nguyên nhân hay nói cách khác, không thể nằm trong các lĩnh vực của cả nỗ lực khoa học và thống kê.
Cá bạc

13

Thống kê về cơ bản liên quan đến sự hiểu biết về cấu trúc trong dữ liệu.

Bill Venables và Brian Ripley, câu đầu tiên trong Chương 1 của Thống kê ứng dụng hiện đại với S


1
Đây là một cách thú vị về số liệu thống kê, mặc dù hạn chế. Sự mơ hồ có thể đang bộc lộ: một nhà khoa học máy tính sẽ hiểu "cấu trúc dữ liệu" theo cách không thống kê. (Venables và Ripley làm việc tại giao điểm của thống kê và điện toán.)
whuber

@whuber Tôi đồng ý với bạn. Không có gì để gợi ý rằng V & R dự định nó là một mô tả một câu cho tất cả các số liệu thống kê, nhưng kể từ lần đầu tiên tôi đọc nó, tôi đã nghĩ rằng đó là một mô tả hay. Tôi hiểu "cấu trúc trong dữ liệu" là "đặc điểm của dân số mà từ đó mẫu được lấy".
đánh dấu999

10

Thống kê cung cấp lý do và phương pháp để chuyển đổi dữ liệu thành thông tin có ý nghĩa.



5

Cá nhân, tôi thích câu trích dẫn sau đây của Stephen Senn trong Daging with death. Cơ hội, rủi ro và sức khỏe (Nhà xuất bản Đại học Cambridge, 2003). Tôi nhấn mạnh một câu (hoặc hai) rằng, tôi tin rằng, tóm tắt ý chính của anh ấy, mặc dù toàn bộ đoạn văn rất đáng đọc.

Thống kê được và thống kê là.
Thống kê, số ít, trái với nhận thức phổ biến, không thực sự về các sự kiện; đó là về cách chúng ta biết, hoặc nghi ngờ hoặc tin rằng một cái gì đó là sự thật. Bởi vì biết về những điều liên quan đến việc đếm và đo lường chúng, nên, sự thật là số nhiều số liệu thống kê là một phần của mối quan tâm của số ít thống kê, là khoa học của lý luận định lượng. Khoa học này có nhiều điểm chung với triết học (đặc biệt là nhận thức luận) so với kế toán. Các nhà thống kê là những triết gia ứng dụng. Các triết gia tranh luận có bao nhiêu thiên thần có thể nhảy múa trên đầu một cây kim; các nhà thống kê đếm chúng. Hay đúng hơn, đếm có bao nhiêu có thể nhảy.Xác suất là trái tim của vật chất, trái tim của mọi vật chất nếu các nhà vật lý lượng tử có thể tin được. Theo như các nhà thống kê liên quan thì điều này là đúng, liệu thế giới có mang tính quyết định nghiêm ngặt như Einstein tin hay liệu có một sự bất định không thể bỏ qua còn sót lại. Chúng ta có thể dự đoán không có gì một cách chắc chắn nhưng chúng ta có thể dự đoán mức độ không chắc chắn của chúng ta sẽ dự đoán, trung bình là như vậy. Thống kê là khoa học cho chúng ta biết làm thế nào.


5

Thống kê là khoa học học hỏi từ dữ liệu và đo lường, kiểm soát và truyền đạt sự không chắc chắn.

Marie Davidian và Thomas Louis

Họ tiếp tục:

; và do đó nó cung cấp sự điều hướng thiết yếu để kiểm soát tiến trình khoa học và xã hội


Tôi thích định nghĩa này vì nó chỉ ra khía cạnh "không chắc chắn". Phần thứ hai là tốt bởi vì nó nói rằng số liệu thống kê không chỉ tồn tại mà còn phải được nhìn thấy trong một bối cảnh rộng lớn hơn. Tuy nhiên, để hoàn toàn hài lòng, có lẽ tôi sẽ hợp nhất điều đó với ASA để:
Momo

1
Thống kê như khoa học học từ dữ liệu và đo lường, kiểm soát và truyền đạt sự không chắc chắn cung cấp lý do và phương pháp để sản xuất và hiểu dữ liệu.
Momo

2

Thống kê là một bộ bao gồm các phương pháp và phương thức suy nghĩ giúp mọi người đưa ra kết luận rõ ràng từ thông tin ồn ào.


2

Bởi vì chúng tôi không phải là một sinh vật hiểu biết toàn diện, chúng tôi phải đối phó với sự không chắc chắn và Thống kê cung cấp các phương pháp để kết hợp và phản ánh sự không chắc chắn đó.


2

thống kê là một lĩnh vực triết học liên quan đến câu hỏi sau đây 'cách chúng ta học hỏi từ các quan sát' bằng cách sử dụng các khái niệm toán học nghiêm ngặt.

chỉ cần một ghi chú bên cạnh là bạn có thể tạo ra 'một câu' rất dài, có một cuốn sách được viết bởi B. Hrabal bao gồm một câu dài, xem: Bài học khiêu vũ cho sự tiến bộ trong thời đại


2

Thống kê là cả khoa học về sự không chắc chắn và công nghệ trích xuất thông tin từ dữ liệu

David J. Tay


2

Thống kê là một tập hợp các nguyên tắc logic và phương pháp toán học để tóm tắt thông tin được định lượng theo những cách chính xác, phù hợp.


1

Theo lời của tôi

Statistics is the science of what might be

Đây là loại lưỡi trong má .


1
Nếu bạn che dấu từ đầu tiên và yêu cầu mọi người điền vào chỗ trống, tôi nghi ngờ "số liệu thống kê" sẽ không phải là điều đầu tiên họ nghĩ ra - và có lẽ cũng không phải là thứ hai hay thứ ba. "Futurology", "đầu cơ", "khoa học viễn tưởng" và có thể - tiến gần hơn một chút đến ý định của bạn - "dự đoán" và "dự báo" - có thể sẽ là những lựa chọn phổ biến. Ngay cả "chủ nghĩa duy nhất" và "chủ nghĩa khải huyền" cũng sẽ là những khả năng. :-)
whuber

1

Fisher ( 1922 ) đã đưa ra quan điểm của mình về bản chất của số liệu thống kê trong đoạn trích sau (phông chữ đậm được tôi thêm vào cho yêu cầu một câu ):

Để đi đến một công thức riêng biệt của các vấn đề thống kê, cần xác định nhiệm vụ mà nhà thống kê tự đặt ra: một cách ngắn gọn và ở dạng cụ thể nhất, đối tượng của phương pháp thống kê là giảm dữ liệu . Một lượng dữ liệu, thường là số lượng lớn không có khả năng xâm nhập vào tâm trí, sẽ được thay thế bằng một số lượng tương đối đại diện cho toàn bộ, hay nói cách khác, sẽ chứa càng nhiều càng tốt, lý tưởng là toàn bộ , của các thông tin liên quan có trong dữ liệu gốc.


0

Đối với tôi, một lớp lót định hướng kết quả (và không thực sự mô tả ) sẽ là

Thống kê là những gì làm cho thế giới loài người đi vòng quanh, bất kể những gì giống với thiên nhiên.


3
Bạn có nhầm lẫn thống kê với chính trị? Hay có thể với tình yêu?
whuber

@whuber (+1) Không. Cả hai đưa ra hầu hết các quyết định của mình dựa trên Thống kê, cho dù họ có nhận ra hay không.
Alecos Papadopoulos

2
Tôi có thể thấy điều đó ngay bây giờ, trong một bộ phim sắp tới, khi nam chính quỳ xuống cầu hôn: "Em yêu, anh là UMVUE của em, anh sẽ cưới em chứ?" :-) (Hãy sử dụng công cụ ước tính độ co rút và kết hợp các hệ số của chúng tôi với nhau ...)
whuber

@whuber (+2) ... đây là phần "không nhận ra": đây chính xác là ý nghĩa của vai nam chính , mặc dù anh ta không sử dụng ngôn ngữ! (Tôi thừa nhận rằng tôi có thể phạm tội của chủ nghĩa đế quốc triết học ở đây).
Alecos Papadopoulos

2
Nền tảng văn hóa đáng kính của bạn (trong chừng mực như tên và địa điểm của bạn cho phép người ta suy ra nó), mà người ta có thể truy ngược lại ít nhất là cho các Học giả đầu tiên, cho phép bạn có một chút vĩ độ trong vấn đề đó. :-)
whuber

0

Thống kê là một công cụ để mô hình hóa việc tạo dữ liệu bằng các quy trình không chắc chắn và / hoặc xác suất.


-1

Thống kê là về việc tra tấn dữ liệu đủ lâu cho đến khi nó thú nhận bất cứ điều gì bạn muốn hiển thị.

Tôi đang diễn giải Ronald Coase, xem link


-1, điều này có ý định như lưỡi trong má?
gung - Tái lập Monica

@gung có và không, tôi đã trích dẫn Ronald Coase.
Vladislavs Dovgalecs

3
Dựa trên phiên bản ở đây , nó ít nhất là một cách diễn đạt xấu. Đó không phải là một bản tóm tắt 1 câu hay về thống kê là gì.
gung - Tái lập Monica

3
@gung tốt, OP hỏi mọi người sẽ mô tả nó như thế nào. Nó sẽ luôn luôn là quan điểm hoặc ý kiến ​​của anh ấy hoặc cô ấy. Nó sẽ khác nhau cho những người khác nhau. OP đã cố gắng thu thập các ý kiến ​​khác nhau IMHO.
Vladislavs Dovgalecs

2
xeon sẽ là một điều tốt đẹp đối với Coase để chỉnh sửa câu trả lời của bạn để trích dẫn đúng và lấy nguồn quy kết.
Alexis

-2

Thống kê là khoa học toán học cho phép bạn tìm hiểu xem sự khác biệt giữa các bộ quan sát chỉ là ngẫu nhiên hay không.


1
Mô tả một tập hợp con hẹp của trường là gì.
rolando2

Tôi thấy nó khác Cuối cùng, cho dù bạn đang tiến hành kiểm tra giả thuyết, mô hình hồi quy hay bất kỳ ước tính nào khác, bạn luôn luôn đo lường sự khác biệt giữa ước lượng của bạn so với mô hình ngây thơ, hoặc sự khác biệt trong quan sát có ý nghĩa thống kê hay không. Câu của tôi nắm bắt bản chất của ý nghĩa thống kê so với ngẫu nhiên. Nếu những người khác đồng ý, bạn có thể cho tôi một số phiếu bầu không, vì vậy nhận xét dễ hiểu của tôi không được coi là một câu trả lời sai rõ ràng chỉ vì sự giải thích chủ quan của một cá nhân về sự hẹp hòi.
Sympa

2
vui lòng xem xét các loại câu hỏi mà người ta thường tìm cách trả lời bằng cách sử dụng số liệu thống kê: Hình dạng của phân phối này là gì? Bản chất của mối quan hệ giữa 2 biến này là gì? Làm thế nào nhiều biến này có thể được nhóm lại để chúng ta có thể thấy các vấn đề / chủ đề / chủ đề / kích thước phổ biến? Làm thế nào nhiều trường hợp này có thể được nhóm lại để chúng ta có thể thấy các loại / hồ sơ phổ biến? Cách tốt nhất để mô tả mạng lưới các mối quan hệ với một mắt hướng tới quan hệ nhân quả là gì? Điều gì nắm bắt xu hướng của biến này theo thời gian? Cách tốt nhất để dự báo giá trị trong tương lai là gì?
rolando2

Trong mỗi trường hợp đó, câu trả lời cho những câu hỏi đó có yếu tố quan trọng về mặt thống kê và liệu những gì bạn đang nhìn ở bất kỳ hình dạng hoặc hình thức nào có khác biệt so với những gì có thể xảy ra do sự ngẫu nhiên tuyệt đối. Đối với hầu hết chúng ta, một cuộc bỏ phiếu tiêu cực có nghĩa là một câu trả lời sai rõ ràng. Tôi không thấy câu trả lời của tôi có thể được phân loại như vậy.
Sympa

1
Văn bản di chuột qua mũi tên downvote nói "câu trả lời này không hữu ích." Tôi thấy nó thú vị - và do đó không gây khó chịu - bởi vì nó kích thích tư duy, nhưng tôi đã không ủng hộ nó vì nhiều lý do. Đầu tiên là sự khẳng định rằng các số liệu thống kê là một "khoa học toán học": rất gần với quan niệm sai lầm (đặc biệt là trong số các nhà toán học nhất định) rằng các số liệu thống kê chỉ là một nhánh của toán học. Thứ hai là dường như chỉ đặc trưng cho thử nghiệm giả thuyết hai mẫu, đây là một phần rất hẹp (mặc dù có sức lan tỏa) trong thống kê.
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.