Cách KHÔNG sử dụng số liệu thống kê


15

Đây là một loại câu hỏi kết thúc mở nhưng tôi muốn rõ ràng. Với một dân số đủ, bạn có thể học được điều gì đó (đây là phần mở) nhưng bất cứ điều gì bạn học về dân số của mình, khi nào nó có thể áp dụng cho một thành viên của dân số?

Từ những gì tôi hiểu về thống kê, nó không bao giờ có thể áp dụng cho một thành viên trong dân số, tuy nhiên, tôi thường thấy mình trong một cuộc thảo luận về việc người khác đi "Tôi đọc rằng 10% dân số thế giới mắc bệnh này" và tiếp tục kết luận rằng mọi người thứ mười trong phòng đều mắc bệnh này.

Tôi hiểu rằng mười người trong căn phòng này không phải là một mẫu đủ lớn để thống kê có liên quan nhưng rõ ràng là không nhiều.

Sau đó, có điều này về mẫu đủ lớn . Bạn chỉ cần thăm dò một dân số đủ lớn để có được số liệu thống kê đáng tin cậy. Điều này mặc dù, nó không tỷ lệ thuận với sự phức tạp của thống kê? Nếu tôi đo một thứ gì đó rất hiếm, điều đó không có nghĩa là tôi cần một mẫu lớn hơn nhiều để có thể xác định mức độ liên quan của một thống kê như vậy?

Vấn đề là, tôi thực sự đặt câu hỏi về tính hợp lệ của bất kỳ tờ báo hoặc bài báo nào khi có số liệu thống kê, chúng được sử dụng để xây dựng sự tự tin.

Đó là một chút nền tảng.

Quay lại câu hỏi, theo những cách nào bạn KHÔNG thể hoặc bạn KHÔNG thể sử dụng số liệu thống kê để tạo thành một đối số . Tôi phủ nhận câu hỏi vì tôi muốn tìm hiểu thêm về những quan niệm sai lầm phổ biến liên quan đến thống kê.


2
Đây chỉ là một câu trả lời rất riêng, vì vậy tôi sẽ không thực sự đăng nó dưới dạng câu trả lời. Bạn đúng rằng số liệu thống kê phức tạp cần dân số lớn hơn; bạn đang đề cập đến khái niệm "bậc tự do", đơn giản là số lượng biến độc lập trừ đi một biến. Ngoài ra, khi thực hiện một thao tác nào đó như kiểm tra p, ngưỡng từ chối của bạn phụ thuộc vào số bậc tự do bên cạnh giá trị p bạn đã chọn (thường là 0,05).

2
Nếu nhiều người đọc cuốn Cách nói dối những kẻ nói dối của Hooke từ Thống kê , có lẽ sẽ không có nhiều "kẻ hút thống kê" như chúng ta hiện có trên thế giới.
JM không phải là một nhà thống kê

1
Tôi nghĩ rằng bạn có thể có lợi khi đặt câu hỏi này trên thống kê stackexchange - Tôi đã gắn cờ câu hỏi để có thể nó sẽ được chuyển đến đó.
InterestGuest

Tôi thậm chí không biết chúng tôi có một diễn đàn dành riêng cho phân tích thống kê. Tôi sẽ chuyển câu hỏi, Nếu tôi biết cách ...

Câu trả lời:


2

Để đưa ra kết luận về một nhóm dựa trên dân số, nhóm phải đại diện cho dân số và độc lập. Những người khác đã thảo luận về điều này, vì vậy tôi sẽ không tập trung vào tác phẩm này.

Một điều khác cần xem xét là tính không trực giác của xác suất. Giả sử rằng chúng ta có một nhóm gồm 10 người độc lập và đại diện cho dân số (mẫu ngẫu nhiên) và chúng ta biết rằng trong dân số 10% có một đặc điểm riêng. Do đó, mỗi người trong số 10 người có 10% cơ hội có được đặc điểm. Giả định phổ biến là khá chắc chắn rằng ít nhất 1 sẽ có đặc tính. Nhưng đó là một vấn đề nhị thức đơn giản, chúng ta có thể tính xác suất mà không ai trong số 10 có đặc điểm, đó là khoảng 35% (hội tụ đến 1 / e cho nhóm lớn hơn / xác suất nhỏ hơn) cao hơn nhiều so với hầu hết mọi người đoán. Cũng có 26% cơ hội mà 2 người trở lên có đặc điểm.


9

Trừ khi những người trong phòng là một mẫu ngẫu nhiên của dân số thế giới, bất kỳ kết luận nào dựa trên số liệu thống kê về dân số thế giới sẽ rất đáng ngờ. Cứ 5 người trên thế giới thì có một người là người Trung Quốc, nhưng không ai trong số năm người con của tôi là ...


6
  1. Để giải quyết việc áp dụng số liệu thống kê quá mức cho các mẫu nhỏ, tôi khuyên bạn nên đối phó với những câu chuyện cười nổi tiếng ("Tôi rất phấn khích, mẹ tôi lại có thai và anh chị em tôi sẽ là người Trung Quốc." "Tại sao?" là người Trung Quốc. ").

  2. Trên thực tế, tôi khuyên bạn nên nói đùa để giải quyết tất cả các loại quan niệm sai lầm trong thống kê, xem http://xkcd.com/552/ để biết mối tương quan và nguyên nhân.

  3. Vấn đề với các bài báo hiếm khi thực tế là họ đối xử với một hiện tượng hiếm gặp.

  4. Nghịch lý của Simpsons xuất hiện trong ví dụ rằng các số liệu thống kê hiếm khi có thể được sử dụng mà không phân tích nguyên nhân.


2
Biến thể của trò đùa "em bé Trung Quốc" mà tôi đã nghe nói rằng người mẹ tương lai sợ rằng đứa con của mình có thể bị coi là người ngoài hành tinh bất hợp pháp và do đó bị trục xuất ...
JM không phải là một nhà thống kê

3

Có một bài viết thú vị của Mary Grey về việc lạm dụng số liệu thống kê trong các vụ kiện ở tòa án và những điều tương tự ...

Xám, Mary W.; Thống kê và pháp luật. Môn Toán. Mag. 56 (1983), số 2, 67



1

Phân tích thống kê hay dữ liệu thống kê?

Tôi nghĩ ví dụ này trong câu hỏi của bạn liên quan đến dữ liệu thống kê: "Tôi đọc rằng 10% dân số thế giới mắc bệnh này". Nói cách khác, trong ví dụ này, một số người đang sử dụng các số để giúp giao tiếp số lượng hiệu quả hơn là chỉ nói 'nhiều người'.

Tôi đoán là câu trả lời cho câu hỏi của bạn được ẩn giấu trong động lực của người nói về lý do tại sao cô ấy sử dụng số. Nó có thể là để truyền đạt một số khái niệm tốt hơn hoặc có thể là để thể hiện uy quyền hoặc nó có thể làm choáng váng người nghe. Điều tốt về việc nêu rõ các con số thay vì nói 'rất lớn' là mọi người có thể bác bỏ số này. Xem ý tưởng của Popper về từ chối.


0

Một

(Sách giáo khoa) Kết quả:Mộtσ= =c

Mộtσ

Một¬Mộtσ


0

Từ những gì tôi hiểu về thống kê, nó không bao giờ áp dụng cho một thành viên duy nhất trong dân số

Nó không đúng. Nó phụ thuộc vào ứng dụng.

Ví dụ: phân rã hạt nhân trong vật lý. Tốc độ phân rã, xác định xác suất phân rã của từng hạt nhân . Bạn lấy bất kỳ hạt nhân nào và nó sẽ có xác suất phân rã chính xác như nhau, mà bạn đã thiết lập bằng thử nghiệm trên mẫu.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.