Có phải mẫu ngẫu nhiên của người Hồi giáo là người khác


18

Tôi đã phải đối mặt với thời gian khó hiểu ý nghĩa của "mẫu ngẫu nhiên" cũng như "biến ngẫu nhiên iid". Tôi đã cố gắng tìm hiểu ý nghĩa từ một số nguồn, nhưng càng ngày càng bối rối. Tôi đang đăng ở đây những gì tôi đã cố gắng và được biết:

Xác suất & Thống kê của Degroot nói:

Mẫu ngẫu nhiên / iid / Cỡ mẫu: Xem xét phân phối xác suất nhất định trên dòng thực có thể được biểu thị bằng pf hoặc pdf f . Người ta nói rằng n biến ngẫu nhiên X1,...,Xn tạo thành một mẫu ngẫu nhiên từ phân phối này nếu các biến ngẫu nhiên này độc lập và pf hoặc pdf biên của mỗi biến đó là f . Các biến ngẫu nhiên như vậy cũng được cho là độc lập và phân phối giống hệt nhau, viết tắt iid Chúng tôi đề cập đến số n của các biến ngẫu nhiên là kích thước mẫu.

Nhưng một trong những cuốn sách thống kê khác tôi có nói:

Trong Lấy mẫu ngẫu nhiên, chúng tôi đảm bảo rằng mọi đơn vị riêng lẻ trong dân số đều có cơ hội (xác suất) như nhau được chọn.

Vì vậy, tôi có cảm giác rằng iids là các yếu tố xây dựng mẫu ngẫu nhiên và quy trình lấy mẫu ngẫu nhiên là lấy mẫu ngẫu nhiên. Tôi có đúng không

PS: Tôi rất bối rối về chủ đề này, vì vậy tôi sẽ đánh giá cao trả lời công phu. Cảm ơn.


6
Phần độc lập là rất quan trọng bởi vì chúng ta có thể có một mẫu trong đó tất cả các biến được phân phối giống hệt nhau (có cùng phân phối biên) nhưng không độc lập. Một mẫu như vậy vẫn có thể được coi là một mẫu ngẫu nhiên nhưng không phải là thí nghiệm mà bạn nghĩ rằng đó là một mẫu ngẫu nhiên. Xem câu hỏi này .
Dilip Sarwate

Câu hỏi dường như không có ý nghĩa thống kê. Mẫu iid và mẫu ngẫu nhiên là các khái niệm rõ ràng khác biệt được thiết lập bởi các chữ.
Subhash C. Davar

2
@ subhashc.davar Có phải họ không? Theo một định nghĩa: "Một mẫu ngẫu nhiên là một chuỗi các biến ngẫu nhiên độc lập, phân phối giống hệt nhau (IID)". Vì vậy, có vẻ như iid và mẫu ngẫu nhiên là cùng một điều? Đoạn trích dẫn trong Xác suất & Thống kê của Degroot về cơ bản cũng nói như vậy. Tôi thấy khó hiểu vì một "mẫu" đôi khi là một cá nhân hoặc một tập hợp các cá nhân và đôi khi là một chuỗi các biến ngẫu nhiên.
Gary Chang

@Gary Chang Định nghĩa bạn trích dẫn liên quan đến pdf. Các mẫu của các biến ngẫu nhiên đã được phổ biến trong các môn học của tâm lý học. Nói chung, nó được sử dụng với tham chiếu đến độ tin cậy Hoặc ước tính hợp lệ và để phân tích nhân tố. Tâm lý học quan tâm đến việc thiết lập sự tương đương của các bài kiểm tra cho một miền. Khái niệm iid dường như bắt nguồn từ đại số tuyến tính. Một mẫu có thể từ một quần thể cá nhân nhất định và / hoặc từ một quần thể các biến (ngẫu nhiên) tùy thuộc vào mục đích nghiên cứu. Các số liệu thống kê ngày nay dường như đã mượn từ lý thuyết đo lường.
Subhash C. Davar

Câu trả lời:


9

Bạn không nói cuốn sách thống kê khác là gì, nhưng tôi đoán rằng đó là một cuốn sách (hoặc phần) về lấy mẫu dân số hữu hạn .

Khi bạn mẫu biến ngẫu nhiên, tức là khi bạn xem xét một tập của n biến ngẫu nhiên, bạn có biết rằng nếu họ là độc lập, f ( x 1 , ... , x n ) = f ( x 1 ) f ( x n ) và phân phối giống hệt nhau , cụ thể là E ( X i ) = μVar ( X i )X1,Giáo dục,Xnnf(x1,Giáo dục,xn)= =f(x1)f(xn)E(XTôi)= =μ cho tất cả i , sau đó: ¯ X = Σ i X iVar(XTôi)= =σ2Tôi trong đóσ2là thời điểm trung tâm thứ hai.

X¯= =ΣTôiXTôin,E(X¯)= =μ,Var(X¯)= =σ2n
σ2

Lấy mẫu một dân số hữu hạn là hơi khác nhau. Nếu dân số có kích thước , trong lấy mẫu mà không thay thế thì có ( NN mẫu có thểs(Nn) có kích thước n và chúng có thể được trang bị : p ( s i ) = 1STôin Ví dụ, nếuN=5n=3, không gian mẫu là{s1,...,s10} và các mẫu possibile là: s 1 ={1,2,3}, s 2 ={1,2,4}, s 3 ={1,2,5}, s 4

p(STôi)= =1(Nn)Tôi= =1,Giáo dục,(Nn)
N= =5n= =3{S1,Giáo dục,S10} Nếu bạn đếm số lần xuất hiện của mỗi cá nhân, bạn có thể thấy họ là sáu, tức là mỗi cá nhân có số lượng bằng nhau được chọn (6/10). Vì vậy, mỗisilà một mẫu ngẫu nhiên theo định nghĩa thứ hai. Roughly, nó không phải là một mẫu ngẫu nhiên iid bởi vì các cá nhân không phải là biến ngẫu nhiên: bạn luôn có thể ước tínhE[X]theo một mẫu trung bình nhưng sẽ không bao giờ biết giá trị chính xác của nó, nhưng bạncó thểbiết chính xác dân số có nghĩa là nếun=N(hãy tôi nhắc lại: đại khái.)
s1={1,2,3},s2={1,2,4},s3={1,2,5},s4={1,3,4},s5={1,3,5},s6={1,4,5},s7={2,3,4},s8={2,3,5},s9={2,4,5},s10={3,4,5}
siE[X]n=N1

μn<Nμ

y¯s=i=1nyi,E(y¯s)=μ
Var(y¯s)=σ~2n(1nN)
σ~2i=1N(yiy¯)2N1(1n/N)

Đây là một ví dụ nhanh về cách một mẫu ngẫu nhiên (biến ngẫu nhiên) iid và mẫu ngẫu nhiên (dân số hữu hạn) có thể khác nhau. Suy luận thống kê chủ yếu là về lấy mẫu biến ngẫu nhiên, lý thuyết lấy mẫu là về lấy mẫu dân số hữu hạn.


1và đặt một bộ bóng đèn dưới dạng mẫu (biến ngẫu nhiên). Nói bây giờ bạn tìm thấy một hộp 1000 bóng đèn và muốn biết tuổi thọ trung bình của chúng. Bạn có thể chọn một bộ bóng đèn nhỏ (một mẫu dân số hữu hạn), nhưng bạn có thể chọn tất cả chúng. Nếu bạn chọn một mẫu nhỏ, điều này không biến đổi bóng đèn thành các biến ngẫu nhiên: biến ngẫu nhiên được tạo bởi bạn, vì sự lựa chọn giữa "tất cả" và "một bộ nhỏ" tùy thuộc vào bạn. Tuy nhiên, khi dân số hữu hạn rất lớn (giả sử dân số nước bạn), khi chọn "tất cả" là không khả thi, tình huống thứ hai được xử lý tốt hơn như tình huống thứ nhất.


1
Bạn có ý nghĩa gì "cá nhân không phải là biến ngẫu nhiên?" Whuber có một số câu trả lời thực sự hay ở đâyở đây sử dụng lấy mẫu dân số hữu hạn để giải thích khái niệm về một biến ngẫu nhiên.
JSK

n=N

n=N

Phòng ngự? Bạn đã không hiểu những liên kết đó. Như whubner nói, a) mô hình vé trong hộp chỉ là một ví dụ đồ chơi để tránh "đây là công cụ cấp độ sau đại học" phàn nàn; b) anh ta tránh gọi "dân số" vé trong một hộp, và giải thích tại sao. Vì vậy, không có mâu thuẫn . Nếu người ta có thể hiểu những gì whubner đã nói. BTW, tôi không phải là một biến ngẫu nhiên, phải không?
Sergio

IMHO, tất nhiên.
Sergio

2

Tôi sẽ không làm bạn nhàm chán với các định nghĩa và công thức xác suất, mà bạn có thể dễ dàng chọn ở bất kỳ sách giáo khoa nào (hoặc đây là một nơi tốt để bắt đầu)

Tôi.Tôi.d.how

Tôi.Tôi.d ví dụ: rút một thẻ ngẫu nhiên từ một cỗ bài và trả lại (làm điều này 5 lần). Bạn sẽ nhận được 5 giá trị nhận ra (thẻ). Mỗi một trong số các giá trị này xuất phát từ một phân phối đồng đều (có xác suất bằng nhau để có được một trong các kết quả) và mỗi lần rút là độc lập với các kết quả khác (nghĩa là bạn có được một cú đánh trong các lần rút đầu tiên, không ảnh hưởng bằng bất kỳ cách nào kết quả bạn có thể nhận được trong các trận hòa khác).

Tôi.Tôi.d.


1

Biến ngẫu nhiên thường được viết X, là biến có giá trị có thể là kết quả số của một hiện tượng ngẫu nhiên. Hiện tượng ngẫu nhiên có thể tạo ra kết quả có các giá trị số được bắt bởi biến ngẫu nhiên - số lượng đầu trong 10 lần tung đồng xu hoặc thu nhập / chiều cao, v.v. trong một mẫu - nhưng điều đó là không cần thiết.
Nói chung, Biến ngẫu nhiên là một hàm ánh xạ kết quả ngẫu nhiên tới các giá trị số. Ví dụ mỗi ngày có thể có nắng, nhiều mây hoặc mưa. Chúng ta có thể định nghĩa Biến ngẫu nhiên lấy giá trị 1 nếu trời mưa, 2 nếu trời nhiều mây và 3 nếu trời nắng. Miền của một biến ngẫu nhiên là tập hợp các kết quả có thể xảy ra.
Để thiết lập một biến ngẫu nhiên, phải có một quá trình hoặc thử nghiệm có liên quan đến các kết quả có thể không thể dự đoán được một cách chắc chắn.

Bây giờ đến vấn đề độc lập. Hai biến ngẫu nhiên là độc lập nếu giá trị của một trong số chúng không ảnh hưởng đến PDF của cái kia. Chúng tôi không sửa đổi dự đoán của mình về xác suất của các giá trị khác nhau của một biến khi chúng tôi biết điều gì đó về biến khác. Do đó, trong trường hợp độc lập, các tệp PDF Posterior giống hệt với các tệp PDF trước. Ví dụ: khi chúng tôi liên tục tung đồng xu không thiên vị, thông tin chúng tôi có về kết quả của 5 lần tung trước đó không ảnh hưởng đến dự đoán của chúng tôi về việc tung hiện tại, nó sẽ luôn là 0,5. Tuy nhiên, nếu độ lệch của đồng xu không xác định và được mô hình hóa thành Biến ngẫu nhiên, thì kết quả của 5 lần tung trước đó ảnh hưởng đến dự đoán của chúng tôi về việc tung hiện tại vì nó cho phép chúng tôi suy luận về độ lệch chưa biết của đồng xu.

Bây giờ đến vấn đề Lấy mẫu. Mục đích của Lấy mẫu là để thông báo cho chúng tôi về các thuộc tính của phân phối cơ bản không được biết và phải được suy luận. Hãy nhớ rằng Phân phối đề cập đến khả năng tương đối của các kết quả có thể xảy ra trong Không gian mẫu (cũng có thể là Vũ trụ có điều kiện). Vì vậy, khi chúng tôi Mẫu, chúng tôi đã chọn một số lượng kết quả hữu hạn từ Không gian mẫu và chúng tôi tái tạo Không gian mẫu ở quy mô nhỏ dễ quản lý hơn. Xác suất bằng nhau sau đó đề cập đến quá trình Lấy mẫu chứ không phải xác suất Kết quả trong Mẫu. Lấy mẫu xác suất bằng nhau ngụ ý rằng Mẫu sẽ phản ánh tỷ lệ kết quả trong Không gian mẫu ban đầu. Ví dụ: nếu chúng ta hỏi 10, 000 người nếu họ đã từng bị bắt giữ, có thể mẫu mà chúng tôi sẽ kết thúc sẽ không đại diện cho Dân số - Không gian mẫu - vì những người đã bị bắt có thể từ chối trả lời, do đó tỷ lệ kết quả có thể xảy ra (bị bắt - không bị bắt) sẽ khác nhau giữa mẫu của chúng tôi và dân số vì những lý do có hệ thống. Hoặc nếu chúng tôi chọn một khu phố cụ thể để thực hiện khảo sát, kết quả sẽ không đại diện cho Thành phố nói chung. Vì vậy, lấy mẫu xác suất bằng nhau ngụ ý rằng không có lý do có hệ thống - hơn là ngẫu nhiên thuần túy-- khiến chúng tôi tin rằng tỷ lệ kết quả có thể có trong mẫu của chúng tôi khác với tỷ lệ kết quả trong Không gian dân số / Mẫu. do đó, tỷ lệ kết quả có thể xảy ra (bị bắt - không bị bắt) sẽ khác nhau giữa mẫu của chúng tôi và dân số vì những lý do có hệ thống. Hoặc nếu chúng tôi chọn một khu phố cụ thể để thực hiện khảo sát, kết quả sẽ không đại diện cho Thành phố nói chung. Vì vậy, lấy mẫu xác suất bằng nhau ngụ ý rằng không có lý do có hệ thống - hơn là ngẫu nhiên thuần túy-- khiến chúng tôi tin rằng tỷ lệ kết quả có thể có trong mẫu của chúng tôi khác với tỷ lệ kết quả trong Không gian dân số / Mẫu. do đó, tỷ lệ kết quả có thể xảy ra (bị bắt - không bị bắt) sẽ khác nhau giữa mẫu của chúng tôi và dân số vì những lý do có hệ thống. Hoặc nếu chúng tôi chọn một khu phố cụ thể để thực hiện khảo sát, kết quả sẽ không đại diện cho Thành phố nói chung. Vì vậy, lấy mẫu xác suất bằng nhau ngụ ý rằng không có lý do có hệ thống - hơn là ngẫu nhiên thuần túy-- khiến chúng tôi tin rằng tỷ lệ kết quả có thể có trong mẫu của chúng tôi khác với tỷ lệ kết quả trong Không gian dân số / Mẫu.


-2

Một mẫu ngẫu nhiên là một nhận thức của một chuỗi các biến ngẫu nhiên. Những biến ngẫu nhiên có thể là iid hoặc không.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.