Có bất kỳ tài sản định lượng nào của dân số là một tham số của người Cameron không?


13

Tôi tương đối quen thuộc với sự khác biệt giữa các thuật ngữ thống kê và tham số. Tôi thấy một thống kê là giá trị thu được từ việc áp dụng hàm cho dữ liệu mẫu. Tuy nhiên, hầu hết các ví dụ về các tham số liên quan đến việc xác định phân phối tham số. Một ví dụ phổ biến là độ lệch trung bình và độ lệch chuẩn để tham số hóa phân phối chuẩn hoặc hệ số và phương sai lỗi để tham số hóa hồi quy tuyến tính.

Tuy nhiên, có nhiều giá trị khác của phân bố dân số ít nguyên mẫu hơn (ví dụ: tối thiểu, tối đa, bình phương r trong hồi quy bội, lượng tử 0,25, trung vị, số lượng dự đoán có hệ số khác không, độ lệch, số các mối tương quan trong một ma trận tương quan lớn hơn .3, v.v.).

Vì vậy, câu hỏi của tôi là:

  • Bất kỳ tài sản định lượng của dân số nên được dán nhãn "tham số"?
  • Nếu có thì tại sao?
  • Nếu không, những đặc điểm nào không nên được dán nhãn tham số? Những gì họ nên được dán nhãn? Và tại sao?

Xây dựng về sự nhầm lẫn

Bài viết Wikipedia về người ước tính nêu rõ:

"Công cụ ước tính" hoặc "ước tính điểm" là một thống kê (nghĩa là chức năng của dữ liệu) được sử dụng để suy ra giá trị của một tham số chưa biết trong mô hình thống kê.

Nhưng tôi có thể định nghĩa giá trị chưa biết là 0,25 định lượng và tôi có thể phát triển một công cụ ước tính cho ẩn số đó. Tức là, không phải tất cả các thuộc tính định lượng của dân số đều là các tham số giống như cách nói trung bình và sd là các tham số của phân phối bình thường, nhưng việc tìm cách ước tính bất kỳ thuộc tính dân số định lượng nào là hợp pháp.

Câu trả lời:


15

Câu hỏi này đi vào trọng tâm của thống kê là gì và làm thế nào để tiến hành phân tích thống kê tốt. Nó đặt ra nhiều vấn đề, một số thuật ngữ và những lý thuyết khác. Để làm rõ chúng, hãy bắt đầu bằng cách lưu ý bối cảnh ngầm của câu hỏi và tiếp tục từ đó để xác định các thuật ngữ chính "tham số", "tài sản" và "công cụ ước tính". Một số phần của câu hỏi được trả lời khi chúng xuất hiện trong cuộc thảo luận. Phần kết luận cuối cùng tóm tắt các ý chính.

Không gian nhà nước

Một cách sử dụng thống kê phổ biến của "phân phối", như trong "phân phối Bình thường với PDF tỷ lệ thuận với "thực sự là một (nghiêm trọng) lạm dụng tiếng Anh, bởi vì rõ ràng đây không phải là một phân phối: đó là một gia đình toàn bộ các bản phân phốitham sốbởi những biểu tượng L σ Một ký hiệu chuẩn cho. đây là "không gian trạng thái" Ω , mộtbộexp(12(xμ)/σ)2)dxμσΩphân phối. (Tôi đơn giản hóa một chút ở đây vì mục đích giải thích và sẽ tiếp tục đơn giản hóa khi chúng ta đi cùng, trong khi vẫn nghiêm ngặt nhất có thể.) Vai trò của nó là phân định các mục tiêu có thể có của các thủ tục thống kê của chúng tôi: khi chúng tôi ước tính một cái gì đó, chúng tôi đang chọn ra một (hoặc đôi khi nhiều hơn) các yếu tố của .Ω

Đôi khi không gian nhà nước được tham số hóa một cách rõ ràng, như trong . Trong mô tả này, có một sự tương ứng một-một giữa bộ các bộ dữ liệu { ( μ , σ ) } trong nửa mặt phẳng trên và bộ phân phối mà chúng ta sẽ sử dụng để mô hình hóa dữ liệu của mình. Một giá trị của một tham số như vậy là bây giờ chúng ta có thể tham khảo cụ thể để phân phối trong Ω bằng phương tiện của một cặp có thứ tự các số thực.Ω={N(μ,σ2)|μR,σ>0}{(μ,σ)}Ω

Trong các trường hợp khác, không gian trạng thái không được tham số rõ ràng. Một ví dụ sẽ là tập hợp của tất cả các phân phối liên tục không theo phương thức. Dưới đây, chúng tôi sẽ giải quyết câu hỏi liệu có thể tìm thấy một tham số đầy đủ trong các trường hợp như vậy không.

Tham số hóa

Nói chung, một tham số của Ω là một sự tương ứng (toán học chức năng ) từ một tập hợp con của (với d hữu hạn) để Ω . Đó là, nó sử dụng các tập hợp d -tuples được đặt hàng để gắn nhãn cho các bản phân phối. Nhưng đó không chỉ là bất kỳ sự tương ứng nào: nó phải được "cư xử đúng mực". Để hiểu điều này, hãy xem xét tập hợp tất cả các bản phân phối liên tục có tệp PDF có kỳ vọng hữu hạn. Điều này sẽ được coi rộng rãi là "không tham số" theo nghĩa là bất kỳ nỗ lực "tự nhiên" nào để tham số hóa tập hợp này sẽ liên quan đến một chuỗi số thực có thể đếm được (sử dụng một mở rộng trong bất kỳ cơ sở trực giao nào). Tuy nhiên, vì bộ này có cardinality RddΩd , đó là cardinality của số thực, thì phải có một số one-to-one tương ứng giữa các bản phân phối và R . Nghịch lý thay, điều đó dường như làm cho điều này trở thành mộtkhông gian trạng thái đượctham số hóavới mộttham số thựcduy nhất!1R

Nghịch lý được giải quyết bằng cách lưu ý rằng một số thực duy nhất không thể có mối quan hệ "tốt đẹp" với các bản phân phối: khi chúng ta thay đổi giá trị của số đó, trong một số trường hợp, phân phối tương ứng phải thay đổi theo cách triệt để. Chúng tôi loại trừ các tham số hóa "bệnh lý" như vậy bằng cách yêu cầu các phân phối tương ứng với các giá trị đóng của các tham số của chúng phải tự "đóng" với nhau. Thảo luận về các định nghĩa phù hợp về "gần gũi" sẽ đưa chúng ta đi quá xa, nhưng tôi hy vọng mô tả này đủ để chứng minh rằng có nhiều thứ để trở thành một tham số hơn là chỉ đặt tên cho một phân phối cụ thể.

Thuộc tính của phân phối

Thông qua ứng dụng lặp đi lặp lại, chúng ta đã quen với việc nghĩ đến "tài sản" của phân phối là một số lượng dễ hiểu thường xuất hiện trong công việc của chúng ta, chẳng hạn như kỳ vọng, phương sai, v.v. Vấn đề với điều này như một định nghĩa có thể có về "tài sản" là nó quá mơ hồ và không đủ chung chung. (Đây là nơi toán học ở giữa thế kỷ 18, nơi "các hàm" được coi là các quá trình hữu hạn được áp dụng cho các đối tượng.) là một con số đó là duy nhất được gán cho mỗi phân phối tại Ω. Điều này bao gồm giá trị trung bình, phương sai, bất kỳ thời điểm nào, bất kỳ sự kết hợp đại số nào của các khoảnh khắc, bất kỳ lượng tử nào và nhiều hơn nữa, bao gồm cả những thứ thậm chí không thể được tính toán. Tuy nhiên, nó không bao gồm những thứ đó sẽ làm cho không có ý nghĩa đối với một số các yếu tố của . Chẳng hạn, nếu ΩΩΩ bao gồm tất cả các bản phân phối Student t, sau đó giá trị trung bình là không một tài sản có giá trị trong (vì t 1 không có nghĩa). Điều này gây ấn tượng với chúng tôi một lần nữa bao nhiêu ý tưởng của chúng tôi phụ thuộc vào những gì Ω thực sự bao gồm.Ωt1Ω

Thuộc tính không phải luôn luôn là tham số

Một thuộc tính có thể là một hàm phức tạp đến mức nó sẽ không phục vụ như một tham số. Hãy xem xét trường hợp của "Phân phối bình thường." Chúng ta có thể muốn biết liệu giá trị trung bình của phân phối thực, khi được làm tròn đến số nguyên gần nhất, có phải là số chẵn hay không. Đó là một tài sản. Nhưng nó sẽ không phục vụ như là một tham số.

Các tham số không nhất thiết là thuộc tính

Khi các tham số và phân phối nằm trong sự tương ứng một-một thì rõ ràng là bất kỳ tham số nào và bất kỳ chức năng nào của các tham số cho vấn đề đó, là một thuộc tính theo định nghĩa của chúng tôi. Nhưng không cần phải có sự tương ứng một-một giữa các tham số và phân phối: đôi khi một vài phân phối phải được mô tả bằng hai hoặc nhiều giá trị khác nhau của các tham số. Chẳng hạn, một tham số vị trí cho các điểm trên mặt cầu sẽ tự nhiên sử dụng vĩ độ và kinh độ. Điều đó tốt - ngoại trừ ở hai cực, tương ứng với một vĩ độ nhất định và bất kỳ kinh độ hợp lệ nào . Vị trí(điểm trên quả cầu) thực sự là một tài sản nhưng kinh độ của nó không nhất thiết là một tài sản. Mặc dù có nhiều cách tránh khác nhau (ví dụ, chỉ tuyên bố kinh độ của cực bằng 0), vấn đề này làm nổi bật sự khác biệt về khái niệm quan trọng giữa một thuộc tính (được liên kết duy nhất với phân phối) và tham số (đó là cách ghi nhãn phân phối và có thể không phải là duy nhất).

Thủ tục thống kê

Mục tiêu của một ước tính được gọi là một estimand . Nó chỉ đơn thuần là một tài sản. Nhà thống kê không được tự do lựa chọn ước tính: đó là tỉnh của khách hàng của cô. Khi ai đó đến với bạn với một mẫu dân số và yêu cầu bạn ước tính tỷ lệ phần trăm thứ 99 của dân số, bạn có thể sẽ cảm thấy hối hận khi cung cấp công cụ ước tính trung bình thay thế! Công việc của bạn, với tư cách là nhà thống kê, là xác định một quy trình tốt để ước tính ước tính và bạn đã được đưa ra. (Đôi khi công việc của bạn là thuyết phục khách hàng của mình rằng anh ta đã chọn ước lượng sai cho các mục tiêu khoa học của mình, nhưng đó là một vấn đề khác ...)

Theo định nghĩa, một thủ tục là một cách để lấy một số ra khỏi dữ liệu. Các thủ tục thường được đưa ra dưới dạng các công thức được áp dụng cho dữ liệu, như "thêm tất cả chúng và chia cho số lượng của chúng". Theo nghĩa đen bất kỳ thủ tục cũng có thể được phát âm là "công cụ ước tính" của một ước tính nhất định. Ví dụ, tôi có thể tuyên bố rằng giá trị trung bình mẫu (một công thức áp dụng cho dữ liệu) ước tính phương sai quần thể (một tài sản của dân số, giả sử khách hàng của chúng tôi đã giới hạn các thiết lập của các quần thể để chỉ những người thực sự có chênh lệch bao gồm).Ω

Ước tính

Công cụ ước tính không cần có bất kỳ kết nối rõ ràng nào với công cụ ước tính. Chẳng hạn, bạn có thấy bất kỳ mối liên hệ nào giữa trung bình mẫu và phương sai dân số không? Không làm I. Nhưng tuy nhiên, các trung bình mẫu thực sự là một ước lượng phong nha của phương sai quần thể đối với một số Ω (chẳng hạn như các thiết lập của tất cả các bản phân phối Poisson). Đây nằm một chìa khóa để ước lượng sự hiểu biết: phẩm chất của họ phụ thuộc vào các thiết lập của thể trạng . Nhưng đó chỉ là một phần của nó.Ω

Một nhà thống kê có thẩm quyền sẽ muốn biết thủ tục mà họ đề xuất sẽ thực sự tốt như thế nào. Hãy gọi thủ tục là " " và để ước lượng là θ . Không biết mà phân phối thực sự là một sự thật, cô sẽ chiêm nghiệm hoạt động của thủ tục cho mỗi phân phối có thể F Ohm . Do đó một F , và đưa ra bất kỳ có thể kết quả s (có nghĩa là, một tập hợp các dữ liệu), cô sẽ so sánh t ( s ) (những gì ước tính thủ tục của cô) để θ ( F )tθ FΩFst(s)θ(F) (giá trị của estimand cho ). FTrách nhiệm của khách hàng là cho cô ấy biết hai người họ cách nhau hay xa như thế nào. , nguy cơ là một hàm xác định trên Ω . (Điều này thường được thực hiện với một chức năng "mất mát".) Sau đó, cô có thể chiêm ngưỡng kỳ vọng của khoảng cách giữa θ ( F ) . Đây là nguy cơ của thủ tục của cô. Bởi vì nó phụ thuộc vào Ft(s)θ(F)FΩ

(Tốt) các nhà thống kê khuyến nghị các thủ tục dựa trên so sánh rủi ro. Ví dụ, giả sử rằng đối với mỗi , nguy cơ thủ tục t 1 là nhỏ hơn hoặc bằng với nguy cơ của t . Sau đó, không có lý do bao giờ để sử dụng t : đó là "không thể chấp nhận được." Nếu không thì nó là "đáng ngưỡng mộ".FΩt1tt

(Một nhà thống kê "Bayes" sẽ luôn so sánh rủi ro bằng cách lấy trung bình phân phối các trạng thái có thể "trước" (thường được cung cấp bởi khách hàng). Một nhà thống kê "Thường xuyên" có thể làm điều này, nếu như vậy tồn tại một cách chính đáng, nhưng cũng sẵn sàng so sánh rủi ro theo những cách khác Bayes eschew.)

Kết luận

Chúng tôi có quyền để nói rằng bất kỳ có nghĩa là chấp nhận cho θ là một ước lượng của θ . tθθ Chúng ta phải vì mục đích thực tế (vì thủ tục chấp nhận có thể khó tìm), uốn cong này để nói rằng bất kỳ có rủi ro chấp nhận được nhỏ (khi bị so sánh với θ ) trong thủ tục có thể thực hiện là mức ước lượng θtθθ . "Chấp nhận được" và "có thể thực hiện" được xác định bởi khách hàng, tất nhiên: "chấp nhận được" đề cập đến rủi ro của họ và "thực tế" phản ánh chi phí (cuối cùng được họ trả) khi thực hiện thủ tục.

Dưới định nghĩa ngắn gọn này là tất cả các ý tưởng vừa thảo luận: để hiểu nó, chúng ta phải có một ý tưởng cụ thể (là mô hình của vấn đề, quá trình hoặc dân số đang nghiên cứu), một ước lượng xác định (do khách hàng cung cấp), a hàm mất mát cụ thể (kết nối định lượng t với ước tính và cũng được đưa ra bởi khách hàng), ý tưởng về rủi ro (được tính toán bởi nhà thống kê), một số thủ tục so sánh các hàm rủi ro (trách nhiệm của nhà thống kê khi tham khảo ý kiến ​​khách hàng), và ý thức về những thủ tục thực sự có thể được thực hiện (vấn đề "khả thi"), mặc dù không có quy trình nào được đề cập rõ ràng trong định nghĩa.Ωt


2
@Nick Cox, trong bài trả lời của mình, sẽ trả về một số điểm xuất sắc mà (trong việc giải thích của tôi) đi đến "chúng ta làm gì khi chúng ta biết rằng bất kỳ mô hình và bất kỳ chức năng mất chúng tôi chỉ định sẽ được phần nào không chính xác hoặc không đầy đủ?" Câu trả lời cho điều đó sẽ đưa chúng ta theo một hướng khác; tất cả những gì tôi muốn nói ở đây là khuôn khổ mà tôi đã đặt ra - đó là khung cổ điển mà Tukey đã phản ứng - cho chúng ta một cơ sở tốt để suy nghĩ về những câu hỏi phân tích dữ liệu rộng hơn như vậy. Ở mức tối thiểu, nó làm rõ các giả định ngầm định đi vào các thuật ngữ tiêu chuẩn như "công cụ ước tính". Ω
whuber

11

Cũng như nhiều câu hỏi về định nghĩa, câu trả lời cần phải chú ý đến các nguyên tắc cơ bản và về cách sử dụng thuật ngữ trong thực tế, thường có thể ít nhất một chút lỏng lẻo hoặc không nhất quán, ngay cả bởi những cá nhân được thông tin tốt, và hơn thế nữa quan trọng, biến từ cộng đồng này sang cộng đồng khác.

Một nguyên tắc phổ biến là thống kê là một thuộc tính của mẫu và hằng số đã biết và tham số là thuộc tính tương ứng của dân số, và do đó, hằng số chưa biết. Từ "tương ứng" được hiểu là khá co giãn ở đây. Ngẫu nhiên, chính xác sự phân biệt này và chính xác thuật ngữ này chưa đầy một thế kỷ, đã được RA Fisher giới thiệu.

Nhưng

  1. Một tập hợp mẫu và dân số không đặc trưng cho tất cả các vấn đề của chúng ta. Chuỗi thời gian là một lớp ví dụ chính trong đó ý tưởng thay vì quá trình tạo cơ bản, và một cái gì đó giống như được cho là ý tưởng sâu sắc và tổng quát hơn.

  2. Có các thiết lập trong đó các tham số thay đổi. Một lần nữa, phân tích chuỗi thời gian cung cấp các ví dụ.

  3. Về điểm chính ở đây, trên thực tế, chúng ta không nghĩ về tất cả các thuộc tính của dân số hoặc xử lý như các tham số. Nếu một số thủ tục giả định một mô hình phân phối bình thường, thì tối thiểu và tối đa không phải là tham số. (Thật vậy, theo mô hình, mức tối thiểu và tối đa là các số âm và dương lớn tùy ý theo bất kỳ cách nào, không phải điều đó làm chúng tôi lo lắng.)

Tôi muốn nói rằng lần đầu tiên Wikipedia chỉ đúng hướng ở đây, và thực tiễn và nguyên tắc đều được tôn trọng nếu chúng ta nói rằng một tham số là bất cứ điều gì chúng ta đang ước tính .

Điều này cũng giúp với các câu hỏi khác đã gây ra bối rối. Ví dụ: nếu chúng ta tính trung bình cắt giảm 25%, chúng ta đang ước tính điều gì? Một câu trả lời hợp lý là tài sản tương ứng của dân số, có hiệu lực được xác định bằng phương pháp ước tính. Một thuật ngữ là một công cụ ước tính có một ước tính, bất cứ điều gì nó đang ước tính. Bắt đầu với một số ý tưởng Platonic về một tài sản "ngoài kia" (nói chế độ phân phối) và suy nghĩ làm thế nào để ước tính điều đó là hợp lý, như đang nghĩ ra các công thức tốt để phân tích dữ liệu và suy nghĩ về những gì chúng ngụ ý khi được coi là suy luận.

Như thường thấy trong toán học ứng dụng hoặc khoa học, có một khía cạnh gấp đôi cho một tham số. Chúng ta thường nghĩ về nó như một cái gì đó thực sự ngoài kia mà chúng ta đang khám phá, nhưng cũng đúng là nó được xác định bởi mô hình của quá trình của chúng ta, do đó nó không có ý nghĩa gì ngoài bối cảnh của mô hình.

Hai điểm khá khác nhau:

  1. Nhiều nhà khoa học sử dụng từ "tham số" theo cách mà các nhà thống kê sử dụng biến. Tôi có một nhà khoa học nhân cách cũng như một người thống kê, và tôi sẽ nói rằng điều đó thật đáng tiếc. Các biến và thuộc tính là những từ tốt hơn.

  2. Điều khá phổ biến trong sử dụng tiếng Anh rộng hơn là tham số được cho là có nghĩa là giới hạn hoặc giới hạn, có thể xuất phát từ một số nhầm lẫn ban đầu giữa "tham số" và "chu vi".

Một lưu ý về quan điểm ước tính

Vị trí cổ điển là chúng tôi xác định trước một tham số và sau đó quyết định cách ước tính nó, và điều này vẫn là thông lệ, nhưng đảo ngược quá trình không phải là vô lý và có thể hữu ích cho một số vấn đề. Tôi gọi đây là quan điểm ước tính. Nó đã có trong văn học ít nhất 50 năm. Tukey (1962, tr.60) kêu gọi rằng

"Chúng ta phải chú ý nhiều hơn đến việc bắt đầu với một người ước tính và khám phá thế nào là một ước lượng hợp lý, để khám phá điều gì là hợp lý khi nghĩ về người ước tính như là ước tính."

Một quan điểm tương tự đã được Bickel và Lehmann (1975) xây dựng chính thức về chi tiết và chiều sâu đáng kể và phần lớn là sự sáng suốt đáng kể của Mosteller và Tukey (1977, tr.32-34).

Ngoài ra còn có một phiên bản tiểu học. Sử dụng (nói) trung bình mẫu hoặc trung bình hình học để ước tính tham số dân số tương ứng có ý nghĩa bất kể phân phối cơ bản có đối xứng hay không và có thể mở rộng thiện chí tương tự thành (ví dụ) phương tiện cắt tỉa, được coi là ước tính của đối tác dân số của chúng .

Bickel, PJ và EL Lehmann. 1975. Thống kê mô tả cho các mô hình không tham số. II. Địa điểm . Biên niên sử thống kê 3: 1045-1069.

Mosteller, F. và JW Tukey. 1977. Phân tích và hồi quy dữ liệu. Đọc, MA: Addison-Wesley.

Tukey, JW 1962. Tương lai của phân tích dữ liệu . Biên niên sử thống kê toán học 33: 1-67.


Phần lớn điều này xem xét tỷ lệ cược với các tài liệu thống kê tiêu chuẩn, đặc biệt là định nghĩa của bạn về tham số. Nó xuất hiện để làm rối loạn các quá trình tìm kiếm một thủ tục để tính toán một ước tínhxác định những gì sẽ được ước tính. Cái sau - chọn ước lượng - là vấn đề để nhà khoa học hoặc nhà nghiên cứu xác định. Cái trước được nhà thống kê chọn để có các thuộc tính mong muốn trong số tất cả các thủ tục có thể để ước tính ước tính. Ngoài ra còn có vấn đề kỹ thuật; đủ để nói rằng một tham số bị hạn chế hơn một ước lượng tùy ý.
whuber

Tôi sẽ mở rộng câu trả lời của tôi để giải quyết điều này.
Nick Cox

1
Tôi đồng ý với Tukey mặc dù bạn có thể nghĩ từ câu trả lời của tôi cho chủ đề này rằng tôi là một trong những nhà thống kê "bị hóa đá" mà anh ta thách thức. Vấn đề là bạn đã đưa trích dẫn của anh ấy ra khỏi bối cảnh. Tukey đặc biệt giải quyết câu hỏi về cách đánh giá các thuộc tính của các thủ tục "khi các giả thuyết mà chúng được phát triển theo thông lệ không được giữ." Điều này không có cách nào thay đổi định nghĩa của những thứ như tham số, ước tính và ước tính. Cụ thể, một tham số vẫn không phải là "bất cứ điều gì chúng ta đang ước tính."
whuber

3
Nhiều thức ăn cho suy nghĩ ở đây. Như một câu trả lời nhanh: Câu trả lời của tôi không nhằm ám chỉ rằng chúng tôi đang ở Hội trường Tự do, nơi mọi thứ diễn ra. Bối cảnh cho trích dẫn Tukey tôi hoan nghênh, theo quan điểm của tôi là thông thường các giả thuyết thông thường không tồn tại cho đến khi tất cả các mô hình là xấp xỉ không khớp với dữ liệu. Cho đến nay khi cắn, mệnh đề đó nhấn mạnh giá trị của quan điểm khác nhau. Nói chung, tôi không cố gắng, cũng không đủ điều kiện để sản xuất, các định nghĩa chính thức trừu tượng hơn và tinh tế hơn về mặt toán học.
Nick Cox

6


pdf=12πσ2e12(xiμ)2σ2
12π3.1415926e2.718281828Xxi , thì rõ ràng tôi biết rằngμσ2X25th%μσ2μσ2


Y=β0+β1X1+β2X2+εwhere εN(0,σ2)
β0β1β2σ225th%YX=xiβ0β1β2σ2β0β1β2σ2

(Tất nhiên, tất cả các giả định này cho rằng mô hình phân phối dân số hoặc quy trình tạo dữ liệu của tôi là chính xác. Như mọi khi, đáng để nhớ rằng "tất cả các mô hình đều sai, nhưng một số là hữu ích" - George Box .)

Để trả lời câu hỏi của bạn rõ ràng hơn, tôi sẽ nói:

  • Không, bất kỳ định lượng cũ đúng cách không nên được gắn nhãn "tham số".
  • không có
  • Các đặc điểm nên được gắn nhãn "tham số" phụ thuộc vào đặc điểm kỹ thuật mô hình. Tôi không có tên đặc biệt cho các đặc điểm định lượng khác, nhưng tôi nghĩ sẽ ổn nếu gọi chúng là thuộc tính hoặc đặc điểm hoặc hậu quả , v.v.

Cảm ơn. Nhưng thuật ngữ nào bạn sử dụng để mô tả tất cả các giá trị dân số có thể được lấy từ một mô hình tham số nhưng không có trong tập hợp các tham số thuận tiện để biểu diễn mô hình đó? Hoặc, có thể có một trường hợp, trong đó bạn không biết mô hình dân số và không quan tâm đặc biệt, nhưng quan tâm đến một khía cạnh phi tiêu chuẩn cụ thể của mô hình dân số.
Jeromy Anglim

Tôi không có bất kỳ tên đặc biệt thường áp dụng, nhưng có tên cho một số giá trị cụ thể. Ví dụ: nếu bạn không thực sự tin rằng dân số của bạn đủ gần với bất kỳ phân phối nào được nghiên cứu kỹ lưỡng, bạn có thể cố gắng mô tả nó bằng trung vị, tứ phân vị, điểm bản lề, v.v.
gung - Tái lập Monica

3
β0,β1,β2,σθβ0θθθ
whuber

3

Đã có một số câu trả lời tuyệt vời cho câu hỏi này, tôi chỉ nghĩ rằng tôi đã tóm tắt một tài liệu tham khảo thú vị cung cấp một cuộc thảo luận khá nghiêm ngặt về các nhà ước tính.

Trang phòng thí nghiệm ảo trên công cụ ước tính xác định

  • một thống kê là "một chức năng quan sát được của biến kết quả".
  • θ

Khái niệm về chức năng của một phân phối là một ý tưởng rất chung chung. Do đó, mọi ví dụ được cung cấp ở trên có thể được coi là một chức năng của một phân phối nhất định.

  • Mỗi lượng tử, bao gồm min, trung vị, lượng tử thứ 25, max có thể là một hàm của phân phối.
  • Skewness là một chức năng của một phân phối. Nếu phân bố dân số đó là bình thường, thì những giá trị này sẽ bằng 0, nhưng điều đó không ngăn được việc tính toán các giá trị này.
  • Đếm số lượng tương quan lớn hơn một giá trị nhất định là một hàm của ma trận hiệp phương sai, lần lượt là một hàm của phân phối đa biến.
  • R bình phương là một chức năng của phân phối.

1
Một lý do tôi đưa ra một câu trả lời phức tạp hơn là định nghĩa về "tham số" này không đủ tốt. Đối với một ví dụ mẫu, hãy xem nhận xét của tôi về câu trả lời của @ gung . Theo trực giác, một tập hợp các phân phối được tham số hóa tạo thành một đa tạp topo chiều hữu hạn với ranh giới; một tham số phải là một hàm liên tục được xác định trên đa tạp. Đây không chỉ là một yêu cầu kỹ thuật, bởi vì nó liên quan đến phân phối mẫu của các ước tính.
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.