Một biến đổi để thay đổi xiên mà không ảnh hưởng đến kurtosis?


11

Tôi tò mò liệu có một biến đổi nào làm thay đổi độ lệch của một biến ngẫu nhiên mà không ảnh hưởng đến sự suy yếu. Điều này tương tự như cách biến đổi affine của RV ảnh hưởng đến giá trị trung bình và phương sai, nhưng không phải là độ lệch và kurtosis (một phần vì độ lệch và kurtosis được xác định là bất biến đối với thay đổi về quy mô). Đây có phải là một vấn đề được biết đến?


Bạn có yêu cầu độ lệch chuẩn không đổi với chuyển đổi này không?
russellpierce

không, tôi hy vọng nó sẽ không, nhưng sự suy yếu quá mức sẽ vẫn cố định. Tuy nhiên, tôi mong đợi sự biến đổi là đơn điệu, và tốt nhất là mang tính quyết định.
shabbychef

1
Yike - Khốn cho người muốn chứng minh một chức năng không xác định là đơn điệu.
russellpierce

Câu trả lời:


6

Câu trả lời của tôi là sự khởi đầu của một vụ hack hoàn toàn, nhưng tôi không biết về bất kỳ cách thiết lập nào để làm những gì bạn yêu cầu.

Bước đầu tiên của tôi là xếp hạng thứ tự tập dữ liệu của bạn, bạn có thể tìm vị trí tỷ lệ trong tập dữ liệu của mình và sau đó chuyển đổi nó thành phân phối bình thường, phương pháp này được sử dụng trong Reynolds & Hewitt, 1996. Xem mã R mẫu dưới đây trong PROCMiracle.

Một khi sự phân phối là bình thường, thì vấn đề đã được bật lên - vấn đề điều chỉnh kurtosis nhưng không bị lệch. Một tìm kiếm trên google cho thấy rằng người ta có thể làm theo các quy trình của John & Draper, 1980 để điều chỉnh sự suy yếu nhưng không bị lệch - nhưng tôi không thể sao chép kết quả đó.

Những nỗ lực của tôi để phát triển hàm phân tán / thu hẹp thô lấy giá trị đầu vào (chuẩn hóa) và cộng hoặc trừ một giá trị từ nó tỷ lệ với vị trí của biến trên thang đo thông thường sẽ dẫn đến điều chỉnh đơn điệu, nhưng trong thực tế có xu hướng tạo ra một phân phối lưỡng kim mặc dù một phân phối có giá trị độ lệch và kurtosis mong muốn.

Tôi nhận ra đây không phải là một câu trả lời hoàn chỉnh, nhưng tôi nghĩ nó có thể cung cấp một bước đi đúng hướng.

PROCMiracle <- function(datasource,normalrank="BLOM")
  {
     switch(normalrank,
      "BLOM" = {
                  rmod <- -3/8
                  nmod <- 1/4
                },
      "TUKEY" = {
                  rmod <- -1/3
                  nmod <- 1/3
                },
      "VW" ={
                  rmod <- 0
                  nmod <- 1
            },
      "NONE" = {
                  rmod <- 0
                  nmod <- 0
                }
    )
    print("This may be doing something strange with NA values!  Beware!")
    return(scale(qnorm((rank(datasource)+rmod)/(length(datasource)+nmod))))
  }

Tôi đã từng làm một cái gì đó như thế này: xếp hạng, sau đó sử dụng biến đổi g-and-h để có được một sự xáo trộn và sai lệch cố định. Tuy nhiên, kỹ thuật này giả định rằng tôi thực sự biết về sự suy giảm dân số mà tôi có thể ước tính, nhưng tôi quan tâm, về mặt triết học, nếu có một biến đổi bảo tồn sự suy yếu mà không cần tôi phải biết đó là gì ...
shabbychef

@shabbychef: Ồ, vậy thì xin lỗi vì đã không thêm bất cứ điều gì mới. Tuy nhiên, bạn đã thêm một cái gì đó mới, tôi đã không nghe nói về công thức g-and-h trước đây. Bạn có một trích dẫn truy cập tự do cung cấp nó? Tôi tình cờ đọc được một tờ giấy với cách viết ra ( fic.wharton.upenn.edu/fic/ con / 02 / 0225.pdf ) nhưng khái niệm này hơi xa lạ với tôi )? Tôi đã thử nó như thế này ... nhưng kết quả có vẻ kỳ lạ ... a + b * (e ^ g ^ z-1) * (exp ((h * z ^ 2) / 2) / g).
russellpierce

1
@drnexus: Tôi không muốn thiên vị kết quả bằng cách đề cập đến kỹ thuật của tôi. Tôi đã học về phân phối g-and-h và g-and-k từ Haynes et. al, dx.doi.org/10.1016/S0378-3758(97)00050-5 và Fisher & Klein, econstor.eu/bitstream/10419/29578/1/614055873.pdf
shabbychef

1

Một kỹ thuật thú vị khác có thể xuất hiện trong đầu, mặc dù điều này không trả lời được câu hỏi, là biến đổi một mẫu để có một mẫu L-xiên và L-kurtosis mẫu cố định (cũng như trung bình và thang đo L cố định). Bốn ràng buộc này là tuyến tính trong thống kê thứ tự. Để giữ biến đổi đơn điệu trên một mẫu của các quan sát sau đó sẽ cần một phương trình . Điều này sau đó có thể được đặt ra như một vấn đề tối ưu hóa bậc hai: giảm thiểun - 1 2nn12định mức giữa thống kê đơn hàng mẫu và phiên bản được chuyển đổi theo các ràng buộc đã cho. Đây là một cách tiếp cận lập dị Trong câu hỏi ban đầu, tôi đang tìm kiếm một cái gì đó cơ bản và cơ bản hơn. Tôi cũng đang ngầm tìm kiếm một kỹ thuật có thể được áp dụng cho các quan sát riêng lẻ, không phụ thuộc vào toàn bộ các mẫu.


0

Tôi thà mô hình hóa tập dữ liệu này bằng phân phối leptokurtic thay vì sử dụng biến đổi dữ liệu. Tôi thích bản phân phối sinh-arcsinh từ Jones và Pewsey (2009), Biometrika.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.