Nó là hợp lệ để so sánh một số cách tiếp cận, nhưng không phải với mục đích chọn một phương pháp ủng hộ mong muốn / tin tưởng của chúng tôi.
Câu trả lời của tôi cho câu hỏi của bạn là: Có thể hai phân phối trùng nhau trong khi chúng có các phương tiện khác nhau, dường như là trường hợp của bạn (nhưng chúng tôi sẽ cần xem dữ liệu và ngữ cảnh của bạn để cung cấp câu trả lời chính xác hơn).
Tôi sẽ minh họa điều này bằng cách sử dụng một vài cách tiếp cận để so sánh các phương tiện thông thường .
1. testt
Xem xét hai mẫu mô phỏng có kích thước từ N ( 10 , 1 ) và N ( 12 , 1 ) , sau đó giá trị t xấp xỉ 10 như trong trường hợp của bạn (Xem mã R bên dưới).70N(10,1)N(12,1)t10
rm(list=ls())
# Simulated data
dat1 = rnorm(70,10,1)
dat2 = rnorm(70,12,1)
set.seed(77)
# Smoothed densities
plot(density(dat1),ylim=c(0,0.5),xlim=c(6,16))
points(density(dat2),type="l",col="red")
# Normality tests
shapiro.test(dat1)
shapiro.test(dat2)
# t test
t.test(dat1,dat2)
Tuy nhiên, mật độ cho thấy sự chồng chéo đáng kể. Nhưng hãy nhớ rằng bạn đang thử nghiệm một giả thuyết về các phương tiện, mà trong trường hợp này rõ ràng là khác nhau nhưng do giá trị của , có sự chồng chéo của mật độ.σ
2. Khả năng hồ sơ của μ
Để biết định nghĩa về khả năng và khả năng của Hồ sơ, vui lòng xem 1 và 2 .
μnx¯Rp( μ ) = điểm kinh nghiệm[ - n ( x¯- μ )2] .
Đối với dữ liệu mô phỏng, chúng có thể được tính bằng R như sau
# Profile likelihood of mu
Rp1 = function(mu){
n = length(dat1)
md = mean(dat1)
return( exp(-n*(md-mu)^2) )
}
Rp2 = function(mu){
n = length(dat2)
md = mean(dat2)
return( exp(-n*(md-mu)^2) )
}
vec=seq(9.5,12.5,0.001)
rvec1 = lapply(vec,Rp1)
rvec2 = lapply(vec,Rp2)
# Plot of the profile likelihood of mu1 and mu2
plot(vec,rvec1,type="l")
points(vec,rvec2,type="l",col="red")
μ1μ2 không trùng nhau ở bất kỳ mức hợp lý nào.
μ sử dụng Jeffreys trước
(μ,σ)
π(μ,σ)∝1σ2
μ
# Posterior of mu
library(mcmc)
lp1 = function(par){
n=length(dat1)
if(par[2]>0) return(sum(log(dnorm((dat1-par[1])/par[2])))- (n+2)*log(par[2]))
else return(-Inf)
}
lp2 = function(par){
n=length(dat2)
if(par[2]>0) return(sum(log(dnorm((dat2-par[1])/par[2])))- (n+2)*log(par[2]))
else return(-Inf)
}
NMH = 35000
mup1 = metrop(lp1, scale = 0.25, initial = c(10,1), nbatch = NMH)$batch[,1][seq(5000,NMH,25)]
mup2 = metrop(lp2, scale = 0.25, initial = c(12,1), nbatch = NMH)$batch[,1][seq(5000,NMH,25)]
# Smoothed posterior densities
plot(density(mup1),ylim=c(0,4),xlim=c(9,13))
points(density(mup2),type="l",col="red")
Một lần nữa, khoảng tin cậy cho các phương tiện không chồng chéo ở bất kỳ mức hợp lý nào.
Tóm lại, bạn có thể thấy tất cả các cách tiếp cận này cho thấy sự khác biệt đáng kể của phương tiện (là lợi ích chính), mặc dù sự chồng chéo của các bản phân phối.
⋆ Một cách tiếp cận khác nhau so sánh
P(X<Y)0.8823825
# Optimal bandwidth
h = function(x){
n = length(x)
return((4*sqrt(var(x))^5/(3*n))^(1/5))
}
# Kernel estimators of the density and the distribution
kg = function(x,data){
hb = h(data)
k = r = length(x)
for(i in 1:k) r[i] = mean(dnorm((x[i]-data)/hb))/hb
return(r )
}
KG = function(x,data){
hb = h(data)
k = r = length(x)
for(i in 1:k) r[i] = mean(pnorm((x[i]-data)/hb))
return(r )
}
# Baklizi and Eidous (2006) estimator
nonpest = function(dat1B,dat2B){
return( as.numeric(integrate(function(x) KG(x,dat1B)*kg(x,dat2B),-Inf,Inf)$value))
}
nonpest(dat1,dat2)
Tôi hi vọng cái này giúp được.