### code for "The importance of scale for spatial-confounding bias and precision of spatial regression estimators"
### appearing in Statistical Science, 2010
### Chris Paciorek, 5/4/2010

######################################
### auxiliary code
######################################


f.matern.euc <-
function(dist,parm1,parm2){
  # Matern correlation; see also Matern() in fields package
 # first finding log values is about same speed as on original scale but may be more stable numerically
  const=-lgamma(parm2)-(parm2-1)*log(2)
  tmp=exp(const+parm2*log(2.0*sqrt(parm2)*dist/parm1)+log(besselK(2.0*sqrt(parm2)*dist/parm1,parm2)))
  tmp[tmp>1]=1
  tmp[dist==0]=1
  return(tmp)
}

pcpGen=function(){
  # generates n locations based on a Poisson cluster process where m is the average # children per parent point and sd is the spread of a Gaussian kernel for the children
  m=7
  rho=n*4/m
  larger.region=c(0,1,0,1)
  nn <- rpois(1, lambda = rho * (larger.region[2] - larger.region[1]) * 
              (larger.region[4] - larger.region[3]))
  parents <- cbind(runif(nn, larger.region[1], larger.region[2]), 
                   runif(nn, larger.region[3], larger.region[4]))
  sd=.03
  num.child <- rpois(nn, lambda = m)
  num.tot <- sum(num.child)
  sim.events <- matrix(c(rnorm(num.tot, 0, sd) + rep(parents[, 1], num.child), rnorm(num.tot, 0, sd) + rep(parents[,2], num.child)), num.tot)
  sim.events=sim.events[sample(1:nrow(sim.events),n),]
  return(sim.events)
}


thresh=function(vec,up=NULL,lo=NULL){
  # thresholds values for better plotting
  if(!is.null(up)){
    vec[vec>up]=up
  }
  if(!is.null(lo)){
    vec[vec<lo]=lo
  }
  return(vec)
}

####################################################################
### code for Section 2.3 results, including fig. 2 calculations
####################################################################


set.seed(0)
n=100

nVals=10
theta1=theta2=seq(0,1,len=nVals)  

type='grid'  # 'grid','unif','pcp'  for gridded locations, runif locations, or Poisson cluster process locations
if(type=='grid'){
  xs=expand.grid(seq(0,1,len=sqrt(n)),seq(0,1,len=sqrt(n)))
  dmat=rdist(xs)
}


# this adjusts the variance so that empirical variance is roughly constant as theta changes
sdfun=rep(0,nVals)
if(type=='grid'){
  for(i in 2:length(theta1)){
    rmat1=f.matern.euc(dmat,theta1[i],2)
    L1=t(chol(rmat1))
    x=L1%*%matrix(rnorm(n*50000),nr=n)
    sdfun[i]=mean(apply(x,2,var))
  }
} else{
  x=matrix(NA,nr=n,nc=10000)
  for(k in 2:length(theta1)){
    for(m in 1:10000){
      if(type=='unif'){
        xs=cbind(runif(n),runif(n))
      } else{
        xs=pcpGen()
      }
      dmat=rdist(xs)
      rmat1=f.matern.euc(dmat,theta1[k],2)
      L1=t(chol(rmat1))
      x[,m]=L1%*%matrix(rnorm(n),nr=n)
    }
    sdfun[k]=mean(apply(x,2,var))
  }
}
sdfun[1]=1
sdfun=1/sqrt(sdfun)

set.seed(0)

nreps=1000
p=c(.1,.5,.9)  # pz in notation of paper
q=c(.1,.5,.9)  # pc in notation of paper
precMat=array(0,c(length(theta1),length(theta2),length(p),length(q)))

if(type=='grid'){
  for(pp in 1:3){
    for(qq in 1:3){
      for(i in 1:length(theta1)){
        if(theta1[i]==0){
          rmat1=diag(rep(1,n))
          L1=rmat1
        } else{
          rmat1=f.matern.euc(dmat,theta1[i],2)
          L1=t(chol(rmat1))
        }
        effp=p[pp]*sdfun[i]^2/(p[pp]*sdfun[i]^2+1-p[pp])
        Sigma=effp*rmat1
        diag(Sigma)=diag(Sigma)+(1-effp) 
        SigmaInv=solve(Sigma)
        for(j in 1:length(theta2)){
          if(theta2[j]==0){
            rmat2=diag(rep(1,n))
            L2=rmat2
          } else{
            rmat2=f.matern.euc(dmat,theta2[j],2)
            L2=t(chol(rmat2))
          }
          effq=q[qq]*sdfun[i]^2/(q[qq]*sdfun[i]^2+(1-q[qq])*sdfun[j]^2)  
          tmpmat=(1-effq)*rmat2%*%solve(rmat1) 
          diag(tmpmat)=diag(tmpmat)+effq 
          inv=solve(tmpmat)
          for(m in 1:nreps){
            xc=sdfun[i]*sqrt(q[qq])*L1%*%rnorm(n) 
            xu=sdfun[j]*sqrt(1-q[qq])*L2%*%rnorm(n) 
            x=xu+xc # multiplying by sig2u+sig2c should make no difference
            fullx=cbind(rep(1,n),x)
            den=t(fullx)%*%(SigmaInv%*%fullx) 
            num=t(fullx)%*%(SigmaInv%*%(inv%*%x))
            precMat[i,j,pp,qq]=precMat[i,j,pp,qq]+solve(den,num)[2]
          }
          precMat[i,j,pp,qq]=precMat[i,j,pp,qq]*effq/nreps # q[qq]
        }
        print(c(pp,qq,i))
      }
      print(date())
    }
  }
} else{
  for(pp in 1:3){
    for(qq in 1:3){
      for(i in 1:length(theta1)){
        for(j in 1:length(theta2)){
          set.seed(0)
          for(m in 1:nreps){
            if(type=='unif'){
              xs=cbind(runif(n),runif(n))
            } else{
              xs=pcpGen()
            }
            dmat=rdist(xs)
            if(theta1[i]==0){
              rmat1=diag(rep(1,n))
              L1=rmat1
            } else{
              rmat1=f.matern.euc(dmat,theta1[i],2)
              L1=t(chol(rmat1))
            }
            effp=p[pp]*sdfun[i]^2/(p[pp]*sdfun[i]^2+1-p[pp])
            Sigma=effp*rmat1
            diag(Sigma)=diag(Sigma)+(1-effp) 
            SigmaInv=solve(Sigma)
            if(theta2[j]==0){
              rmat2=diag(rep(1,n))
              L2=rmat2
            } else{
              rmat2=f.matern.euc(dmat,theta2[j],2)
              L2=t(chol(rmat2))
            }
            effq=q[qq]*sdfun[i]^2/(q[qq]*sdfun[i]^2+(1-q[qq])*sdfun[j]^2) 
            tmpmat=(1-effq)*rmat2%*%solve(rmat1) 
            diag(tmpmat)=diag(tmpmat)+effq 
            inv=solve(tmpmat)
            xc=sdfun[i]*sqrt(q[qq])*L1%*%rnorm(n) 
            xu=sdfun[j]*sqrt(1-q[qq])*L2%*%rnorm(n) 
            x=xu+xc # multiplying by sig2u+sig2c should make no difference
            fullx=cbind(rep(1,n),x)
            den=t(fullx)%*%(SigmaInv%*%fullx) 
            num=t(fullx)%*%(SigmaInv%*%(inv%*%x))
            precMat[i,j,pp,qq]=precMat[i,j,pp,qq]+solve(den,num)[2]
          }
          precMat[i,j,pp,qq]=precMat[i,j,pp,qq]*effq/nreps # q[qq]
          print(c(pp,qq,j))
          print(date())
        }
      }
    }
  }
}

# example code for plotting Fig 2 (this code may not fully run but will give you a feel for things)

gr=expand.grid(theta1,theta2,rev(p),q)
gr$vals=c(precMat)
names(gr)=c('theta1','theta2','pz','pc','vals')
gr$pz=as.factor(gr$pz)
gr$pc=as.factor(gr$pc)
levels(gr$pz)=c('0.9','0.5','0.1')

my.strip <-function(which.given, which.panel,bg, var.name, ...) {
  if (which.given == 1 && which.panel[2] == 3)
    strip.default(1, which.panel[1],
                  var.name =expression(p[c]),strip.names=c(T),style=1,bg='gray90',
                  ...)  }

my.strip.left <-
  function(which.given, which.panel, var.name,bg, ..., horizontal) {
    if (which.given == 2 && which.panel[1] == 1)
      strip.default(1, which.panel[2],
                    var.name = expression(p[z]),strip.names=c(T),style=1,
                    horizontal = FALSE,bg='gray90', ...)  }

levelplot(vals~theta1*theta2|pc*pz,gr,zlim=c(-.05,1.05),col.regions=tim.colors(),cuts=10,at=seq(-.05,1.05,by=.1),xlab=expression(paste('spatial scale of confounding,    ',theta[c],sep='      ')),ylab=expression(paste('unconfounded spatial scale,  ',theta[u],sep='    ')),strip=my.strip,strip.left=my.strip.left ,  par.settings =          list(layout.heights = list(strip = c(0, 0,.8)),               layout.widths = list(strip.left = c(.8,0, 0))))


##################################################################################################
### code for calculations of Section 2.3 with additional smaller-scale variability (eqn 7)
##################################################################################################

set.seed(0)
n=100
# choose the locations by uncommenting one of the next three lines; apparently I didn't bother to randomize locations for unif and pcp for this side analysis
# xs=expand.grid(seq(0,1,len=sqrt(n)),seq(0,1,len=sqrt(n)))  # 'grid'
# xs=pcpGen()  # 'pcp'
# xs=cbind(runif(n),runif(n))  # 'unif'

nVals=10
theta1=theta2=seq(0,1.5,len=nVals)  # c(0,.025,.05,.1,.2,.4,.8,1.6)
dmat=rdist(xs)

sdfun=rep(0,nVals)
for(i in 2:length(theta1)){
  rmat1=f.matern.euc(dmat,theta1[i],2)
  L1=t(chol(rmat1))
  x=L1%*%matrix(rnorm(n*50000),nr=n)
  sdfun[i]=mean(apply(x,2,var))
}
sdfun[1]=1
sdfun=1/sqrt(sdfun)

set.seed(0)

nreps=1000
p=c(.1,.5,.9)
q=c(.1,.5,.9)
precMat=array(0,c(length(theta1),length(theta2),length(p),length(q)))

propSpat=.9 # this controls how much of the error variation is actually small-scale variation 

for(pp in 1:3){
  for(qq in 1:3){
    for(i in 1:length(theta1)){
      if(theta1[i]==0){
        rmat1=diag(rep(1,n))
        L1=rmat1
      } else{
        rmat1=f.matern.euc(dmat,theta1[i],2)
        L1=t(chol(rmat1))
      }
      effp=p[pp]*sdfun[i]^2/(p[pp]*sdfun[i]^2+1-p[pp])
      for(j in 1:length(theta2)){
        if(theta2[j]==0){
          rmat2=diag(rep(1,n))
          L2=rmat2
        } else{
          rmat2=f.matern.euc(dmat,theta2[j],2)
          L2=t(chol(rmat2))
        }
        Sigma=effp*rmat1  
        Sigma=Sigma+(1-effp)*propSpat*rmat2
        diag(Sigma)=diag(Sigma)+(1-effp)*(1-propSpat) 
        SigmaInv=solve(Sigma)
        effq=q[qq]*sdfun[i]^2/(q[qq]*sdfun[i]^2+(1-q[qq])*sdfun[j]^2)
        tmpmat=(1-effq)*rmat2%*%solve(rmat1) 
        diag(tmpmat)=diag(tmpmat)+effq 
        inv=solve(tmpmat)
        
        for(m in 1:nreps){
          xc=sdfun[i]*sqrt(q[qq])*L1%*%rnorm(n) 
          xu=sdfun[j]*sqrt(1-q[qq])*L2%*%rnorm(n) 
          x=xu+xc # multiplying by sig2u+sig2c should make no difference
          fullx=cbind(rep(1,n),x)
          den=t(fullx)%*%(SigmaInv%*%fullx) 
          num=t(fullx)%*%(SigmaInv%*%(inv%*%x))
          precMat[i,j,pp,qq]=precMat[i,j,pp,qq]+solve(den,num)[2]
        }
        precMat[i,j,pp,qq]=precMat[i,j,pp,qq]*effq/nreps 
      }
      print(c(pp,qq,i))
    }
    print(date())
  }
}

################################################################################
### code for simulation results of Section 2.4 and 2.5
################################################################################

library(geoR)

set.seed(0)

nMethods=9

pcp=FALSE # FALSE, TRUE 
likMethod='ML' # 'ML', 'REML'
extraSmallScale=FALSE # FALSE, TRUE  # if TRUE, this gives the results mentioned at very end of Section 2.4

nVals=10
theta1=theta2=seq(0,1.0,len=nVals)  
# theta1 is confounded portion


sdfun=rep(0,nVals)
for(kk in 1:500){
  if(pcp){  # 'unif' or 'pcp' are the alternatives for locations
    xs=pcpGen()
  } else{
    xs=cbind(runif(n),runif(n))
  }
  dmat=rdist(xs)
  tmp=matrix(rnorm(n*100),nr=n)
  for(ii in 2:length(theta1)){
    rmat1=f.matern.euc(dmat,theta1[ii],2)
    L1=t(chol(rmat1))
    x=L1%*%tmp
    sdfun[ii]=sdfun[ii]+mean(apply(x,2,var))
  }
}
sdfun=sdfun/500
sdfun[1]=1
sdfun=1/sqrt(sdfun)


nSims=2000 

betaZ=1

psFun=function(spVal,desdf){
  return(summary(gam(y~x+s(xs1,xs2,k=75),sp=spVal))$edf-desdf)
}


tau2=4
out=switch(as.character(scenario),  # different scenarios for parameter values
       '1'=list(sig2z=1,sig2u=1,sig2c=1),
       '2'=list(sig2z=4,sig2u=1,sig2c=1),
       '3'=list(sig2z=.25,sig2u=1,sig2c=.25),
       '4'=list(sig2z=4,sig2u=1,sig2c=4)
     )

sig2z=out$sig2z
sig2u=out$sig2u
sig2c=out$sig2c

if(extraSmallScale){
  sig2extra=out$sig2extra
  tau2=tau2-sig2extra
}

beta=array(0,c(nMethods,nVals,nVals))
betaSD2=array(0,c(nMethods,nVals,nVals))
betaSE2=array(0,c(nMethods,nVals,nVals))
cvg=array(0,c(nMethods,nVals,nVals))
estdf=array(NA,c(5,nVals,nVals,nSims))
fixBiasOls=fixBiasGls=fixVarOls=fixVarGls=array(0,c(2,nr=nVals,nc=nVals)) # 1st is generative; 2nd is goal
cntBad=matrix(0,nVals,nVals)

betaReps=array(NA,c(nMethods,nVals,nVals,nSims))
seReps=betaReps

# specify combinations of nu for Gaussian process data generation (trueNu) and nu for the fitting (useNu)
# trueNu is for unconfounded variation (X_u) and trueNuC is for confounded variation (X_c, Z)
# you could work out what the nuSetting combos are or just choose values manually
if(nuSetting<2){
  trueNu=trueNuC=2
} else{
  trueNu=trueNuC=0.5  
  if(nuSetting==3){   
    trueNuC=2
  }
}
if(nuSetting==0){
  useNu=trueNu
} else{
  useNu=0.5
}

if(nuSetting==4){
  trueNu=0.5
  trueNuC=2
  useNu=2
}


for(i in 1:10){
  for(j in 1:10){
    pz=0
    pc=sdfun[i]^2*sig2c/(sdfun[i]^2*sig2c+sdfun[j]^2*sig2u)
    pcbase=sig2c/(sig2c+sig2u)
    set.seed(0)
    for(m in 1:nSims){
      
      # data generation
      if(pcp){
        xs=pcpGen()
      } else{
        xs=cbind(runif(n),runif(n))
      }
      xs1=xs[,1]; xs2=xs[,2]
      dmat=rdist(xs)
      if(theta1[i]==0){
        Rc=diag(rep(1,n))
      } else{
        Rc=f.matern.euc(dmat,theta1[i],trueNuC)
      }
      if(theta2[j]==0){
        Ru=diag(rep(1,n))
      } else{
        Ru=f.matern.euc(dmat,theta2[j],trueNu)
      }
      Lc=t(chol(Rc))
      xc=sqrt(sig2c)*sdfun[i]*Lc%*%rnorm(n)
      xu=sqrt(sig2u)*sdfun[j]*t(chol(Ru))%*%rnorm(n)
      x=xc+xu
      z=rho*sqrt(sig2z)*xc/sqrt(sig2c)+sdfun[i]*sqrt(sig2z*(1-rho*rho))*Lc%*%rnorm(n)
      if(extraSmallScale){
        z=z+sqrt(sig2extra)*sdfun[j]*t(chol(Ru))%*%rnorm(n)
      }
      y=betaX*x+betaZ*z+rnorm(n,0,sqrt(tau2))
      fullx=cbind(rep(1,n),x)

      
      pz=pz+var(z)/(var(z)+tau2)
      
      sig2ini=sig2z*betaZ^2
      thetaini=theta1[i]

      # ols
      linMod=lm(y~x)
      bhat=linMod$coef[2]
      se=summary(linMod)$coef[2,2]
      beta[6,i,j]=beta[6,i,j]+bhat
      betaSD2[6,i,j]=betaSD2[6,i,j]+bhat^2
      betaSE2[6,i,j]=betaSE2[6,i,j]+se^2
      cvg[6,i,j]=cvg[6,i,j]+(abs(bhat-betaX)<2*se)
      betaReps[6,i,j,m]=bhat
      seReps[6,i,j,m]=se
      
      # gam (penalized spline with GCV)
      gamMod=gam(y~x+s(xs1,xs2,k=0.9*n))
      bhat=gamMod$coef[2]
      se=summary(gamMod)$p.table[2,2]
      beta[2,i,j]=beta[2,i,j]+bhat
      betaSD2[2,i,j]=betaSD2[2,i,j]+bhat^2
      betaSE2[2,i,j]=betaSE2[2,i,j]+se^2
      cvg[2,i,j]=cvg[2,i,j]+(abs(bhat-betaX)<2*se)
      betaReps[2,i,j,m]=bhat
      seReps[2,i,j,m]=se
      estdf[1,i,j,m]=summary(gamMod)$edf
      
     # kriging
      krigMod=list()
      krigMod[[1]]=try(likfit(coords=xs,data=y,ini.cov.pars=c(1,.6),nugget=tau2,fix.kappa=T,kappa=useNu,cov.model='matern',trend=trend.spatial(~x),messages=F,lik.method=likMethod))
      krigMod[[2]]=try(likfit(coords=xs,data=y,ini.cov.pars=c(1,.01),nugget=tau2,fix.kappa=T,kappa=useNu,cov.model='matern',trend=trend.spatial(~x),messages=F,lik.method=likMethod))
      krigMod[[3]]=try(likfit(coords=xs,data=y,ini.cov.pars=c(1,.2),nugget=tau2,fix.kappa=T,kappa=useNu,cov.model='matern',trend=trend.spatial(~x),messages=F,lik.method=likMethod))
      badKrig=list()  
      badKrig[[1]]=(attr(krigMod[[1]],"class")=="try-error")[1]
      badKrig[[2]]=(attr(krigMod[[2]],"class")=="try-error")[1]
      badKrig[[3]]=(attr(krigMod[[3]],"class")=="try-error")[1]
      whichKrig=0
      ll=-Inf
      if(!badKrig[[1]]){
        whichKrig=1
        ll=krigMod[[1]]$loglik
      }
      if(!badKrig[[2]]){
        if(ll<krigMod[[2]]$loglik){
          whichKrig=2
          ll=krigMod[[2]]$loglik
        }
      }
      if(!badKrig[[3]]){
        if(ll<krigMod[[3]]$loglik){
          whichKrig=3
        }
      }
      if(whichKrig){
        tmp=krigMod[[whichKrig]]
        rm(krigMod)
        krigMod=tmp
        bhat=krigMod$beta[2]
        phi=krigMod$phi
        phi=phi*2*sqrt(useNu)
        if(krigMod$sigmasq>0.0001){
          SigmaEst=krigMod$sigmasq*f.matern.euc(dmat,phi,useNu)
          partial=SigmaEst
          diag(SigmaEst)=diag(SigmaEst)+krigMod$tausq
          sX=solve(SigmaEst,fullx)     
          se=sqrt(solve(t(fullx)%*%sX)[2,2])
          df=sum(diag(partial%*%solve(SigmaEst)))
        } else{
          se=sqrt(krigMod$tausq*solve(t(fullx)%*%fullx)[2,2])
          df=0
        }
        beta[1,i,j]=beta[1,i,j]+bhat
        betaSD2[1,i,j]=betaSD2[1,i,j]+bhat^2
        betaSE2[1,i,j]=betaSE2[1,i,j]+se^2
        cvg[1,i,j]=cvg[1,i,j]+(abs(bhat-betaX)<2*se)
        betaReps[1,i,j,m]=bhat
        seReps[1,i,j,m]=se
        estdf[2,i,j,m]=df
      } else{
        cntBad[i,j]=cntBad[i,j]+1
      }

      
      # regression splines with 5, 15, 30 df
      regrMod=gam(y~x+s(xs1,xs2,k=6,fx=TRUE))
      bhat=regrMod$coef[2]
      se=summary(regrMod)$p.table[2,2]
      beta[3,i,j]=beta[3,i,j]+bhat
      betaSD2[3,i,j]=betaSD2[3,i,j]+bhat^2
      betaSE2[3,i,j]=betaSE2[3,i,j]+se^2
      cvg[3,i,j]=cvg[3,i,j]+(abs(bhat-betaX)<2*se)
      betaReps[3,i,j,m]=bhat
      seReps[3,i,j,m]=se
      
      regrMod=gam(y~x+s(xs1,xs2,k=16,fx=TRUE))
      bhat=regrMod$coef[2]
      se=summary(regrMod)$p.table[2,2]
      beta[4,i,j]=beta[4,i,j]+bhat
      betaSD2[4,i,j]=betaSD2[4,i,j]+bhat^2
      betaSE2[4,i,j]=betaSE2[4,i,j]+se^2
      cvg[4,i,j]=cvg[4,i,j]+(abs(bhat-betaX)<2*se)
      betaReps[4,i,j,m]=bhat
      seReps[4,i,j,m]=se
      
      regrMod=gam(y~x+s(xs1,xs2,k=31,fx=TRUE))
      bhat=regrMod$coef[2]
      se=summary(regrMod)$p.table[2,2]
      beta[5,i,j]=beta[5,i,j]+bhat
      betaSD2[5,i,j]=betaSD2[5,i,j]+bhat^2
      betaSE2[5,i,j]=betaSE2[5,i,j]+se^2
      cvg[5,i,j]=cvg[5,i,j]+(abs(bhat-betaX)<2*se)
      betaReps[5,i,j,m]=bhat
      seReps[5,i,j,m]=se
      
      # penalized spline with fixed smoothing
      spVal=uniroot(psFun,c(.00001,100),5)$root
      regrMod=gam(y~x+s(xs1,xs2,k=75),sp=spVal)
      bhat=regrMod$coef[2]
      se=summary(regrMod)$p.table[2,2]
      beta[7,i,j]=beta[7,i,j]+bhat
      betaSD2[7,i,j]=betaSD2[7,i,j]+bhat^2
      betaSE2[7,i,j]=betaSE2[7,i,j]+se^2
      cvg[7,i,j]=cvg[7,i,j]+(abs(bhat-betaX)<2*se)
      betaReps[7,i,j,m]=bhat
      seReps[7,i,j,m]=se
      estdf[3,i,j,m]=summary(regrMod)$edf
      
      spVal=uniroot(psFun,c(.00001,100),15)$root
      regrMod=gam(y~x+s(xs1,xs2,k=75),sp=spVal)
      bhat=regrMod$coef[2]
      se=summary(regrMod)$p.table[2,2]
      beta[8,i,j]=beta[8,i,j]+bhat
      betaSD2[8,i,j]=betaSD2[8,i,j]+bhat^2
      betaSE2[8,i,j]=betaSE2[8,i,j]+se^2
      cvg[8,i,j]=cvg[8,i,j]+(abs(bhat-betaX)<2*se)
      betaReps[8,i,j,m]=bhat
      seReps[8,i,j,m]=se
      estdf[4,i,j,m]=summary(regrMod)$edf
      
      spVal=uniroot(psFun,c(.00001,100),30)$root
      regrMod=gam(y~x+s(xs1,xs2,k=75),sp=spVal)
      bhat=regrMod$coef[2]
      se=summary(regrMod)$p.table[2,2]
      beta[9,i,j]=beta[9,i,j]+bhat
      betaSD2[9,i,j]=betaSD2[9,i,j]+bhat^2
      betaSE2[9,i,j]=betaSE2[9,i,j]+se^2
      cvg[9,i,j]=cvg[9,i,j]+(abs(bhat-betaX)<2*se)
      betaReps[9,i,j,m]=bhat
      seReps[9,i,j,m]=se
      estdf[5,i,j,m]=summary(regrMod)$edf
    }
    
      
      # bias and prec when parameters are known
      
    Sigma=sdfun[i]^2*sig2z*betaZ*betaZ*Rc
    if(extraSmallScale){
      Sigma=sdfun[i]^2*sig2z*betaZ*betaZ*Rc+sdfun[j]^2*sig2extra*Ru
    }
    diag(Sigma)=diag(Sigma)+tau2
    sX=solve(Sigma,fullx)
    knownVar=solve(t(fullx)%*%sX)
    knownBias=pc*rho*sqrt(sig2z/sig2c)*betaZ
    mat=(1-pc)*Ru%*%solve(Rc)
    diag(mat)=diag(mat)+pc
    knownBias=knownBias*(knownVar%*%t(fullx)%*%solve(Sigma,solve(mat,x)))[2]
                                        # gls bias, var under generative model
    fixBiasGls[1,i,j]=fixBiasGls[1,i,j]+knownBias
    fixVarGls[1,i,j]=fixVarGls[1,i,j]+knownVar[2,2]

    knownVar=knownVar/sdfun[i]^2
    knownBias=pcbase*rho*sqrt(sig2z/sig2c)*betaZ
    mat=mat*(1-pcbase)/(1-pc)
    diag(mat)=diag(mat)+pcbase
    knownBias=knownBias*(knownVar%*%t(fullx)%*%solve(Sigma,solve(mat,x)))[2]
    fixBiasGls[2,i,j]=fixBiasGls[2,i,j]+knownBias
    fixVarGls[2,i,j]=fixVarGls[2,i,j]+knownVar[2,2]

  }
  pz=pz/nSims
  print(paste('actual pz is ',pz,sep=''))
  print(c(date(),i,j))
}

fixBiasGls=fixBiasGls/nSims
fixVarGls=fixVarGls/nSims

beta[2:nMethods,,]=beta[2:nMethods,,]/nSims
betaSD2[2:nMethods,,]=betaSD2[2:nMethods,,]/nSims-beta[2:nMethods,,]^2
betaSE2[2:nMethods,,]=betaSE2[2:nMethods,,]/nSims
cvg[2:nMethods,,]=cvg[2:nMethods,,]/nSims

beta[1,,]=beta[1,,]/(nSims-cntBad)
betaSE2[1,,]=betaSE2[1,,]/(nSims-cntBad)
betaSD2[1,,]=betaSD2[1,,]/(nSims-cntBad)-beta[1,,]^2
cvg[1,,]=cvg[1,,]/(nSims-cntBad)

meandf=array(0,c(5,nVals,nVals))
for(k in 1:5){
  for(i in 1:nVals){
    for(j in 1:nVals){
      meandf[k,i,j]=mean(estdf[k,i,j,],na.rm=T)
    }
  }
}

mse=array(0,c(nMethods,nVals,nVals))
for(k in 1:nMethods){
  for(i in 1:nVals){
    for(j in 1:nVals){
      mse[k,i,j]=mean((betaReps[k,i,j,]-betaX)^2,na.rm=T)
    }
  }
}

# example code for plotting Fig. 5 (this code may not fully run but will give you a feel for things)

bs=(beta-betaX)/betaX
bs=thresh(bs,.525,-.025)
gr=expand.grid(theta1=theta1,theta2=theta2,spl=c('penalized spl.','regression spl.'),df=c(5,15,30))
gr$vals=NA
gr$vals[gr$spl=='regression spl.'&gr$df==5]=bs[3,,]
gr$vals[gr$spl=='regression spl.'&gr$df==15]=bs[4,,]
gr$vals[gr$spl=='regression spl.'&gr$df==30]=bs[5,,]
gr$vals[gr$spl=='penalized spl.'&gr$df==5]=bs[7,,]
gr$vals[gr$spl=='penalized spl.'&gr$df==15]=bs[8,,]
gr$vals[gr$spl=='penalized spl.'&gr$df==30]=bs[9,,]
gr$df=as.factor(gr$df)
gr$spl=as.factor(gr$spl)

my.strip <-function(which.given, which.panel,bg, var.name, ...) {
  if (which.given == 1 && which.panel[2] == 2)
    strip.default(1, which.panel[1],
                  var.name ='df',strip.names=c(T),style=1,bg='gray90',...)  }

my.strip.left <-
  function(which.given, which.panel, var.name,bg, ..., horizontal) {
    if (which.given == 2 && which.panel[1] == 1)
      strip.default(1, which.panel[2],
                    var.name = '',strip.names=c(T),style=1,
                    horizontal = FALSE,bg='gray90', ...)  }

# fig. 5a
par(cex.axis=1.5,cex.lab=1.5,cex.main=1.5,cex.sub=1.5)
levelplot(vals~theta1*theta2|df*spl,gr,zlim=c(-.025,0.525),at=seq(-.025,.525,by=.05),colorkey=list(labels=list(cex=1.4,at=seq(0,.5,by=.1))),col.regions=tim.colors(),cuts=10,,xlab=list(label=expression(paste('spatial scale of confounding,    ',theta[c],sep='      ')),cex=1.5),ylab=list(label=expression(paste('unconfounded spatial scale,  ',theta[u],sep='    ')),cex=1.5),strip=my.strip,strip.left=my.strip.left ,  par.settings =list(layout.heights = list(strip = c(0,.6)),layout.widths = list(strip.left = c(.8,0, 0))),main=list(label='(a) Bias',cex=1.5),scales=list(cex=c(1.4)),par.strip.text=list(cex=1.6))
dev.off()


bs=betaSD2
bs=thresh(bs,1.05,-.05)
gr=expand.grid(theta1=theta1,theta2=theta2,spl=c('penalized spl.','regression spl.'),df=c(5,15,30))
gr$vals=NA
gr$vals[gr$spl=='regression spl.'&gr$df==5]=bs[3,,]
gr$vals[gr$spl=='regression spl.'&gr$df==15]=bs[4,,]
gr$vals[gr$spl=='regression spl.'&gr$df==30]=bs[5,,]
gr$vals[gr$spl=='penalized spl.'&gr$df==5]=bs[7,,]
gr$vals[gr$spl=='penalized spl.'&gr$df==15]=bs[8,,]
gr$vals[gr$spl=='penalized spl.'&gr$df==30]=bs[9,,]
gr$df=as.factor(gr$df)
gr$spl=as.factor(gr$spl)

my.strip <-function(which.given, which.panel,bg, var.name, ...) {
    if (which.given == 1 && which.panel[2] == 2)
        strip.default(1, which.panel[1],
                      var.name ='df',strip.names=c(T),style=1,bg='gray90',...)  }

my.strip.left <-
    function(which.given, which.panel, var.name,bg, ..., horizontal) {
    if (which.given == 2 && which.panel[1] == 1)
        strip.default(1, which.panel[2],
                      var.name = '',strip.names=c(T),style=1,
                      horizontal = FALSE,bg='gray90', ...)  }

# fig 5b
levelplot(vals~theta1*theta2|df*spl,gr,zlim=c(-.05,1.05),at=seq(-.05,1.05,by=.1),colorkey=list(labels=list(cex=1.4,at=seq(0,1,by=.2))),col.regions=tim.colors(),cuts=10,,xlab=list(label=expression(paste('spatial scale of confounding,    ',theta[c],sep='      ')),cex=1.5),ylab=list(label=expression(paste('unconfounded spatial scale,  ',theta[u],sep='    ')),cex=1.5),strip=my.strip,strip.left=my.strip.left ,  par.settings =list(layout.heights = list(strip = c(0,.6)),layout.widths = list(strip.left = c(.8,0, 0))),main=list(label='(b) Variance',cex=1.5),scales=list(cex=c(1.4)),par.strip.text=list(cex=1.6))
dev.off()            


###############################
### code for Section 3.1
###############################

type='grid'  # 'grid', 'unif', 'pcp'

if(type=='grid'){
  set.seed(0)
  n=100
  x=expand.grid(seq(0,1,len=sqrt(n)),seq(0,1,len=sqrt(n)))
  dmat=rdist(x)
  theta1=theta2=seq(0,1,len=100) 
  
  p=c(.1,.5,.9)
  
  ones=rep(1,n)
  precMat=array(0,c(length(theta1),length(theta2),3))
  for(kk in 1:3){
    for(i in 1:length(theta1)){
      if(theta1[i]==0){
        rmat1=diag(rep(1,n))
      } else{
        rmat1=f.matern.euc(dmat,theta1[i],2)
      }
      for(j in 1:length(theta2)){
        if(theta2[j]==0){
          rmat2=diag(rep(1,n))
        } else{
          rmat2=f.matern.euc(dmat,theta2[j],2)
        }
        covmat=p[kk]*rmat2
        diag(covmat)=(1-p[kk])+diag(covmat)
        precMat[i,j,kk]=sum(diag(solve(covmat,rmat1)))
        den=t(ones)%*%solve(covmat,ones)
        num=t(ones)%*%solve(covmat,rmat1%*%solve(covmat,ones))
        precMat[i,j,kk]=precMat[i,j,kk]-num/den
        print(c(i,j,kk))
      }
    }
  }
}

if(type!='grid'){
  set.seed(0)
  n=100
  nreps=500
  theta1=theta2=seq(0,1,len=100)  
  
  p=c(.1,.5,.9)
  
  ones=rep(1,n)
  precMat=array(0,c(length(theta1),length(theta2),3))
  for(kk in 1:3){
    for(i in 1:length(theta1)){
      for(j in 1:length(theta2)){
        set.seed(0)
        for(m in 1:nreps){
          if(type=='unif'){
            xs=cbind(runif(n),runif(n))
          }
          if(type=='pcp'){
            xs=pcpGen()
          }
          dmat=rdist(xs)
          if(theta1[i]==0){
            rmat1=diag(rep(1,n))
          } else{
            rmat1=f.matern.euc(dmat,theta1[i],2)
          }
          if(theta2[j]==0){
            rmat2=diag(rep(1,n))
          } else{
            rmat2=f.matern.euc(dmat,theta2[j],2)
          }
          covmat=p[kk]*rmat2
          diag(covmat)=(1-p[kk])+diag(covmat)
          precMatHold=sum(diag(solve(covmat,rmat1)))
          den=t(ones)%*%solve(covmat,ones)
          num=t(ones)%*%solve(covmat,rmat1%*%solve(covmat,ones))
          precMat[i,j,kk]=precMat[i,j,kk]+precMatHold-num/den
          print(c(i,j,kk))
        }
      }
      print(date())
    }
  }
  precMat=precMat/nreps
}


###############################
### code for Section 3.2
###############################

# code for grid
set.seed(0)
n=100
xs=expand.grid(seq(0,1,len=sqrt(n)),seq(0,1,len=sqrt(n)))

nVals=100
theta1=theta2=seq(0,1.0,len=nVals)  
dmat=rdist(xs)

nreps=500
p=c(.1,.5,.9)
precMatRatio=precMatOLS=precMatGLS=array(0,c(length(theta1),length(theta2),length(p)))

# issue of empirical vs population variance shouldn't matter because sigma_x cancels out of ratio of GLS and OLS precision; sigma2_g + tau2 also cancels out

for(pp in 1:3){
  for(i in 1:length(theta1)){
    if(theta1[i]==0){
      rmat1=diag(rep(1,n))
      L1=rmat1
    } else{
      rmat1=f.matern.euc(dmat,theta1[i],2)
      L1=t(chol(rmat1))
    }
    Sigma=rmat1*p[pp]
    diag(Sigma)=diag(Sigma)+(1-p[pp])
    SigmaInv=solve(Sigma)
    for(j in 1:length(theta2)){
      if(theta2[j]==0){
        rmat2=diag(rep(1,n))
        L2=rmat2
      } else{
        rmat2=f.matern.euc(dmat,theta2[j],2)
        L2=t(chol(rmat2))
      }
      set.seed(0)
      for(m in 1:nreps){
        x=L2%*%rnorm(n)
        fullx=cbind(rep(1,n),x)
        xtxInv=solve(t(fullx)%*%fullx)
        den=(solve(t(fullx)%*%(SigmaInv%*%fullx)))[2,2]
        num=(xtxInv%*%(t(fullx)%*%(Sigma%*%fullx))%*%xtxInv)[2,2]
        precMatRatio[i,j,pp]=precMatRatio[i,j,pp]+num/den
        precMatOLS[i,j,pp]=precMatOLS[i,j,pp]+1/num
        precMatGLS[i,j,pp]=precMatGLS[i,j,pp]+1/den
      }
    }
    print(c(pp,i,precMatRatio[i,4,pp]/nreps))
  }
  print(date())
}


# code for random uniform sampling or pcp
type='unif'  #'pcp'
n=100

nVals=100
theta1=theta2=seq(0,1.0,len=nVals)  

nreps=500
p=c(.1,.5,.9)
precMatRatio=precMatOLS=precMatGLS=array(0,c(length(theta1),length(theta2),length(p)))

# issue of empirical vs population variance shouldn't matter because sigma_x cancels out of ratio of GLS and OLS precision; sigma2_g + tau2 also cancels out

for(pp in 1:3){
  for(i in 1:length(theta1)){
    for(j in 1:length(theta2)){
      set.seed(0)
      for(m in 1:nreps){
        if(type=='unif'){
          xs=cbind(runif(n),runif(n))
        }
        if(type=='pcp'){
          xs=pcpGen()
        }
        dmat=rdist(xs)          
        if(theta1[i]==0){
          rmat1=diag(rep(1,n))
          L1=rmat1
        } else{
          rmat1=f.matern.euc(dmat,theta1[i],2)
          L1=t(chol(rmat1))
        }
        Sigma=rmat1*p[pp]
        diag(Sigma)=diag(Sigma)+(1-p[pp])
        SigmaInv=solve(Sigma)
        if(theta2[j]==0){
          rmat2=diag(rep(1,n))
          L2=rmat2
        } else{
          rmat2=f.matern.euc(dmat,theta2[j],2)
          L2=t(chol(rmat2))
        }
        x=L2%*%rnorm(n)
        fullx=cbind(rep(1,n),x)
        xtxInv=solve(t(fullx)%*%fullx)
        den=(solve(t(fullx)%*%(SigmaInv%*%fullx)))[2,2]
        num=(xtxInv%*%(t(fullx)%*%(Sigma%*%fullx))%*%xtxInv)[2,2]
        precMatRatio[i,j,pp]=precMatRatio[i,j,pp]+num/den
        precMatOLS[i,j,pp]=precMatOLS[i,j,pp]+1/num
        precMatGLS[i,j,pp]=precMatGLS[i,j,pp]+1/den
      }
    }
    print(c(pp,i,precMatRatio[i,4,pp]/nreps))
  }
}
  
###############################
### code for Section 3.3
###############################


set.seed(0)

# code for gridded locations
n=100
xs=expand.grid(seq(0,1,len=sqrt(n)),seq(0,1,len=sqrt(n)))
xs=cbind(runif(n),runif(n)) 

nVals=100
theta1=theta2=seq(0,1.0,len=nVals)  
dmat=rdist(xs)


nreps=500
p=c(.1,.5,.9)
precMatRatio=precMatOLS=precMatGLS=array(0,c(length(theta1),length(theta2),length(p)))

# issue of empirical vs population variance shouldn't matter because sigma_x cancels out of ratio of GLS and OLS precision; sigma2_g + tau2 also cancels out

for(pp in 1:3){
  for(i in 1:length(theta1)){
    if(theta1[i]==0){
      rmat1=diag(rep(1,n))
      L1=rmat1
    } else{
      rmat1=f.matern.euc(dmat,theta1[i],2)
      L1=t(chol(rmat1))
    }
    Sigma=rmat1*p[pp]
    diag(Sigma)=diag(Sigma)+(1-p[pp])
    SigmaInv=solve(Sigma)
    for(j in 1:length(theta2)){
      if(theta2[j]==0){
        rmat2=diag(rep(1,n))
        L2=rmat2
      } else{
        rmat2=f.matern.euc(dmat,theta2[j],2)
        L2=t(chol(rmat2))
      }
      set.seed(0)
      for(m in 1:nreps){
        x=L2%*%rnorm(n)
        sxx=sum(x*x)
        num=t(x)%*%(Sigma%*%x)
        precMatRatio[i,j,pp]=precMatRatio[i,j,pp]+num/sxx
      }
    }
    print(c(pp,i,precMatRatio[i,4,pp]/nreps))
  }
  print(date())
}


precMatRatio=precMatRatio/nreps

# code for uniform or pcp
type='unif' # 'unif', 'pcp'
n=100

nVals=100
theta1=theta2=seq(0,1.0,len=nVals)  

nreps=500
p=c(.1,.5,.9)
precMatRatio=precMatOLS=precMatGLS=array(0,c(length(theta1),length(theta2),length(p)))

# issue of empirical vs population variance shouldn't matter because sigma_x cancels out of ratio of GLS and OLS precision; sigma2_g + tau2 also cancels out

for(pp in 1:3){
  for(i in 1:length(theta1)){
    for(j in 1:length(theta2)){
      set.seed(0)
      for(m in 1:nreps){
        if(type=='unif'){
          xs=cbind(runif(n),runif(n))
        }
        if(type=='pcp'){
          xs=pcpGen()
        }
        dmat=rdist(xs)          
        if(theta1[i]==0){
          rmat1=diag(rep(1,n))
          L1=rmat1
        } else{
          rmat1=f.matern.euc(dmat,theta1[i],2)
          L1=t(chol(rmat1))
        }
        Sigma=rmat1*p[pp]
        diag(Sigma)=diag(Sigma)+(1-p[pp])
        SigmaInv=solve(Sigma)
        if(theta2[j]==0){
          rmat2=diag(rep(1,n))
          L2=rmat2
        } else{
          rmat2=f.matern.euc(dmat,theta2[j],2)
          L2=t(chol(rmat2))
        }
        x=L2%*%rnorm(n)
        sxx=sum(x*x)
        num=t(x)%*%(Sigma%*%x)
        precMatRatio[i,j,pp]=precMatRatio[i,j,pp]+num/sxx
      }
    }
    print(c(pp,i,))
    print(date())
  }
}