发布时间:2024-05-13 15:01
#9.1(1)
load('C:/exercise/ch9/exercise9_1.RData')
install.packages("car")
library(car)
scatterplot(居民消费水平~人均GDP,data=exercise9_1,pch=19,xlab='人均GDP',ylab = '居民消费水平',cex.lab=0.8)
cor(exercise9_1[,2],exercise9_1[,3])
#相关系数为0.9240374,说明居民消费水平与人均GDP的相关性较强
#(2)
model<-lm(居民消费水平~人均GDP,data=exercise9_1)
summary(model)
confint(model,level=0.95)
anova(model)
attach(exercise9_1)
plot(居民消费水平~人均GDP)
text(居民消费水平~人均GDP,labels=地区,cex=0.6,adj=c(-0.6,0.25),col=4)
abline(model,col=2,lwd=2)
n=nrow(exercise9_1)
for(i in 1:n){
segments(exercise9_1[i,3],exercise9_1[i,2],exercise9_1[i,3],model$fitted[i])
}
mtext(expression(hat(y)))
#9.2(1)
load('C:/exercise/ch9/exercise9_2.RData')
scatterplot(产量~生产费用,data=exercise9_2,pch=19,xlab='生产费用',ylab = '产量',cex.lab=0.8)
#关系形态为正线性相关
#(2)
cor(exercise9_2[,2],exercise9_2[,3])
#相关系数为0.9202324
library(psych)
cor.test(exercise9_2[,2],exercise9_2[,3])
#p=2.222e-05<0.05 拒绝原假设,两个变量的线性关系显著
#|r|>0.8,可视为两个变量之间高度相关
#9.3(1)
load('C:/exercise/ch9/exercise9_3.RData')
model<-lm(投诉次数~航班准点率,data=exercise9_3)
summary(model)
#y=-4.7006*航班准点率+430.1892
#航班准点率每变动(增加或减少)1%,投诉次数平均变动(减少或增加)4.7006次。航班准点率为0时,投诉次数平均为430.1892次
#(2)
cor.test(exercise9_3[,2],exercise9_3[,3])
#p=0.001108<0.05 拒绝原假设,两个变量的线性关系显著
#(3)
y<--4.7006*80+430.1892;y
#顾客投诉次数的估计值为54.1412
#9.4(1)
load('C:/exercise/ch9/exercise9_4.RData')
model<-lm(销售额~广告费支出,data=exercise9_4)
summary(model)
#y=-4.7006*航班准点率+430.1892
# 回归模型的诊断图
par(mfrow=c(2,2),cex=0.8,cex.main=0.7)
plot(model)
# 检验方差齐性
ncvTest(model)
#绘制散布-水平图
spreadLevelPlot(model)
# 检验残差独立性
durbinWatsonTest(model)