排序
对数据集进行排序的时候,不打乱行之间的联系
#sort m by using the order and keep the connections.
#Don’t miss the comma after the order.
sort_df <- m[order(m$attr), ]
画图
自定义坐标
在plot()函数中可以直接使用at属性
在hist()函数中需要:
hist(变量, xlim = range(0,10), xaxt="n") #将x轴取消 axis <- axis(1, at=seq(from, to, step)) #1代表横轴
将图片直接画到需要导出的pdf中
pdf("test.pdf") plot() dev.off()
对数据集中所有数据画相关性散点图
pairs(m)
如果想通过数字形式呈现cor(m[ ,i:j])
使用barplot()画图报错height必须为向量
#将数据转换成table形式 barplot(table(data))
线性回归
预测
d = data.frame(var_name = c() ) predict(m, newdata = d)
y=a+bx最小二乘直线
abline(a = y.intercept, b= slope)
或者
m = lm(y~x) abline(reg = m)
检查误差(误差均值应该为0)
plot(m$fitted.values, m$residuals)
或者
qqnorm(m$residuals)
或者
layout(matrix(data=1:4, nrow=2, ncol=2, byrow=T)) plot(m)
检查数据是否为常态分布
qqnorm(m); qqline(m)