根据给定的数据Employee data.sav完成以下数据分析:
1.根据出生日期变量生成一个新变量“年龄”,并考察其是否服从正态分布 2.根据雇员的教育水平对起始薪金的平均值进行汇总 3.选择合适的图形考查不同雇佣类别人群的当前薪金的分布 4.通过假设检验来推断不同性别的人群的教育水平是否有差异
5.考察经验和当前薪金之间的数量关系,并建立二者的回归模型,预测当经验为300时,相应的薪金应是多少?
实验步骤及结论:
1.根据出生日期变量生成一个新变量“年龄”,并考察其是否服从正态分布
1)选择“转换”到“计算变量” 2)在“目标变量”中输入“年龄”
3)在“数学表达式”中选择“XDATE.YEAR”,选择“出生日期”。以2014为减数。 4)确定
1)选择“分析”到“描述统计”到“P_P图” 2)在“变量”中选择“年龄”
3)在“检验分布”中选择“正态分布” 4)确定
模型描述
模型名称 序列或顺序 转换
非季节性差分 季节性差分 季节性期间的长度
无周期性
1
MOD_4 年龄 无
0 0
标准化
类型
分布
位置 标度
部分排序估计方法 为结指定秩
未应用 正态 估计 估计 Blom
同数的值的秩均值
正在应用来自 MOD_4 的模型指定。
个案处理摘要
序列或顺序长度
用户缺失
图中的缺失值数
系统缺失
个案未进行加权。
1 年龄
474 0
估计的分布参数
正态分布
标度
个案未进行加权。
11.78409 位置
年龄 57.6723
由图可知,偏差大于0.05,所以不服从正态分布
2.根据雇员的教育水平对起始薪金的平均值进行汇总 1)选择“数据”到“分类汇总”
3.选择合适的图形考查不同雇佣类别人群的当前薪金的分布
1)选择“图形”到“图表构建程序”
由图可知,职员的当前佣金在27839左右,保管员在30939左右,经理在63978左右。其中经理最高,职员最低,且相差较大。
4.通过假设检验来推断不同性别的人群的教育水平是否有差异 1)选择“分析”到“比较均值”到“独立样本T检验”
组统计量 教育水平(年) 女 216 12.37 2.319 .158 性别 男 N 258 均值 14.43 标准差 2.979 均值的标准误 .185 独立样本检验 方差方程的 Levene 检验 F Sig. t df Sig.(双侧) 下限 假设方差相等 教育水平(年) 假设方差不相等 17.884 .000 8.276 472 .000 .000 2.060 2.060 .249 .244 1.571 1.581 均值差值 标准误差值 差分的 95% 置信区间 上限 2.549 2.538 均值方程的 t 检验 8.458 469.595
由图可知,F=17.884,P=0.000,由于P值小于0.05,因此拒绝H0,认为两个样本方差所在总体的方差是不齐的。因此应选择方差不相等时的t检验结果,即为图中第二行列出非t=8.458,df=469.595,P=0.000,小于0.05,从而最终得到的统计结论按α=0.05水准。拒绝H0不同性别的人群的教育水平是有差异的。
5.考察经验和当前薪金之间的数量关系,并建立二者的回归模型,预测当经验为
300时,相应的薪金应是多少? 选择“分析”到“回归”到“线性”
输入/移去的变量 模型 1 输入的变量 经验(以月计) ba移去的变量 方法 . 输入 a. 因变量: 当前薪金 b. 已输入所有请求的变量。 由此图可知,放入模型的只有一个自变量,选择变量的方法为强行纳入模型的。 模型汇总 模型 R R 方 调整 R 方 标准 估计的误差 1 .097 a.009 .007 $17,012.353 a. 预测变量: (常量), 经验(以月计)。 Anova
模型
回归 残差
平方和 1310179340.332 136606316096.0
08 137916495436.3
40 df
均方
1 1310179340.332 472 289420161.220 F 4.527 Sig. .034 b
a
1
总计 473
a. 因变量: 当前薪金
b. 预测变量: (常量), 经验(以月计)。
F=4.527,P<0.05,说明所建立的回归模型是具有统计学意义的,由于只有一个
变量,所以该自变量的回归系数是有统计意义的。 系数 模型 非标准化系数 B 1 经验(以月计) a. 因变量: 当前薪金 -15.913 7.479 -.097 -2.128 .034 (常量) 35945.029 标准 误差 1060.488 标准系数 试用版 33.895 .000 t Sig. a
给出了模型的常数项a=35945.029以及自变量的偏回归系数b=-15.913及检验结果,可写出回归方程:
当前薪金Y=35945.029-15.913*经验X
所以,当经验=300时,预测当前薪金为31171元。
成绩评定:
因篇幅问题不能全部显示,请点此查看更多更全内容