某学期某班的35名学生的统计学考试成绩的原始数据如下:
92,85,72,76,88,78,96,82,81,84,87,77,75,66,65,73,70,49,62,79,61,56,55,68,79,51,84,91,68,83
实验步骤:
第一步,计算取值范围。
利用Excel“分析工具库”中的“描述统计”工具,直接计算出原始数据的取值范围及其他测度。
1.在“工具”菜单中,单击“数据分析”命令,调出“分析工具”列表框。
2.然后在“分析工具”列表框中,选中需要使用的“描述统计”工具。
3. 在“描述统计”对话框中的“输入区域(I)中输入原始数据所在的单
元格,在本例中30名学生的统计考试成绩的原始数据位于A1到A30单元格;“分组方式”选择“逐列”;在“输出选项”中,若希望运算结果输出在当前工作表中,选定“输出区域(0)”,并在窗口中输入输出计算结果的起始位置。在本例中选择了运算输出在当前工作表上,输出运算结果的起始位置为J1若需要将运算结果输出带新的工作表上,或者新的工作薄,可选定相应选项。最后选定含有取值范围数值的汇总统计
用鼠标单击“确定”,完成取值范围的计算,计算机输出计算结果如图所示
其中“区域”即使取值范围为47分,也可以由上图的“最大值”96分和“最小值”49分,计算其取值范围R=96-49=47(分)。 第二步确定组数和组距。
由确定组数的经验公式,可计算出参考是组数H=1+lg30/lg2,约等于5,由于人们习惯将考试成绩分为5类,也可直接分成5组为宜。
数确定后,可以根据取值范围、组数和组距之间的数量关系,计算出组距的取值d=47/5,取整之后组距以10分。
第三步,计算频数分布。
首先,给定COUNTIF函数的评判标准,在本题中为小于各组上限。 其次,给出COUNTIF函数的相关参数数值,在对应“60(分)以下”组的“累计人数”一栏中,即单元格E3中。编写的COUNTIF函数“=COUNTIF(A1:A30:D3)”,单元格A1到A30为待分组的原始数据;“各组取值”各栏给出了对应各组的取值上线,其中“60分以下”组的取值上限为60,即E3为“60分一下”分组的上限标准“<60”.COUNTIF函数“=COUNTIF(A1:A30,E3)”运算结果该组向上累计人数为4人。
然后,用鼠标拖动填充柄经过需要填充相同COUNTIF函数公式的单元格E3到E8。释放鼠标按键,完成各组向上累计人数的运算。向上累计人数是累计频数数值,通过对累计频数计算的逆运算,可以计算出 各组频数数值。
最后,在各组频数的基础上,将各组人数除以全班总人数,可以计算出各组人数占全班总人数的比重,即频数的相对形式——频率。在对应“60(分)以下”组的“比重”一栏中,即单元格G3中,编写的计算公式“=F3*100/F$8”,运算结果该组人数占全班总人数的比重为13.3333%,如下图。再类似上个步骤,用
鼠标拖动填充柄完成这组数值。
第四步,计算组中值。
闭口 组中值=(上限+下限)/ 2
开口 组中值=该组上限—邻组组距/2 60(分)以下 第五步,绘制统计表
第六步,绘制统计图。
为了便于折线图的绘制,对上图的分组略加调整,将原“60(分)以下”组改成“50—60(分)”组和“40-50(分)”,即在原图的两端各加一个频数为0的最大和最小分组,分别为“40(分)以下”组和“100(分)以上”组。
选中数据及计量单位所在单位格,用鼠标单击“图表导向”快捷键,在“表图导向—4步骤之1—图表类型”对话框中,选择“标准类型”选项卡,选定“柱形图”中的第一个子图表类型“簇状柱形图”最后单击完成。
消除直方图矩形之间存在的间隔,可以通过“数据系列”命令中“选项”对“重叠比例”和“间距宽度”进行重置来实现。首先用鼠标双击初始直方图中矩形位置,调出“数据点格式“对话框,再单击”选项‘选项卡,将 “重叠比例”和“间距宽度”选项框中的数值改为0,然后确认。
小坐标轴字体,先用鼠标左键双击“分类轴”调出“坐标轴格式”对话框,然后选中“字体”选项卡,将“字号(S)”改为“10”
根据制作直方图的步骤制作折线图,其最终的效果如下;
实验二
( 一)用P值进行假设检验
实验步骤:
第一步,进入excel表格界面,选择插入菜单 第二步,选择函数
第三步,在函数分类中单击“统计”随后,在函数名的菜单下选择字符“TDIST”然后确定。
第四步,在弹出的X栏中输入计算出的t值(本例为3.16)。 在自由度(deg-freedom)栏中,输入本例中的自由度9。
在Tails栏中,输入2,表明是双侧检验,如果是单侧检验则在该栏中输入1.
计算P值的结果为0.011550219.
(二)创建数据透视表
随机抽取30名学生的调查数据 实验步骤:
1. 在Excel工作表中建立数据清单
2. 选中数据清单,并选择(数据)菜单中的(数据透视表和数据透视图),弹出的对话框如图所示,然后根据选择“数据源类型”和“报告类型” 这里我们选用(Microsoft excel 数据列表)和(数据透视表)单击(下一步)弹出的对话框如下:
3..确定数据源区域
4.在(数据透视表和数据透视图向导——3步骤之3)中选择数据透视表显示位置,为方便起见可选择(现有工作表)并利用鼠标确定数据透视表显示位置,本例为原工作表的G1单元格。然后选择(布局)弹出的对话框如图
5.在(数据透视表和数据透视图向导——布局)对话框中,依次将“性别”和“买衣服首选因素”拖至左边的“行”区域,将“家庭所在地区”拖至上边的“列”区域,将“平均月生活费”和“月平均衣物支出”拖至数据区域,如图所示
6. 单击(确定)自动返回(数据透视表和数据透视图向导——3步骤之3)对话
框。然后单击(完成)即可输出数据透视表。结果如图所示
实验三
(一) 参数估计
实验步骤:
18名本科学生毕业一年后的月工资情况
1. 利用“分析工具库“中的”描述统计“工具栏计算样本均值,样本标准差样本均值标准差和置信水平
2. 用CHIINV函数计算χ2 0.025(17)=30.191和χ2 0.975(17)=7.564
根据公式(17*367.95)/30.191,<σ2<(17*367.95)/7.564
得到总体方差的置信区间为(76233,304271)
(二) 单因素方差分析
某市某一路段的交通流量情况
实验步骤:
1. 给出原假设,原假设为上午,下午和夜间这三段里的交通流量的总体均值不存在显著性提高。
2.利用“分析数据库”的“单因素方差分析”工具,在“工具”下拉菜单中选择“数据分析”在“数据分析”选项框中选定“方差分析”“单因素方差分析”
3. 进行单因素方差分析。在“方差分析,单因素方差分析“对话框的“输入区域”设置框中输入有关数据所在单元格,在“分组方式”选项框中选择数据的按水平分组的排列方式,本例选择“列”,在“α”设置框中输入所选定的显著性水平的数值,本例的显著性水平为0.05,最后在“输出选项”中的设置“输出区域”
4. 统计判断,单因素方差分析计算结果如下
由于F检验统计量为67.43116,大于在显著性水平α=0.05下的F临界值3.5546.,所以拒绝原假设,认为该市此路段在上午,中午和夜间这三个时段里德交通流量的总体均值存在显著性水平。
实验四
(一) 一元线性回归
实验步骤:
某商业银行2002年的主要业务数据如下:
1对给定数据画出折线图和散点图
根据散点图我们可以看出不良贷款与贷款余额具有一点的线性关系 2求相关系数
根据CORREL算出相关系数r=0.843571364
3根据线性回归分析
得出回归直线
Y=-0.8295+0.037895X
4相关系数和回归系数的检验
提出假设H0: ρ=0 H: ρ≠0 计算检验的统计结果
t=r(n2)/(1r2)0.8436(252)/10.84362)7.5344
进行决策。根据显著性水平 a=0.05和自由度n-2=23,查t分布表的 ta/2 ( n-2 )=2.0687.由于t=7.5344> ta/2=2.0687,所以拒绝原假设Ho,说明不良贷款与贷款余额之间存在显著的正线性相关关系。
(二)时间序列
某啤酒销售量数据
1 根据给定数据,画出散点图
啤酒销售额6050403020100051015202530啤酒销售额
2根据最小二乘法 利用工具中的数据分析的“回归”的到βo β1的值 βo =30.6067 β1=0.5592 得到回归直线为
Y=30.6067+0.5592t
3计算季节指数
(1) 用EXCEL进行移动平均时,在【数据分析】选项中选择【移动平均】,
并在对话框中输入数据区域和移动间隔即可。得到移动平均值,再将其结果进行中心化处理,也就是将移动平均值的结果再进行一次2项移动平均,即可得出中心化移动平均值。
(2) 再算比值,可在E4输入公式“=C4/D4”回车键,然后再用鼠标托下来。
根据比值进行计算,如下图:
从表中可以看出:
第一季度的季节指数为0.7922 第二季度的季节指数为1.0424 第三季度的季节指数为1.2752 第四季度的季节指数为0.8902 4. 进行预测
预测2006年的第一季度的销售量,将t=25带入回归方程的 Y=30.6067+0.5592*25=44.59。
实验心得
因篇幅问题不能全部显示,请点此查看更多更全内容