实验三
相关分析与回归分析
一、实验目的:
1.
掌握相关分析的概念及意义,并熟练掌握对数据进行相关分析的操作步骤;
2.
了解相关分析过程中各参数的意义及选择,以及结果阅读;
3.
充分理解相关与偏相关的涵义;
4.
掌握常用回归分析原理及操作步骤;
5.
掌握回归参数的正确选择及回归结果的科学解释
二、主要内容:
二元定距变量的相关分析(pearson);
二元定序变量的相关分析;(spearman,kendall’stau-b)(注:当资料不服从双变量正态分布,或总体分布型未知,或原始数据是用等级表示时,宜用Spearman或Kendall相关)
偏相关分析;
线性回归分析;
曲线估计;
逻辑回归分析;
三、上机练习:
练习1:数据文件3-1,调查了某地1962年~1988年国民收入与城乡居民储蓄存款余额,利用相关分析分析二者的关系。并尝试用城乡居民储蓄存款余额预测国民收入。
练习2:数据文件3-2,调查了某公司员工当前工资,起始工资,工作经验及受教育年限,试分析四者之间的关系。尝试建立一个以起始工资,工作经验及受教育年限等为自变量,当前工资为因变量的回归模型。
练习3:数据文件3-3,调查了松柏的生长情况,分析其月生长量与月平均气温、月降雨量、月平均日照时数、月平均湿度这四个气候因素哪个因素有关。
练习4:调用数据文件3-4,分析mpg(每加仑汽油行使里程)与weight(车重)的相互关系,制作观测量数据的散点图,根据分析结果,选择并最终确定最佳回归模型。
练习5:根据某医院对癌症患者的调查数据3-5,其中的变量包括年龄(age)、患病时间(time)、肿瘤扩散等级(pathscat)、肿瘤大小(pathssize)、肿瘤史(histgrad)和癌变部位的淋巴结是否含有癌细胞(ln_yesno),试建立相关模型,对癌变部位的淋巴结是否含有癌细胞的情况进行预测。
实验五
相关分析与回归分析
A.相关分析
一、实验目的(1)
(2)
(3)
(4)
根据统计数据绘制散点图;
运用常规方法计算相关系数;
利用函数计算相关系数;
用数据分析工具求相关系数。
二、实验任务
相关关系是指现象之间确实存在的,但具体关系不能确定的数量依存关系。判断现象间的相关关系,一般先进行定性分析,再进行定量分析。
三、实验过程及结果
(1)绘制散点图:
第一步,选择“插入”菜单的“图表”子菜单,用鼠标单击“图表”
第二步,出现“图表向导—4步骤之1—图表类型”页面
选择“XY散点图”,点击“下一步”
第三步,出现“图表向导—4步骤之2—图表源数据”页面
填写完对话框后,点击“下一步”
第四步,出现“图表向导—4步骤之3—图表选项”页面
填写完对话框后,点击“下一步”
第五步,出现“图表向导—4步骤之1—图表位置”页面
填写完对话框后,点击“完成”即完成散点图。
(2)用数据分析工具求相关系数。
第一步,用鼠标点击工作表中待分析数据的任一单元格。选择“工具”菜单的“数据分析”子菜单,用鼠标双击数据分析工具中的“相关系数”选项,进入相关系数对话框。
第二步,在相关系数对话框中,在“输入区域”框中输入“B1:C15”,分组方式为逐列,选中“标志”复选框,在“输出区域”中输入D17.
第三,单击“确定”按钮,即在以D17为起点的右边空白区域给出结果。
结果表明设备能力x与劳动生产率y的相关系数为0.9805,并显示x、y自身为完全正相关。
B.回归分析
一、实验目的(1)利用Excel的数据处理功能,掌握回归分析的分析方法;
(2)通过对一组观察值使用“最小二乘法”直线拟合,用来分析单个因变量是如何受一个或几个自变量影响的,从而建立一元或多元线性回归方程;
(3)对回归分析结果进行显著性检验,进行回归预测,能对结果进行解释。
二、实验任务
用“添加线性趋势线”建立一元线性回归方程
三、实验过程及结果
用“添加线性趋势线”建立一元线性回归方程
用线性趋势线建立一元线性回归方程,主要是根据数据线性关系,插入线性趋势线加以分析整理得出方程的。
第一步,单击散点图的任一数据点,该系列的所有数据点将放大以突出显示。
第二步,鼠标对准任一数据点,单击右键。
第三步,选择“添加趋势线”命令,页面显示“添加趋势线”对话框。
该对话框有“类型”和“选项”靓歌“类型
表示添加的趋势线的形势,除了一个为线性外,其余都为非线性。此例选择“线性”。
第四步,单击“选项”选项卡,页面显示“添加趋势线”下的“选项”对话框。
第五步,单击“确定”按钮,趋势线、公式和R2值被插入到散点图中。
由插入趋势线后的散点图可知,年销售额和广告费间的函数关系为:
年销售额=2.2417*广告费-19.009公式中截距为-19.009,单位与年销售额相同(百万元);斜率为2.2417,表示每增加一单位(万元)的广告投入,引起年销售额的平均变化为2.2417单位(百万元)。
四、讨论
本次实验让我对这门课的软件有了更深刻的认识,软件操作简便,易于理解。实验过程中,我已经能掌握如何利于软件进行简单处理,进行各种数据分析,包括相关性分析,回归分析等等。在实验过程中,有遇到困难,在表格制作中也遇到了困难,但最终解决了困难,完成了实验。
回归分析的目的和作用
回归分析是统计分析中最常用的方法之一。它可以帮助我们在已知一组数据的情况下对未知变量进行间接预测,以及确定数据中动态和静态变量之间的关系。此外,它还能用于识别消费者特征,预测产品销量,评价投资风险,以及许多其他应用。
回归分析的主要目的是建立一个有效的模型,通过预测变量的变化来解释另一组数据变量的变化。回归分析使了解多个变量之间的相互联系变得更容易。它也可以用来识别可影响结果的因素,可以帮助我们预测未知的变量,或者限制因素的影响。另外,它还可以用于检查一个变量如何影响另一个变量,以及这两个变量之间的关系如何变化。
回归分析对于分析趋势和预测未来趋势至关重要。例如,如果要确定同时影响汽车销量的因素,可以使用回归分析来确定每种因素对汽车销量的影响程度。在临床研究中,回归分析可以用来确定某种药物与一种疾病的相关性,从而预测患有这种疾病的患者痊愈的可能性。在金融市场,回归分析可以帮助投资者评估未来投资收入的可预测性,并评估投资风险。
因此,回归分析有助于给出一种科学的模型,以便以数理的方式解释变量之间的关系。建立此模型的过程中,需要收集足够的有效数据,并做出合理的分析和推测,从而将变量之间的关系准确表述出来。这对做出考虑多因素的决策至关重要,以及理解复杂的物理系统和社会系统也同样重要。
经济与管理学院
《统计学》实验报告(2012版)
实验名称
专业班级
会计一班
110943130实验四
相关与回归分析
完成人
李思萌
实验日期
实验成绩
5.31.2012学
号
批阅人
王大江
一、实验目的:
通过实验,使学生熟悉运用EXCEL进行相关图的绘制和相关系数的计算和回归分析,并能够对Excel输出的回归结果予以解读。
二、实验资料:
资料(一):
商品销售额与流通费用率单变量分组相关表
销售额(万元)
40以下
40~8080~120120~160160~200200~240240~280280~320320~36资料(二):
商店数(个)
14223844665034261流通费用率(%)
9.817.907.327.006.806.716.666.606.56经济与管理学院
《统计学》实验报告(2012版)
某农场通过试验取得早稻收获量与春季降雨和春季温度的数据如下表所示:
春季降雨和春季温度的数据
收获量(kg/公顷)
降雨量(mm)x1温度(℃)x21500230030004500480050005500256338451010513110141151612017三、实验要求
(一)根据资料(一)运用EXCEL进行相关图的绘制和相关系数的计算。(sheet1)
(二)根据资料(二)计算回归参数和检验统计量并解读输出的回归结果。(Sheet2)
说明:以上两个实验结果分别存放于实验四:相关与回归分析(专业、班级、学号、姓名).xls一个工作表的sheet1和sheet2中。
四、实验步骤:
(一)运用EXCEL进行相关图的绘制和相关系数的计算:
1)相关图的绘制
经济与管理学院
《统计学》实验报告(2012版)
经济与管理学院
《统计学》实验报告(2012版)
点击“完成”,并对图形进行修饰编辑,最后得到如图所示流通费用率与销售额之间的散点图。
经济与管理学院
《统计学》实验报告(2012版)
2)相关系数的计算:
①点击“fx”——“选择类别”中选择“统计”,在“选择函数”中选择“CORREL”——点击“确定”——“Array1”中选择“A14:A22”,“Array2”中选择“B14:B22”——点击“确定”。
经济与管理学院
《统计学》实验报告(2012版)
经济与管理学院
《统计学》实验报告(2012版)
②第一步:“工具”——“相关系数”——“确定”;
经济与管理学院
《统计学》实验报告(2012版)
经济与管理学院
《统计学》实验报告(2012版)
(二)计算回归参数和检验统计量并解读输出的回归结果:
经济与管理学院
《统计学》实验报告(2012版)
实验报告
课程名称
统计学
学号
学生姓名
辅导教师
系别
经济与管理学院
1.实验名称
相关与回归分析
2.实验目的(1)熟练掌握相关关系的测定方法。
(2)熟练掌握一元线性回归方程的建立和分析方法。
3.实验内容
(1)绘制相关散点图
(2)利用相关系数宏计算相关变量的相关系数;
(3)利用回归分析宏建立回归直线方程
4.实验原理
(1)利用Excel绘制相关图
(2)利用Excel计算相关系数
(3)利用Excel进行回归分析
5.实验过程及步骤
1、绘制散点图
“插入”---“图表”---“xy散点图”----“下一步”---输入数据区域---“下一步”,输入图表标题“散点图”、数轴名称,“下一步”选择插入方式,“完成”
2、相关系数的计算
(1)使用相关系数函数进行计算
在EXCEL中,CORREL函数和PERSON函数提供了计算两个变量之间的相关系数的方法,这两个函数是等价的。与相关系数有关的函数还有RSQ(相关系数的平方,即判定系数r2)和COVAR(协方差函数)。
(2)利用相关系数宏计算相关系数矩阵
点击EXCEL“工具”菜单,选择“数据分析”,选择“相关系数”。
3、回归分析
(1)使用回归分析宏
步骤:“工具”---“数据分析”,在分析工具中选择“回归”然后“确定”,输入y值输入区域和x值输入区域,选择置信度,输出区域,选择确定。
(2)除了回归分析宏外,EXCEL提供了9个函数用于建立回归模型和回归预测。这9个函数列于下表中。但EXCEL提供的回归分析宏仍然具有更方便的特点。
实验室名称
实验时间
6.实验结论及心得
一.(1)
(2)
由此可知,估计值为79,回归系数b为-2.33333.所以
Y^=a+bx=79+(-2.33333)x(2)Y^=a+bx=79+(-2.33333)(x+1000)=-2.33333x-2254.33所以
产量每增加1000,单位成本平均下降2333.33(3)当x=6000时,Y=-13920.98二.
(1)
(2)
(3)由此可得
回归直线方程为
Y^=a+bx=50.27395+18.91731x
我院任课教师有实验课的均要求有实验报告,每个实验项目要求有一份实验报告,实验报告按照格式书写完毕后,经辅
导实验的教师批改后按照实验室收集存档。
制定具体的养护方案
学
号:
2014106146课
程
论
文
题
目
学
院
专
业
班
级
学生姓名
指导教师
职
称
统计学实验
数学与统计学院
金融数学
14金融数学
罗星蔓
胡桂华
教授
2016年
6月
21日
直螺纹接头的加工
制定具体的养护方案
相关与回归分析实验报告
一、实验目的:用EXCEL进行相关分析和回归分析.二、实验内容:
1.
用EXCEL进行相关分析.2.
用EXCEL进行回归分析.三、实验步骤
采用下面的例子进行相关分析和回归分析.学生
1234567891080906090788790458780数学分数(x)
85927090839094509382统计学分数(y)
相关分析:
数学分数(x)
统计学分数(y)
回归分析:
数学分数(x)
统计学分数(y)10.9860111SUMMARYOUTPUT
回归统计
MultipleR0.986011RSquare0.972217AdjustedR0.968744Square标准误差
2.403141观测值
x
方差分析
直螺纹接头的加工
制定具体的养护方案
回归分析
残差
总计
df1SSMSFSignificance
F1616.691616.69279.9431.65E-099846.20065.775089691662.Coefficients12.320180.896821标准误差
4.2862790.053601P-value0.0206911.65E-07Lower95%2.4360050.773218Upper95%22.204361.020424下限
95.0%2.4360050.773218上限
95.0%22.204361.020424tStat2.8743316.73152Intercept数学分数(x)
RESIDUALOUTPUT
观测预测
统计学分数值
(y)184.06587293.03408366.12945493.03408582.27223690.34361793.03408852.67713990.343611084.0658残差
0.934133-1.034083.870554-3.034080.727775-0.343610.965922-2.677132.656385-2.0658标准残差
0.412293-0.45641.708324-1.339130.321214-0.151660.426323-1.181591.172433-0.9118PROBABILITYOUTPUT
百分比排统计学分数位
(y)5501570258235834585559065907592直螺纹接头的加工
制定具体的养护方案
8595939410080分数604020学生成绩
024681学生编号
数学分数(x)ResidualPlot
-202040608010-4数学分数(x)
数学分数(x)LineFitPlot
100统计学分数(y)
5预测统计学分数
(y)05010数学分数(x)
数学分数(x)统计学分数(y)12统计学分数(y)
残差NormalProbabilityPlot1005000204060SamplePercentile
统计学分数(y)80100直螺纹接头的加工
制定具体的养护方案
结果分析
相关系数MultipleR=0.986011>0.8可以进行回归分析。
?与y的实际值相差2.403141。
标准误差=2.403141,代表平均来看yIntercept代表截距为12.32018即常数项
XVariable1代表斜率为0.896821,即数学分数每增加1分,统计学分数平均增加0.896821分。
x平均值为78.7,y平均值为92.9可以得出回归方程y=0.896821x+12.3201直螺纹接头的加工
实验项目二
相关与回归分析、时间序列分析实验
实验学时:
实验类型:综合实验
一、实验目的通过本实验的学习,使学生掌握相关与回归分析的基本概念、基本用途、基本原则,熟悉时间序列分析的基本思想和方法,掌握相关与回归分析、时间序列分析在Excel中的实现以及运行结果的解释,为今后的数据分析报告的撰写奠定基础。
二、实验内容
本实验学生重点要掌握相关与回归分析、时间序列分析的方法。
三、实验原理及原始计算数据、所应用的公式
1.用Excel进行描述统计、计算平均发展速度和直线趋势方程
某县生猪栏量长期趋势测定
年份
tyt
2tyy"(y-y’)
19951996199719981999200020012002200320042005∑
12345678910116630.5429.3730.0829.8530.6833.1433.7232.7734.2235.2836.24355.8914916253649648110012150630.5458.7490.24119.40153.40198.84236.04262.16307.98352.80398.642208.7829.0229.6830.3531.0231.6932.3533.0233.6934.3635.0235.69355.891.52-0.31-0.27-1.17-1.010.790.70-0.90-0.140.260.550(1)用Excel对生猪栏量y进行描述统计,求出y的算术平均数、中位数、众数、标准差。
(2)计算平均发展速度和直线趋势方程。
2.用Excel计算总指数
三种商品报告期和基期的价格和销售量资料
价格
销售量
商品
单位
P0P1q0q1甲
台
80088012013乙
件
丙
件
用Excel计算总指数。
320280310290240320250303.用Excel作相关与回归分析
某市居民消费额及主要影响因素,年份
居民消费
yt(亿元)2.02.42.73.03.63.94.65.05.87.18.811.114.015.416.0GDPt
(亿元)
2.93.54.04.75.86.47.48.310.012.816.921.926.529.932.1总人口x
(万人)
55.6056.2056.9057.8059.2060.1061.1061.7062.1062.5063.0063.9064.3064.7065.02居民人
居民人均
均收入st
消费Ct
70176190410181255149315921783216728163887470550525209543464468577587111431234129414461732219431383886409843174587?i
yei
1992199319941995199619971998199920002001200220032004200520062.06-0.062.37-0.032.650.053.03-0.033.64-0.043.95-0.054.484.935.757.080.120.070.050.029.03-0.2311.42-0.3213.590.4115.200.2015.780.22用Excel作相关与回归分析。
四、实验用主要仪器设备、消耗品
仪器设备名称
五、实验步骤
1.用Excel计算平均发展速度和直线趋势方程的步骤如下。
第1步:打开Excel数据表,键入数据A1:A11(生猪出栏量),B1:B11(时间变量)。
第2步:在“fx”
后键入=exp(ln(36.24/30.54)/10)*100,单击回车键,则平均发展速度为101.726%,平均增长速度则为1.726%。
第3步:选择“工具”下拉菜单,选择“数据分析”选项。在“分析工具”中再选择“回归”。当出现对话框时:
在“Y值输入区域”框内键入A1:A11,在“X值输入区域”框内键入B1:B11,在“输出选项”中“新工作表组”,单击“确定”按钮。Excel输出的回归分析的结果如图2-1所示。该图显示了直线趋势方程估计的有关结果,但略去了残差、残差图、线性拟合图、参数的区间估计等输出,实际分析中可根据需要保留这些规格
安装了office的电脑
消耗品名称
规格
输出。
图2-1Excel输出的回归分析结果
2.用Excel计算总指数的步骤如下。
第1步:打开Excel数据表,键入数据,如图2-2所示。
第2步:用SUMPRODUCT(两数组乘积和)函数作求和运算。
在A6单元格键入“=SUMPRODUCT(A2:A4,C1:C4)”,单击回车键,则为?p0q在A7单元格键入“=SUMPRODUCT(A2:A4,D1:D4)”,单击回车键,则为?p0q1在A8单元格键入“=SUMPRODUCT(B2:B4,D1:D4)”,单击回车键,则为?p1q1第3步:计算总指数。
在C6单元格键入“=274400/262400”,单击回车键,则为销售量指数。
在C7单元格键入“=285940/274400”,单击回车键,则为销售价格指数。
在C8单元格键入“=285940/262400”,单击回车键,则为销售额价格指数。
第3步:计算影响额
在E6单元格键入“=274400-262400”,单击回车键,则为销售量变动影响额。
在E7单元格键入“=285940-274400”,单击回车键,则为销售价格变动影响额。
在E8单元格键入“=285940-262400”,单击回车键,则为销售额总变动额。
图2-2用Excel计算总指数示意图
3.Excel作相关分析和用Excel作回归分析
用Excel作相分析的步骤如下:
第1步:打开Excel数据表,构建原始数据表.在A1:A15输入y的数据,在B1:B15输入x1的数据,在C1:C15输入x2的数据,第2步:选择“工具”下拉菜单,选择“数据分析”选项。
第3步:在“分析工具”中选择“相关系数”。当出现对话框时:在“输入区域”框内
键入A1:C15,分组方式选择“逐列”;
在“输出选项”中选择“新工作表组”。
第4步:单击“确定”按钮,输出结果如表2-4所示。
表2-4相关系数矩阵
yX1X2y10.991530.88487X110.8786851X2用Excel作回归分析的步骤如下:
回归分析第1步和第2步与相关分析相同,第3步:在“分析工具”中选择“回归”。当出现对话框后:在“y值输入区域”框内键入A1:A15.在“x值输入区域”框内键入B1:D15,在“输出选项”中选择“新工作表组”。如果需要,还可选择“残差、残差图、线性拟合图”等输出选项。
第4步:单击“确定”按钮,输出结果如表2-5所示。
表2-5Excel输出de1回归分析结果
六、实验注意事项及对学生的要求
1.掌握回归分析的结果解释;
2.掌握季节指数的计算;
3.掌握总指数的计算。
七、参考文献
1.《应用统计学(第二版修订本)》,龚曙明,清华大学出版社,北京交通大学出版社,2007年6月。
2.《统计学原理》,黄良文主编,中国统计出版社,2000年6月第1版。
3.《统计学(第三版)》,贾俊平,中国人民大学出版社,2007年1月第3版。
4.《统计学》,郑珍远,机械工业出版社,2007-07-01。
实验三
用EXCEL进行相关与回归分析
一、实验题目:用EXCEL进行相关与回归分析
二、实验教学目的用EXCEL进行相关与回归分析,并能够解释实验结果。
三、实验教学要求:
掌握利用EXCEL数据分析中提供的样本等进行相关和回归分析,并能够解释实验结果。
四、实验内容:
1.用Excel进行相关分析
2.用Excel进行回归分析
五、实验步骤
1.用Excel进行相关分析
第一步:打开一张工作表,并输入相应的数据,如A2:C10第二步:单击“工具”菜单→“数据分析”命令→选中“回归”功能,然后单击“确定”按钮,如图。
第三步:在弹出的对话框中输入相应的参数,然后再单击“确定”按钮,如图。
第四步:回归分析结果,即
y
5.2794x
208.8235。2.用Excel进行回归分析
第一步
打开工作表,输入数据,然后单击“工具”菜单→“数据分析”命令→“相关系数”功能,然后单击“确定”按钮,如图。
第二步:在方差分析对话框中,输入有关参数,再单击“确定”按钮,如图。
第三步:
获得相关系数r值,但在此无法明确该相关系数的显著性程度。
第四步:显著性测验,由于,因此降水量与黏虫发生量之间有极显著的0.01相关性。
r?r六、实验小结
相关热词搜索: 相关与回归分析的实验目的 目的 回归 实验版权所有:巨匠文档网 2010-2024 未经授权禁止复制或建立镜像[巨匠文档网]所有资源完全免费共享
Powered by 巨匠文档网 © All Rights Reserved.。冀ICP备20016797号