• 主页 > 学历教育
  • 第四节多元线性回归分析(多元线性回归分析原理)

    本文从用户角度出发寻找了几个关于第四节多元线性回归分析的内容,小编曾经也是为此问题烦恼,有了对应信息第一时间就分享了出来。

    多元线性回归的显著性检验包含哪些内容?如何进行

    多元线性回归的显著性检验包含所有自变量与因变量。

    回归方程的显著性检验,即检验整个回归方程的显著性,或者说评价所有自变量与因变量的线性关系是否密切。能常采用F检验,F统计量的计算公式为:

    根据给定的显著水平a,自由度(k,n-k-1)查F分布表,得到相应的临界值Fa,若FFa,则回归方程具有显著意义,回归效果显著;FFa,则回归方程无显著意义,回归效果不显著。

    扩展资料:

    建立多元性回归模型时,为了保证回归模型具有优良的解释能力和预测效果,应首先注意自变量的选择,其准则是:

    (1)自变量对因变量必须有显著的影响,并呈密切的线性相关;

    (2)自变量与因变量之间的线性相关必须是真实的,而不是形式上的;

    (3)自变量之间应具有一定的互斥性,即自变量之间的相关程度不应高于自变量与因变量之因的相关程度;

    (4)自变量应具有完整的统计数据,其预测值容易确定。

    参考资料来源:百度百科-多元线性回归分析预测法

    怎样对多元线性回归模型进行分析,为什么

    多元线性回归模型表示一种

    地理

    现象与另外多种地理现象的依存关系,这时另外多种地理现象共同对一种地理现象产生影响,作为影响其分布与发展的重要因素。

    设变量Y与变量X1,X2,…,Xm存在着线性回归关系,它的n个样本观测值为Yj,Xj1,Xj2,…Xjm?(j=1,2,n),于是多元线性回归的数学模型可以写为:

    可采用最小二乘法对上式中的待估回归系数β0,β1,…,βm进行估计,求得β值后,即可利用多元线性回归模型进行预测了。

    计算了多元线性回归方程之后,为了将它用于解决实际预测问题,还必须进行数学检验。多元线性回归分析的数学检验,包括回归方程和回归系数的显著性检验。


    多元回归曲线方程结果如何分析?P值大于0.05 小于0.05 分别说明什么?

    p0.05说明这个因素对结果有影响,保留此因素,p0.05说明这个因素对结果无影响,删除此因素后重新建立新的回归方程模型。这时候可能又有一些因素p0.05,重复删除无关因素(或影响较小因素),直到所有因素p0.05。

    另外注意的是交叉影响因素中其中一因素作为无关因素被删除,该交叉项一定要删除。

    简介

    通常影响因变量的因素有多个,这种多个自变量影响一个因变量的问题可以通过多元回归分析来解决。例如,经济学知识告诉我们,商品需求量Q除了与商品价格P有关外,还受到替代品的价格、互补品的价格,和消费者收入等因素,甚至还包括商品品牌Brand这一品质变量(品质变量不能用数字来衡量,需要在模型中引入虚拟变量)的影响。

    多元回归分析应用的范围更加广泛。由于线性回归分析比较简单和普遍,下面首先介绍多元线性回归,在线性分析基础上,逐步引入虚拟变量回归和一类能够变换成线性回归的曲线回归模型。

    回归分析 | R语言 -- 多元线性回归

    多元线性回归  是  简单线性回归  的扩展,用于基于多个不同的预测变量(x)预测结果变量(y)。

    例如,对于三个预测变量(x),y的预测由以下等式表示:  y = b0 + b1*x1 + b2*x2 + b3*x3

    回归贝塔系数测量每个预测变量与结果之间的关联。“ b_j”可以解释为“ x_j”每增加一个单位对y的平均影响,同时保持所有其他预测变量不变。

    在本节中,依然使用 datarium 包中的  marketing  数据集,我们将建立一个多元回归模型,根据在三种广告媒体(youtube,facebook和报纸)上投入的预算来预测销售。计算公式如下: sales = b0 + b1*youtube + b2*facebook + b3*newspaper

    您可以如下计算R中的多个回归模型系数:

    请注意,如果您的数据中包含许多预测变量,则可以使用 ~. 以下命令将模型中的所有可用变量简单地包括在内:

    从上面的输出中,系数表显示β系数估计值及其显着性水平。列为:

    如前所述,您可以使用R函数轻松进行预测 predict() :

    在使用模型进行预测之前,您需要评估模型的统计显着性。通过显示模型的统计摘要,可以轻松地进行检查。

    显示模型的统计摘要,如下所示:

    摘要输出显示6个组件,包括:

    解释多元回归分析的第一步是在模型摘要的底部检查F统计量和关联的p值。

    在我们的示例中,可以看出F统计量的p值2.2e-16,这是非常重要的。这意味着  至少一个预测变量与结果变量显着相关 。

    要查看哪些预测变量很重要,您可以检查系数表,该表显示了回归beta系数和相关的t统计p值的估计。

    对于给定的预测变量,t统计量评估预测变量和结果变量之间是否存在显着关联,即,预测变量的beta系数是否显着不同于零。

    可以看出,youtube和facebook广告预算的变化与销售的变化显着相关,而报纸预算的变化与销售却没有显着相关。

    对于给定的预测变量,系数(b)可以解释为预测变量增加一个单位,同时保持所有其他预测变量固定的对y的平均影响。

    例如,对于固定数量的youtube和报纸广告预算,在Facebook广告上花费额外的1000美元,平均可以使销售额增加大约0.1885 * 1000 = 189个销售单位。

    youtube系数表明,在所有其他预测变量保持不变的情况下,youtube广告预算每增加1000美元,我们平均可以预期增加0.045 * 1000 = 45个销售单位。

    我们发现报纸在多元回归模型中并不重要。这意味着,对于固定数量的youtube和报纸广告预算,报纸广告预算的变化不会显着影响销售单位。

    由于报纸变量不重要,因此可以  将其从模型中删除 ,以提高模型精度:

    最后,我们的模型公式可以写成如下:。  sales = 3.43+ 0.045*youtube + 0.187*facebook

    一旦确定至少一个预测变量与结果显着相关,就应该通过检查模型对数据的拟合程度来继续诊断。此过程也称为拟合优度

    可以使用以下三个数量来评估线性回归拟合的整体质量,这些数量显示在模型摘要中:

    与预测误差相对应的RSE(或模型 sigma )大致代表模型观察到的结果值和预测值之间的平均差。RSE越低,模型就越适合我们的数据。

    将RSE除以结果变量的平均值将为您提供预测误差率,该误差率应尽可能小。

    在我们的示例中,仅使用youtube和facebook预测变量,RSE = 2.11,这意味着观察到的销售值与预测值的平均偏差约为2.11个单位。

    这对应于2.11 / mean(train.data $ sales)= 2.11 / 16.77 = 13%的错误率,这很低。

    R平方(R2)的范围是0到1,代表结果变量中的变化比例,可以用模型预测变量来解释。

    对于简单的线性回归,R2是结果与预测变量之间的皮尔森相关系数的平方。在多元线性回归中,R2表示观察到的结果值与预测值之间的相关系数。

    R2衡量模型拟合数据的程度。R2越高,模型越好。然而,R2的一个问题是,即使将更多变量添加到模型中,R2总是会增加,即使这些变量与结果之间的关联性很小(James等,2014)。解决方案是通过考虑预测变量的数量来调整R2。

    摘要输出中“已调整的R平方”值中的调整是对预测模型中包含的x变量数量的校正。

    因此,您应该主要考虑调整后的R平方,对于更多数量的预测变量,它是受罚的R2。

    在我们的示例中,调整后的R2为0.88,这很好。

    回想一下,F统计量给出了模型的整体重要性。它评估至少一个预测变量是否具有非零系数。

    在简单的线性回归中,此检验并不是真正有趣的事情,因为它只是复制了系数表中可用的t检验给出的信息。

    一旦我们开始在多元线性回归中使用多个预测变量,F统计量就变得更加重要。

    大的F统计量将对应于统计上显着的p值(p 0.05)。在我们的示例中,F统计量644产生的p值为1.46e-42,这是非常重要的。

    我们将使用测试数据进行预测,以评估回归模型的性能。

    步骤如下:

    从上面的输出中,R2为   0.9281111 ,这意味着观察到的结果值与预测的结果值高度相关,这非常好。

    预测误差RMSE为 1.612069 ,表示误差率为 1.612069 / mean(testData $ sales) = 1.612069/ 15.567 = 10.35 % ,这很好。

    本章介绍了线性回归的基础,并提供了R中用于计算简单和多个线性回归模型的实例。我们还描述了如何评估模型的性能以进行预测。

    多元线性回归模型的基本原理包括哪些内容

    多元线性回归分析模型中估计系数的方法是:多元线性回归分析预测法多元线性回归分析预测法:是指通过对两个或两个以上的自变量与一个因变量的相关分析,建立预测模型进行预测的方法。当自变量与因变量之间存在线性关系时,称为多元线性回归分析。多元线性回归预测模型一般公式为:多元线性回归模型中最简单的是只有两个自变量(n=2)的二元线性回归模型,其一般形式为:下面以二元线性回归分析预测法为例,说明多元线性回归分析预测法的应用。二元线性回归分析预测法,是根据两个自变量与一个因变量相关关系进行预测的方法。二元线性回归方程的公式为:式中::因变量;x1,x2:两个不同自变量,即与因变量有紧密联系的影响因素。a,b1,b2:是线性回归方程的参数。a,b1,b2是通过解下列的方程组来得到。二元线性回归预测法基本原理和步骤同一元线性回归预测法没有原则的区别,大体相同。“多元线性回归分析预测法”百度百科链接:/view/1338395.htm


    免责声明: 本网刊载此文,是出于传递更多信息之目的,本网站所提供的信息仅供参考之用,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。若有来源标注错误或侵犯了您的合法权益,请及时与我们联系lnckzs@126.com,本站将会在24小时内处理完毕。

    加载中~

    相关推荐