圭尔夫大学统计学习课程的主题包括:非参数和半参数回归;核方法;回归样条;局部多项式模型;广义加性模型;分类和回归树;神经网络。本课程涉及方法及其在适当软件中的应用。应用领域包括生物学、经济学、工程和医学。本文主要讲述了非参数回归(核回归和 LOWESS)相关方面的内容。
当无法检验线性回归等经典回归方法的假设时,或者当我们主要关注模型的可预测性而非其结构时,可以使用非参数回归。
XLSTAT 提供两种非参数回归: 核回归和 Lowess 回归。
1.核回归
核回归是一种建模工具,属于平滑方法系列。与线性回归不同的是,核回归主要用于预测。线性回归既可用于解释现象,也可用于预测现象(了解现象以便日后预测)。该模型的结构多变而复杂,就像一个过滤器或黑盒子。核回归有许多变体。
与所有建模方法一样,使用大小为 nlearn 的学习样本来估计模型参数。然后,可以使用大小为 nvals 的样本来评估模型的质量。最后,模型可应用于因变量 Y 值未知的 npred 预测样本。
核回归具有以下特性:
a.使用核函数,根据研究样本中观测值与预测观测值的 "距离 "对观测值进行加权。
b.与每个变量相关的带宽。它与观测值的内核和权重的计算有关,可以区分或改变变量的相对权重,同时根据观测值与预测观测值的距离,减少或增加学习样本中观测值的影响。
c.用于拟合模型与学习样本中观测值的多项式的度数。为限制多项式参数估计中学习样本的大小,提出了两种策略:滑动窗口和 k 近邻。
2.LOWESS 回归
局部加权回归和散点图平滑,或称 LOWESS 回归,是为了从散点图中生成平滑曲线而引入的。LOWESS 回归与核回归非常相似,也是基于多项式回归,并需要核函数对观测数据进行加权。
1.描述性统计。对于定量变量,会显示缺失值的数量、非缺失值的数量、平均值和标准差(无偏差)。对于定性变量(包括因变量),则用频率和百分比来表示类别。
2.相关矩阵:该表显示选定变量之间的相关性。
3.相关系数:该表列出了以下统计数据:
确定系数 R2;
模型误差(或残差)的平方和(SSE 或 SSR);
模型误差(或残差)的平方平均数(MSE 或 MSR);
模型误差(或残差)的平方平均数(RMSE 或 RMSR)。
4.预测值和残差:显示每个观测值的输入数据、模型预测值和残差的表格。
如果只选择一个定量解释变量或一个作为时间函数的时间变量,则第一张图显示数据和模型预测曲线。如果有多个解释变量,则第一张图显示观测数据和预测结果与第一个选定解释变量的函数关系。
学分高考专业课程辅导
①3500+海外硕博导师,Highmark承诺导师真实教育背景,假一赔三!
③根据学生情况进行1V1专属备课,辅导不满意随心退!
②试听课全面升级!让留学生听得安心!
④课程辅导产品升级赠送考前检验。
⑤中英双语详细讲解课程中的考点、难点问题,提供多方位的课后辅导!