Intro to Modeling, Simple Linear Regression

Recording
Slides
Type
Lecture
这一节简单引入了模型,开始介绍一些模型、损失函数相关的东西了。
 

回归线、相关系数

皮尔逊相关系数只能衡量是否有线性关系

模型

模型是一个系统的理想的表达方式
why:
  • 去理解我们生活的这个复杂的世界
  • 去预测未发生的事件
在可解释和准确率之间权衡
两类最常见的模型:
  1. 物理模型,描述世界
  1. 统计模型,描述变量的关系
建模流程:
  1. 选择一个模型,如何表达这个关系
  1. 选择一个损失函数,如何量化预测误差
  1. 拟合模型,在给定的数据集上找到最佳的参数
  1. 评估模型性能,评估得到模型是否有很好的拟合数据
 
模型创建的是联系,而非因果关系。例,在y=2x,表示如果x相差1,那么y将相差2,而不能理解为如果x增加1,y将增加2
 
 
notion imagenotion image
在建模前,始终要观察数据,然后选择合适的模型