Intro to Modeling, Simple Linear Regression
这一节简单引入了模型,开始介绍一些模型、损失函数相关的东西了。
回归线、相关系数
皮尔逊相关系数只能衡量是否有线性关系
模型
模型是一个系统的理想的表达方式
why:
- 去理解我们生活的这个复杂的世界
- 去预测未发生的事件
在可解释和准确率之间权衡
两类最常见的模型:
- 物理模型,描述世界
- 统计模型,描述变量的关系
建模流程:
- 选择一个模型,如何表达这个关系
- 选择一个损失函数,如何量化预测误差
- 拟合模型,在给定的数据集上找到最佳的参数
- 评估模型性能,评估得到模型是否有很好的拟合数据
模型创建的是联系,而非因果关系。例,在y=2x,表示如果x相差1,那么y将相差2,而不能理解为如果x增加1,y将增加2

在建模前,始终要观察数据,然后选择合适的模型