Visualizations II
首先讲了核密度估计函数,然后讲解了一些绘图的理论,感觉信息密度不是很大
核密度估计函数
在每个数据点上放一个高斯函数,然后将所有高斯函数归一化,最后叠加起来



Visualization Theory
可视化的目的是为了帮助我们理解数据,以及把数据的结果或者结论传达给别人
坐标轴
- 不要在同一轴上使用两种不同的刻度!

调色板
绘制热力图时需要使用感知均匀的配色:
- Jet, No. 以前matplotlib默认的调色板,不是感知均匀的,不推荐使用了
- Viridis, Yes 是感知均匀的,由伯克利数据科学研究所的人创建的 matplotlib colormaps (bids.github.io)
- Turbo, Jet的替代,由Google创建 Turbo, An Improved Rainbow Colormap for Visualization – Google AI Blog (googleblog.com)
不要将红色和绿色放一起使用,对红绿色盲不友好
定量数据的顺序与发散的颜色图
- 看数据的大小是否于重要性相关,如果有关,则使用sequential策略
- 如果数据的大小同等重要,则使用diverging 策略

一些特定领域的调色板:Beautiful colormaps for oceanography: cmocean — cmocean 0.02 documentation (matplotlib.org)

标记
- 条形图的长短是容易区别的
- 面积难以区别
- 柱状图不要堆积,因为基线改变了,所以不好判断大小





注:这里保留我个人意见:左图虽然堆积,但是个人感觉比右图更加清晰。