《深入浅出数据分析》读书笔记
学习《深入浅出数据分析》,为了加深记忆,边读边做笔记。如有侵权,立即删除。
数据分析引言:分解数据
数据分析就是仔细推敲证据
所有优秀的分析师,无论专长及目标如何,都会在工作过程中按顺序执行下面这个固定基本流程,同时通过经验数据来仔细推敲各种问题。
学习《深入浅出数据分析》,为了加深记忆,边读边做笔记。如有侵权,立即删除。
所有优秀的分析师,无论专长及目标如何,都会在工作过程中按顺序执行下面这个固定基本流程,同时通过经验数据来仔细推敲各种问题。
本文摘自《爱上统计学》,ISBN: 9787544268509,版权归其所有,如有侵权,立即删除。
1.方差分析(Analysis of variance)
检验两个或更多均值之间的差异。简单方差分析(ANOVA)只有一个独立变量,而析因方差分析检查一个以上独立变量的均值。一元方差分析检验两个以上的群体之间的均值差异。
2.算术平均值(Arithmetic mean)
集中趋势的一种测量方法,也就是将数据集的所有数值加起来然后除以数值的个数。
3.渐进性(Asymptotic)
正态曲线的性质,也就是曲线的双尾无限接近但永远不会与$x$轴相交。
4.平均值(Average)
一个数据集的最有代表性的值。
5.钟形曲线(Bell-shaped curve)
数据的分布以中均值、中位数和众数为中心是对称,而且双尾具有渐进性。
今天在检索OpenType 1.8的翻译时,找到了一篇很好的文章,内容详实,引入入胜,一口气看完了,特在此标记一下,方便以后回味。
参数化设计与字体战争:从 OpenType 1.8 说起来自Type is Beautiful作者谭 沛然
相关链接:
插值
本文转载自Category: DataVisualization,对于不明白的地方加了自己检索后的说明。
使用demo(graphics),可以查看R漂亮的图像演示。
1 | set.seed(1234) |
其中set.seed(),该命令的作用是设定生成随机数的种子,种子是为了让结果具有重复性。如果不设定种子,生成的随机数无法重现。
1 | sample(x, size, replace = FALSE, prob = NULL) |
x可以是任何对象,
size规定了从对象中抽出多少个数,size应该小于x的规模,否则会报错
replace默认是FALSE,表示每次抽取后的数就不能在下一次被抽取;TRUE表示抽取过的数可以继续拿来被抽取