阅读《金字塔原理》,摘录书中附录三的内容,版权归其所有,如有侵权,立即删除。

话说这本书理解起来真的有点费劲,可能是自己的逻辑思维不强吧/(ㄒoㄒ)/~~,摘录书中主要内容,留在今后慢慢理解。

第1章 为什么要用金字塔结构

1.为了交流方便,必须将思想(观点、结论、要点、论点、论据、建议、行动、步骤等)归类分组。
2.将分组后的思想,按照不同层次,进行抽象提炼、总结概括,搭建金字塔。
3.向读者介绍(传递、阐述、论证)思想最有效的途径,是结论先行,自上而下表达。
4.金字塔中的思想,应遵守4个基本原则。
5.条理清晰的关键,是把你的思想组织成金字塔结构,并在写作前用金字塔原理检查。

阅读全文 »


本文转载自Category: DataVisualization,对于不明白的地方加了自己检索后的说明。

使用demo(graphics),可以查看R漂亮的图像演示。

1
2
3
4
5
set.seed(1234)
x<-sample(1:100,80,replace = FALSE)
y<-2*x+20+rnorm(80,0,10)
plot(x = x,y = y)
plot(x,y)

其中set.seed(),该命令的作用是设定生成随机数的种子,种子是为了让结果具有重复性。如果不设定种子,生成的随机数无法重现。

1
sample(x, size, replace = FALSE, prob = NULL)

x可以是任何对象,
size规定了从对象中抽出多少个数,size应该小于x的规模,否则会报错
replace默认是FALSE,表示每次抽取后的数就不能在下一次被抽取;TRUE表示抽取过的数可以继续拿来被抽取

阅读全文 »


聚类算法

聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法,同时也是数据挖掘的一个重要算法。
聚类(Cluster)分析是由若干模式(Pattern)组成的,通常,模式时一个度量(Measurement)的向量,或者是多维空间中的一个点。
聚类分析以相似性为基础,在一个聚类中的模式之间比不在同一聚类中的模式之间具有更多的相似性。

算法类 算法名 中文名
聚类算法 Canopy Clustering Canopy聚类
K-Means Clustering K均值算法
Fuzzy K-Means 模糊K均值
Expectation Maxmization EM聚类(期望最大化聚类)
Mean Shift Clustering 均值漂移聚类
Hierarchical Clustering 层次聚类
Dirichlet Process clustering 狄利克雷过程聚类
Latent Dirichlet Allocation LDA聚类
Spectral clustering 谱聚类
阅读全文 »


学习《爱上统计学》,为了加深记忆,边读边做笔记。如有侵权,立即删除。

计算和理解平均数

描述统计(descriptive statistics)

描述统计常用于整理、描述所收集数据的特征。如描述大学最流行的的专业是什么。

推论统计(inferential statistics)

推论统计通常是(但并非总是)数据收集和汇总的下一步。推论统计常利用较小群体的数据来推论可能的较大群体的特征。

计算和理解平均数

平均数也叫做几种趋势量数(measures 偶发central tendency),一般有三种形式:均值、中位数和众数。参看Wiki百科

阅读全文 »
0%