今天在将多个分表合并为一个表时,遇到了一个问题。这些分表由业务人员创建,其中一部分未加UNIQUE索引,导致这些表中的部分数据重复,需要删除其中的重复数据。

思路为:首先将数据按照字段A、B、C、D分组(如果A、B、C、D相同就认为数据重复),求出记录大于1的最大id,然后删除这个id的数据。sql语句如下:

1
2
3
DELETE FROM test WHERE id IN
(SELECT id FROM
(SELECT MAX(id) AS id,COUNT(*) AS COUNT FROM test GROUP BY A,B,C,D HAVING COUNT >1 ORDER BY COUNT DESC) AS tab );

备注:因为每次只删除重复数据的最大id,所以如果重复数据有多条的情况,需要执行多次delete。

阅读全文 »


创建用户

创建MySQL用户有两种方式:

  1. 通过使用创建用户语句,如 CREATE USERGRANT。首选方式,应为这种方式更加简洁而且更不容易出错。
  2. 通过使用 INSERT, UPDATE, DELETE 修改MySQL授权表。
1
CREATE USER 'monty'@'localhost' IDENTIFIED BY 'some_pass';

删除用户

1
DROP USER 'username'@'host';

创建一个只允许从本地登录的超级用户jack,并允许将权限赋予别的用户,密码为:jack.

1
GRANT ALL PRIVILEGES ON *.* TO jack@'localhost' IDENTIFIED BY "jack" WITH GRANT OPTION;
阅读全文 »


学习《深入浅出数据分析》,为了加深记忆,边读边做笔记。如有侵权,立即删除。

数据分析引言:分解数据

数据分析就是仔细推敲证据

所有优秀的分析师,无论专长及目标如何,都会在工作过程中按顺序执行下面这个固定基本流程,同时通过经验数据来仔细推敲各种问题。
数据分析的基本流程

阅读全文 »


本文摘自《爱上统计学》,ISBN: 9787544268509,版权归其所有,如有侵权,立即删除。

1.方差分析(Analysis of variance)
检验两个或更多均值之间的差异。简单方差分析(ANOVA)只有一个独立变量,而析因方差分析检查一个以上独立变量的均值。一元方差分析检验两个以上的群体之间的均值差异。

2.算术平均值(Arithmetic mean)
集中趋势的一种测量方法,也就是将数据集的所有数值加起来然后除以数值的个数。

3.渐进性(Asymptotic)
正态曲线的性质,也就是曲线的双尾无限接近但永远不会与$x$轴相交。

4.平均值(Average)
一个数据集的最有代表性的值。

5.钟形曲线(Bell-shaped curve)
数据的分布以中均值、中位数和众数为中心是对称,而且双尾具有渐进性。

阅读全文 »


阅读《金字塔原理》,摘录书中附录三的内容,版权归其所有,如有侵权,立即删除。

话说这本书理解起来真的有点费劲,可能是自己的逻辑思维不强吧/(ㄒoㄒ)/~~,摘录书中主要内容,留在今后慢慢理解。

第1章 为什么要用金字塔结构

1.为了交流方便,必须将思想(观点、结论、要点、论点、论据、建议、行动、步骤等)归类分组。
2.将分组后的思想,按照不同层次,进行抽象提炼、总结概括,搭建金字塔。
3.向读者介绍(传递、阐述、论证)思想最有效的途径,是结论先行,自上而下表达。
4.金字塔中的思想,应遵守4个基本原则。
5.条理清晰的关键,是把你的思想组织成金字塔结构,并在写作前用金字塔原理检查。

阅读全文 »
0%