最近在阅读数据挖掘相关书籍的过程中,发现很多数学公式都忘记怎么读了,特此记录一下。

阅读全文 »


一、数据分析必须遵循的原则

1.数据分析是为了验证假设的问题,提供必要的数据验证。
2.数据分析是为了挖掘更多的问题,并找到深层次的原因。
3.不能为了做数据分析而做数据分析。

二、数据分析的步骤

数据分析有极广泛的应用范围。典型的数据分析可能包含以下三个步骤:

1.探索性数据分析,当数据刚取得时,可能杂乱无章,看不出规律,通过作图、造表、用各种形式的方程拟合,计算某些特征量等手段探索规律性的可能形式,即往什么方向和用何种方式去寻找和揭示隐含在数据中的规律性。
2.模型选定分析,在探索性分析的基础上提出一类或几类可能的模型,然后通过进一步的分析从中挑选一定的模型。
3.推断分析,通常使用数理统计方法对所定模型或估计的可靠程度和精确程度做出推断。

阅读全文 »


文档的标题是《惊魂记》,其实有点夸张了,不过也确实让我吓了一跳。今天在内网电脑编辑项目立项单,在保存的时候弹出了一个窗口,大致扫了一眼是说文档权限不兼容之类的就没管,直接点了确定,然后突然发现桌面上这个文件竟然没有了!!!难道我花了昨天一天和今天上午的心血就要这样付诸东流了吗/(ㄒoㄒ)/~~

不行,我不能就这样放弃。首先我跑到回收站里去找,没有!我又跑到浏览器的下载文件里面去找,没有!!我又跑到常用文件夹中去找,还是没有!!!就在这时,我突然灵光一闪,然后打开Word,在最近使用的文档里面发现了这样一个奇怪的名字“~WRL0004.tmp”,打开一看,果然是我辛苦编辑的文件啊!啊啊啊啊,太高兴了有木有/(ㄒoㄒ)/~~

通过这件事告诉我一个道理:

  1. 重要文档不要放在桌面。
  2. 做事不能急躁,弹出窗口内容要仔细查看。


今天在将多个分表合并为一个表时,遇到了一个问题。这些分表由业务人员创建,其中一部分未加UNIQUE索引,导致这些表中的部分数据重复,需要删除其中的重复数据。

思路为:首先将数据按照字段A、B、C、D分组(如果A、B、C、D相同就认为数据重复),求出记录大于1的最大id,然后删除这个id的数据。sql语句如下:

1
2
3
DELETE FROM test WHERE id IN
(SELECT id FROM
(SELECT MAX(id) AS id,COUNT(*) AS COUNT FROM test GROUP BY A,B,C,D HAVING COUNT >1 ORDER BY COUNT DESC) AS tab );

备注:因为每次只删除重复数据的最大id,所以如果重复数据有多条的情况,需要执行多次delete。

阅读全文 »


创建用户

创建MySQL用户有两种方式:

  1. 通过使用创建用户语句,如 CREATE USERGRANT。首选方式,应为这种方式更加简洁而且更不容易出错。
  2. 通过使用 INSERT, UPDATE, DELETE 修改MySQL授权表。
1
CREATE USER 'monty'@'localhost' IDENTIFIED BY 'some_pass';

删除用户

1
DROP USER 'username'@'host';

创建一个只允许从本地登录的超级用户jack,并允许将权限赋予别的用户,密码为:jack.

1
GRANT ALL PRIVILEGES ON *.* TO jack@'localhost' IDENTIFIED BY "jack" WITH GRANT OPTION;
阅读全文 »
0%