如何学习数据挖掘?
发布时间:2023-04-07 07:52:10
有很多初学者曾向沈浩老师提问,各种有关学习数据分析、数据挖掘、统计分析等方面的问题,沈老师认为,每个人都有自己的学习路径,还有自己的知识结构和期望的职业生涯,要得到一个统一的答案是困难的!以下为沈老师的回复,分享给初学者。
提问内容:
您好!我是电信的一名新入职员工,我期望自己能够在企业内从事跟数据挖掘的工作,期望通过数据挖掘这个工具来挖掘用户深层次的需求和研究用户的使用习惯及消费特点。
我在网上查阅过数据挖掘的专家的博客,有人提到如果在企业内从事数据挖掘方面的应用工作,需要掌握相关的数理统计知识,懂得使用相关软件,请问是这样的吗?还需要掌握数据仓库和程序算法方面的知识吗?因为我从本科到研究生都是学习管理方向的,数学方面的基础相对薄弱。
另外,如果我要入门,从哪个方面入手比较好?有什么合适的参考书吗?请你不吝赐教。
沈老师的答复:
我认为你作为企业员工对数据挖掘感兴趣,最主要的就是从应用和解决问题开始,数据挖掘只是数据分析的一个重要工具和解决方法之一!
数量统计知识方面:
我认为统计思想是数学在实践中最重要的体现,但对于实际工作者最重要的是掌握统计思想,其实统计理论非常复杂,但实际应用往往是比较简单的!比如,很多人都在大学学习假设检验,但实际应用中假设就是看P值是否小于0.05,但是H0是什么?拒绝还是接受的是什么现实问题;要理解!
掌握软件问题:
从软件角度学,是非常好的思路,我基本上就是这样学的。我常说编软件的人最懂理论,否则编不出来,编软件的人最知道应用,否则软件卖不出去;现在软件越来越友好,把软件自带案例做一遍,你会自觉不自觉的掌握软件解决问题的思路和能解决的问题类型;
数据仓库问题:
OLAP和数据挖掘是数据仓库基础上的两个增值应用,从企业整体角度,数据挖掘应该建立在企业数据仓库完备的基础上。所以说数据仓库是针对企业级数据挖掘应用提出的,但我们应该记住,企业从来不是为了数据挖掘而建立数据仓库,而是因为有了数据仓库后必然会提出数据挖掘的需求!现在随着数据挖掘软件的工具智能化,以及数据仓库和ETL工具的接口友好,对数据库层面的要求越来越少;
数学不好可能反应了一个人思考问题的方式或深入理解问题的能力,但数学不是工具是脑具,不断解决问题的过程可以让我们思考问题更数学化!
我建议:
一步一步来!先把本职工作中的数据分析问题理解好!
1、熟练掌握Excel软件工具,这个可以看《Excel高级应用与数据分析》,我写的书,当然有很多Excel论坛和网站,从我的博客就可以连接到。
2、学习好统计分析方法,我不是单指统计原理,而是统计分析方法,比如回归分析,因子分析等,不断进入统计分析解决问题的思考方式;这个可以看看SPSS软件方面的书和数据案例,通过软件学习解决数据分析的统计问题,这方面的书很多,当然你也可以关注我的博客,不断增加统计分析方法解决数据分析问题的思路,自己对照着完成!
在上述问题有了比较好的理解后,也就是你应该算是一个数据分析能手的时候,开始进入数据挖掘领域,你会发现用数据挖掘思想解决问题具有智能化、自动化的优势。
3、接下来,你需要考虑数据建模的过程,通过学习Clementine软件或SAS的挖掘工具,不断理解数据挖掘与原来的数据分析工具有什么不同或优势!
4、当前面都是了解并且能够得心应手后,你就要有针对性的掌握你工作所在行业的问题,例如:电信行业的解决方案问题:客户流失、客户价值、客户离网、客户保持、客户响应、客户交叉销售等商业模型,同时与数据分析和数据挖掘统一在一起的解决方案!
5、接下来,你应该掌握数据库的一些原理和操作,特别是SQL语言的方式。
6、到了这个阶段,就应该有全面解决问题的能力,比如挖掘出来的知识或商业规则如何推送到营销平台上等等。梳理自己的知识结构,不仅会操作,现在你应该成为专家了,要能够宣扬你的知识能力和领导力,当然也要表明你在数据挖掘领域的专业特长。要经常帮助同事和行业朋友,比如帮助解决数据分析问题,帮助咨询,甚至给大家讲课,这对你的知识梳理和能力的提高非常重要,你的自信心会更强!
猜你喜欢
- 本文将教你如何在Windows或macOS系统中取消保护Excel工作表。如果工作表设有密码,你可以用谷歌工作表或VBA脚本(在Excel早
- 在办公的时候,我们会经常要使用打印电子文档,那么怎么在Excel 里设置打印区域呢,可以很好的打印文档,下面小编通过本教程给大家介绍下exc
- Word怎么快速删除自动编号?Word自动编号在办公中对我们来说是个不错的功能,但是有时候不需要这种自动编号,回车就会自动输入,反而觉得是个
- win10系统自从推出以来,BUG,小问题很多,补丁打了又打。比如碰上了Windows开始菜单无法打开,那碰上了开始菜单打不开要怎么解决呢?
- 有时,为了确保Excel表格里数据的安全,很多人会对工作表设置密码保护。如果想撤销工作表保护,这时该如何操作呢?选中想要撤销保护的工作表,单
- 相信很多小伙伴在进行日常办公时,都会需要用到Word文档这款专业的文字处理办公软件。在Word文档中,我们可以设置标题自动分页。也就是将我们
- 一:1、在页眉双击,进行进入页眉编辑状态,选中页眉,按Delete键删除;2、单击页眉和页脚工具栏上的在页眉和页脚间切换按钮,进入页脚编辑区
- 在使用excel制作表格的时候,就经常需要合并和拆分单元格,不常用excel的朋友应该不知道应该怎么进行合并。下面就跟小编一起来看看吧。ex
- 昨天有同学问了一个模糊查找的问题,用vlookup无法实现,只能把lookup函数搬了出来。例1:表1为省市的提成表,表2的A列是详细地址,
- 近期有小伙伴反响电脑win10系统崩溃,不能入系统进行修复,这该怎么办呢?实际上我们可以用U盘从新下载一套系统进行安装,今天小编就带着详细的
- word2016怎么分页?这篇文章主要介绍了word2016分页图文教程,需要的朋友可以参考下word2016分页图文教程我们的目的是将新的
- 现如今,网络资源越来越丰富,我们可以利用的也越来越多,但有些网页上的表格并没有提供下载功能,是不是就不能用了呢?当然不,Excel2013可
- 当我们新建一个Word2003空白文档时,页面上不会显示该文档的页眉和页脚,如图一。图一 使用Word缺省模板新建的空白文档选择“视图”—“
- 当我们在Excel单元格中输入完数据后,按Enter键通常会移动到同列中下一行的单元格。可以通过设置改变按Enter键后的移动方向。&nbs
- Excel经常会显一些错误值信息,如#N/A!、#VALUE!、#DIV/O!等等。出现这些错误的原因有很多种,最主要是由于公式不能计算正确
- 在使用excel编辑数据的时候有些单元格是必须要填写的,所以为了防止漏填,或者忘记填写的情况。我们通常都会给这些单元格设置警示的标志,一般情
- excel函数公式合并多个工作表的方法【例】如下图所示工作簿中,A,B,C,D为4个格式相同行数可能不同的表格,需要把这4个表合并到“汇总”
- 安装Excel 2010版之后,有些用户的“开发工具”选项卡,并没有在Excel菜单之中。那么怎样在Excel 2010中显示“开发工具”选
- 当我们使用win101909版本系统时,如果由于某些情况需要修改系统的注册表,我们会发现它已被锁定。对于这个问题,我们都想知道win10 v
- 一般来说,Excel对汉字的排序方式都是按照拼音顺序来进行的,但是在一些特殊的时候,会要求按照笔画进行排序,其中最为常见的就是按照姓名笔画进