如何学习数据挖掘?
发布时间:2023-04-07 07:52:10
有很多初学者曾向沈浩老师提问,各种有关学习数据分析、数据挖掘、统计分析等方面的问题,沈老师认为,每个人都有自己的学习路径,还有自己的知识结构和期望的职业生涯,要得到一个统一的答案是困难的!以下为沈老师的回复,分享给初学者。
提问内容:
您好!我是电信的一名新入职员工,我期望自己能够在企业内从事跟数据挖掘的工作,期望通过数据挖掘这个工具来挖掘用户深层次的需求和研究用户的使用习惯及消费特点。
我在网上查阅过数据挖掘的专家的博客,有人提到如果在企业内从事数据挖掘方面的应用工作,需要掌握相关的数理统计知识,懂得使用相关软件,请问是这样的吗?还需要掌握数据仓库和程序算法方面的知识吗?因为我从本科到研究生都是学习管理方向的,数学方面的基础相对薄弱。
另外,如果我要入门,从哪个方面入手比较好?有什么合适的参考书吗?请你不吝赐教。
沈老师的答复:
我认为你作为企业员工对数据挖掘感兴趣,最主要的就是从应用和解决问题开始,数据挖掘只是数据分析的一个重要工具和解决方法之一!
数量统计知识方面:
我认为统计思想是数学在实践中最重要的体现,但对于实际工作者最重要的是掌握统计思想,其实统计理论非常复杂,但实际应用往往是比较简单的!比如,很多人都在大学学习假设检验,但实际应用中假设就是看P值是否小于0.05,但是H0是什么?拒绝还是接受的是什么现实问题;要理解!
掌握软件问题:
从软件角度学,是非常好的思路,我基本上就是这样学的。我常说编软件的人最懂理论,否则编不出来,编软件的人最知道应用,否则软件卖不出去;现在软件越来越友好,把软件自带案例做一遍,你会自觉不自觉的掌握软件解决问题的思路和能解决的问题类型;
数据仓库问题:
OLAP和数据挖掘是数据仓库基础上的两个增值应用,从企业整体角度,数据挖掘应该建立在企业数据仓库完备的基础上。所以说数据仓库是针对企业级数据挖掘应用提出的,但我们应该记住,企业从来不是为了数据挖掘而建立数据仓库,而是因为有了数据仓库后必然会提出数据挖掘的需求!现在随着数据挖掘软件的工具智能化,以及数据仓库和ETL工具的接口友好,对数据库层面的要求越来越少;
数学不好可能反应了一个人思考问题的方式或深入理解问题的能力,但数学不是工具是脑具,不断解决问题的过程可以让我们思考问题更数学化!
我建议:
一步一步来!先把本职工作中的数据分析问题理解好!
1、熟练掌握Excel软件工具,这个可以看《Excel高级应用与数据分析》,我写的书,当然有很多Excel论坛和网站,从我的博客就可以连接到。
2、学习好统计分析方法,我不是单指统计原理,而是统计分析方法,比如回归分析,因子分析等,不断进入统计分析解决问题的思考方式;这个可以看看SPSS软件方面的书和数据案例,通过软件学习解决数据分析的统计问题,这方面的书很多,当然你也可以关注我的博客,不断增加统计分析方法解决数据分析问题的思路,自己对照着完成!
在上述问题有了比较好的理解后,也就是你应该算是一个数据分析能手的时候,开始进入数据挖掘领域,你会发现用数据挖掘思想解决问题具有智能化、自动化的优势。
3、接下来,你需要考虑数据建模的过程,通过学习Clementine软件或SAS的挖掘工具,不断理解数据挖掘与原来的数据分析工具有什么不同或优势!
4、当前面都是了解并且能够得心应手后,你就要有针对性的掌握你工作所在行业的问题,例如:电信行业的解决方案问题:客户流失、客户价值、客户离网、客户保持、客户响应、客户交叉销售等商业模型,同时与数据分析和数据挖掘统一在一起的解决方案!
5、接下来,你应该掌握数据库的一些原理和操作,特别是SQL语言的方式。
6、到了这个阶段,就应该有全面解决问题的能力,比如挖掘出来的知识或商业规则如何推送到营销平台上等等。梳理自己的知识结构,不仅会操作,现在你应该成为专家了,要能够宣扬你的知识能力和领导力,当然也要表明你在数据挖掘领域的专业特长。要经常帮助同事和行业朋友,比如帮助解决数据分析问题,帮助咨询,甚至给大家讲课,这对你的知识梳理和能力的提高非常重要,你的自信心会更强!


猜你喜欢
- 这篇文章主要介绍了Windows用来定位DLL的搜索路径,有不明白的朋友可以参考下《程序员面试宝典》一书中写到,windows搜索dll文件
- 在用EXCEL中,我们常常用到函数,你知道该如何使用函数吗?那么在EXCEL表格中怎么使用IMSUM函数呢?下面小编就为大家详细介绍一下,来
- 我们使用光速输入法打字输入,更多的时候不是用的第一候选词,而是用的第二或者第三候选词,那么如果能设置一下输入法的二三候选词,那么我们打完拼音
- 据系统部落小编消息,NVIDIA已正式发布GeForce Game Ready 512.59 WHQL驱动程序,不仅新增了Reflex St
- 经过漫长的等待之后,微软终于开始了Windows 10 19H2 v1909更新版的内测工作,也重新定义了“春天”。Windows 10发布
- 微软今天放出了 Windows 11 Build 22000.51 预览版,如果你想要尝鲜或者冒险,那么本文分享如何免费下载和安装 Wind
- Excel中的重复数据经常需要通过筛选功能进行筛选出来,重复数据具体该如何进行筛选呢?下面是由小编分享的excel表格筛选重复数据的教程,以
- 在excel表格中,做判定操作是常常使用if函数,那if函数该怎么使用呢?1、在excel中打开需要使用if函数的表格。如示例中需要给学生按
- 前面我们了解了在Word2007中分栏的设置,相信很多朋友已经学会了,而如果想要对网上下载的分栏文档中进行取消,该怎么办呢?下面小编就来和大
- 刚毕业走向职场的人来说,一般都会开启一项“被动技能”——加班。上司经常会在临近下班的时候布置工作任务,比如,做个XXX的演示文稿。那么如何又
- 软键盘是对于真实电脑键盘的一种模拟,在很多时候我们都会有遇到需要打开软键盘。比如:在网上付款或者要打开一些机密的文件需要输入密码,这时候软键
- Word最为一款专业的文字处理排版软件,还可以用来画图。不仅方便,而且操作起来也非常简单。当然,也有很多人觉得用Word画图比较困难,根据本
- mac上有什么好的投屏软件嘛?苹果手机ios投屏到mac用哪款投屏软件,mac投屏ipad该用哪款软件怎么操作,macdown小编给大家介绍
- 小勾学习圈上不了网怎么办?小勾学习圈app是一款非常有意思的学习教育软件。最近有用户反映,小勾学习圈连不上网,该怎么解决?下面就是小勾学习圈
- 近期有用户反映,电脑在更新Windows 11 Insider Preview 25252.1000后,出现了应用和已压缩的文件点击毫无反应
- 很多用户更新了win11系统以后,不喜欢win11任务栏,想和之前win10一样设置透明的。但是win11的设置中找不到透明设置,其实我们可
- 如果你经常使用到PPT的话,那么这个方法会大大提高你的后悔次数。在制作PPT模板的过程中,可能需要经过多次修改,并且对比效果,如果不满意的话
- 解决方法如下:1、使用快捷键CTRL+H,调出替换工具 2、在“查找内容”中填写通配符“(^$)”,要注意括号中有
- Excel 中复制公式到相邻单元格时,可使用“下拉”和“右拉”方式快速复制公式到指定单元格位置,步骤如下:在第一个单元格输入公式;选中该单元
- 用word时候。在修改、审阅word文档时,有时需要添加批注,写下笔记等,那么word批注怎么做?下面小编就为大家介绍word编辑批注方法,