大数据挖掘心得体会

时间：2020-04-01 04:12

数据挖掘学习心得体会

数据挖掘学习心得体会【篇一：数据挖掘心得体会】心得体会这次数据挖掘实验结束了，期间我们小组明确分工并积极去完成，虽然有点辛苦，但我感觉充实而有收获感

根据老师给的一些资料，我们决定采用sqlserver2000中的northwind数据库里的数据作为我们的实验数据。

根据表orderdetails中的数据，我们分别根据productid和orderid字段，并结合我们规定的最小支持度阀值对数据进行筛选。

依次筛选出1项频繁集、2项频繁集和3项频繁集，其中还会使用游标的方式来遍历2项集与3项集的候选集，分别选出2项频繁集和3项频繁集。

由于数据较多，因此过程比较复杂，要编写很多的查询语句，建立许多数据表，包括临时表。

开始不知道则操作，但经过我们各自多次重复的建表与查询，逐渐的理解和有了自己的思路。

尤其是在运用游标的方法进行遍历这块，因为我们比较陌生而不理解，操作时一时无法实现结果，但经过我们在网上查询了解相关知识，最终得以解决。

经过该次实验，使我对数据库的操作更加熟练，而且还使我对课本上的“挖掘频繁模式”这块知识有了很好的掌握，今后我会多做实验，使我在实际操作过程中学得更好

【篇二：数据挖掘与分析心得体会】正如柏拉图所说：需要是发明之母。

随着信息时代的步伐不断迈进，大量数据日积月累。

我们迫切需要一种工具来满足从数据中发现知识的需求

而数据挖掘便应运而生了。

正如书中所说：数据挖掘已经并且将继续在我们从数据时代大步跨入信息时代的历程中做

大数据心得体会

大数据心得体会早在2007年，人类制造的信息量有史以来第一次在理论上超过可用存储空间总量，近几年两者的剪刀差越来越大。

2010年，全球数字规模首次达到了“ZB”（1ZB＝1024TB）级别。

2012年，淘宝网每天在线商品数超过8亿件。

2013年底，中国手机网民超过6亿户。

随着互联网、移动互联网、传感器、物联网、社交网站、云计算等的兴起，我们这个社会的几乎所有方面都已数字化，产生了大量新型、实时的数据。

无疑，我们已身处在大数据的海洋。

有两个重要的趋势使得目前的这个时代（大数据时代）与之前有显著的差别：其一，社会生活的广泛数字化，其产生数据的规模、复杂性及速度都已远远超过此前的任何时代；其二，人类的数据分析技术和工艺使得各机构、组织和企业能够以从前无法达到的复杂度、速度和精准度从庞杂的数据中获得史无前例的洞察力和预见性。

大数据是技术进步的产物，而其中的关键是云技术的进步。

在云技术中，虚拟化技术乃最基本、最核心的组成部份。

计算虚拟化、存储虚拟化和网络虚拟化技术，使得大数据在数据存储、挖掘、分析和应用分享等方面不仅在技术上可行，在经济上也可接受。

在人类文明史上，人类一直执着探索我们处的世界以及人类自身，一直试图测量、计量这个世界以及人类自身，试图找到隐藏其中的深刻关联、运行规律及终极答案。

大数据以其人类史上从未有过的庞大容量、极大的复杂性、快速的生产及经济可得性，使人类第一次试图从总体而非样本，从混杂性而非精确

大数据时代,心得体会

大数据,心得体篇一：大数据时代记录与心得体会大数据时代书面记录与心得体会20XX年5月12日，听取了大数据时代相关技术的技术讲座。

当今，大数据的到来，已经成为现实生活中无法逃避的挑战。

每当我们要做出决策的时候，大数据就无处不在。

大数据术语广泛地出现也使得人们渐渐明白了它的重要性。

大数据渐渐向人们展现了它为学术、工业和政府带来的巨大机遇。

与此同时，大数据也向参与的各方提出了巨大的挑战。

大数据，其影响除了经济方面的，它同时也能在政治、文化等方面产生深远的影响，大数据可以帮助人们开启循“数”管理的模式，也是我们当下“大社会”的集中体现，三分技术，七分数据，得数据者得天下。

“大数据”的影响，增加了对信息管理专家的需求。

事实上，大数据的影响并不仅仅限于信息通信产业，而是正在“吞噬”和重构很多传统行业，广泛运用数据分析手段管理和优化运营的公司其实质都是一个数据公司。

麦当劳、肯德基以及苹果公司等旗舰专卖店的位置都是建立在数据分析基础之上的精准选址。

而在零售业中，数据分析的技术与手段更是得到广泛的应用，传统企业如沃尔玛通过数据挖掘重塑并优化供应链，新崛起的电商如卓越亚马逊、淘宝等则通过对海量数据的掌握和分析，为用户提供更加专业化和个性化的服务。

大数据在个人隐私的方面，大量数据经常含有一些详细的潜在的能够展示有关我们的信息，逐渐引起了我们对个人隐私的担忧。

一些处理大数据公司需要认真的对待这个问题。

听面向领域的数据驱动的数据挖掘心得体会王国胤主讲

1，关联规则的采样挖掘关则的通常与事务处理与关系数据库相关，务需要反复遍历数据因此在大数据集上将花费大量的时间。

有很多的算法可以改进关联规则算法的效率与精度，但在精度保证的前提下，采样是最直接与最简单的改进效率的方法。

2.分类的采样分类一般分为三种类型:决策树、神经网络及统计方法(如无偏差分析)，在这些算法中均有使用采样的案例。

分类的采样一般有四种，一种是随机采样，另外三种是非随机采样，分别是“压缩重复”、“窗口”及“分层”。

3.聚类的采样在聚类中进行采样有若干的用途。

有些聚类算法使用采样进行初始化工作，例如，利用采样得到的样本得到初始化的参数，然后再对大数据集进行聚类。

当处理大数据集时，需要降低算法使用的空间。

为了得到较好的聚类，根据数据的分布情况需要采用不同的采样方法。

随机采样仍然是一种常规的方法，在随机采样忽略了小的聚类的情况下，一般采用非随机采样的方法。

非随机采样的方法中最常用的是分层采样。

例如，在密度差别很大的数据集中，根据密度的不同，采样的样本数量可以不同，在密度较高的区域采样的次数少一些，而在密度稀疏的区域，采样的次数多一些。

4.扩充(Scaling-Up)的数据挖掘算法的采样扩充是指利用已有的数据挖掘算法能够高敛地处理大数据集。

当数据挖掘的算法初期是处理小数据集的情况下，处理大数据集就会受到限制。

在这种情况下，一般会采用分而抬之的方法:将大数据集分解成较小的互不重叠的数据集，利用己有算法进行处理，然后，将小数据集得出的结果合并成最终的结果。

需要注意的是，这种方法等价于将困难转嫁到合并步骤，即需要复杂的处理才能得到正确的结果。

因此，整体的复杂性没有降低。

平九刘谛伊颂筌序赵皎伯圆访谆妃袭准巨一京堂

心得体会：学习《智能时代》和《大数据时代》心得体会

对于大数据的认识和理解这学期选修了网络工程这门课程，当时是抱着扫盲的态度选的这门课程，给自己定的目标不高，只需要对一些基础的概念和网络结构有些认识就可以，以免以后在人前谈论的时候不至于成为IT文盲，被一些专业性的技术人员所吓倒。

事实证明，态度决定一切，由于自己刚开始设定的目标就比较低，所以注定能够上升到的水平也就不高。

经过这几周的学习，对计算机网络的基础知识和大致结构有了一个粗浅的认识。

由于学生本身这方面的基础不扎实，知识结构在这方面比较薄弱，所以不能在技术方面进行深入的研究，只能对一些理论性的知识做一些了解和认识，建立起大概的知识框架。

在学习过程中，魏忠老师所提及的知识中有一点印象最为深刻，关于大数据BigData方面的提及引起了我很大的兴趣，越是自己私下里做了一些阅读和查询（主要是维克托·迈尔-舍恩伯格的《大数据时代》和网络上查看的一些资料）。

最后提交的这篇课程总结就着重报告一下自己在阅读了他人关于大数据的一些理论后自身的认识。

在这之前，我发现身边很多人都提起过大数据，其中包括老师和同学。

可是对于这些热门的新技术、新趋势人们往往趋之若鹜却又很难说的透彻，如果你问他大数据和你有什么关系

估计很少同学能说出一二三来。

究其原因，一是因为大家对新技术有着相同的原始渴求，至少知其然在聊天时不会显得很“无知”，因为现在人们普遍都有以一种信息焦虑感，别人知道的东西我不知道，就会感到焦虑，无论这些信息

我是学Java的，想尝试大数据和数据挖掘，该怎么规划学习

两个工作内容联系不大，你是学习java的，我就主要介绍数据挖掘吧数据挖掘是提据、建立模型分析数据、得出结果后与需求部门进行沟通的一个职业。

举个例子：银行的事业部有很多潜在的贷款申请者，事业部向数据挖掘人员提出需求，希望能够分析哪些申请者是优质放贷对象

数据挖掘人员首先要充分理解事业部的需求，其次要从数据库提取相关数据，提取数据的工作有些时候是由DBA来完成，好了，现在你得到了历史数据，你的任务就是通过历史数据来建立模型，分析具备什么特征的申请者是有能力还贷、不拖欠的，然后用建立好的模型来预测我们刚刚得到的新的一批申请者。

再具体一点：例如，我们通过历史数据发现，年龄大于35岁，的男性，已婚，家庭人口大于3，收入在12000元以上的申请者是理想的放贷对象，那么我们用这个标准来限定新的申请者。

当然我举的例子，为了浅显易懂，是非常简单的示意例子，实际情况要复杂得多，会涉及到个人的贷款历史、信用评估、自然属性、社会属性、资产评估等情况——就是说，数据挖掘人员是要通过数据库中的海量数据，整理出哪些是有用数据，再用这些有用的数据来分析其它部门的问题，帮助他们解决问题，或者为公司的发展提供数据依据数据挖掘的上升方向是：数据挖掘——产品层——决策层java是属于开发，比如开发软件、接口、应用程序等，如果一个公司需要开发数据挖掘软件，那么则需要数据挖掘知识+java开发能力，只有在这种时候，才需要两个都具备但是一般自主开发数据挖掘软件的公司很少，第一需要消耗大量人力物力，第二市场有很多现成的软件，没必要开发。

如果你想从事数据挖掘，你必须具备：数据挖掘模型、算法的数学知识以及一些数据分析软件（SPSS、SAS、matlab、clementine）一些数据库相关的知识（oracle、mySQL）了解市场、其它部门需求当然这些都是一点一滴积累起来的，没必要一蹴而就，特别是对市场、行业的了解以及对公司其它部门的需求的理解非常重要，这决定了你能否从基础的分析人员上升到产品层、决策层，都是要在实际的工作中积累起来的至于放弃java什么的，我觉得真的不是放弃，因为你具备了java的基础，一定能派上用场，比如技术型产品经理（face book的扎克伯格和腾讯的马化腾都是技术型产品经理），这种产品经理能够清晰的把握产品的开发过程，还有市场知识。

总结起来就是没有什么东西会浪费掉，你学的所有的东西都将在工作中派上用场，只是你遇到的情况不够多不够复杂而已

谈谈你对数据仓库和数据挖掘的认识

对客户给的数据进行某些操作，得到客户想要的结果。

用的工具是Informatica, Congos, DataStage什么的，我们项目主要用informatica,因为和IBM是竞争对手，最核心的部分是ETL开发，也就是套用SQL(PL\\\/SQL)语句以及工具，建立工作流，调用建立的mapping，处理数据，得到最终的结果，这就是我的理解。