
怎么学习用r语言进行数据挖掘
首先R是一种专业性很强的统计语言,如果想学得快一些的话,基本的统计学知识要懂,不然很多东西会掌握的比
怎么学习用 R 语言进行数据挖掘
学习数据挖掘光会用R里的package是不够的。
如果给你一个真实的dataset(不是书里给你做练习用的数据),你怎么选择模型呢
建议楼主先不要纠结于R语言怎么用,而是先学习一下各个算法的原理和优劣。
都弄清楚了以后再选任意一门语言上手都是很容易的事情。
当了解了数据挖据的原理后,买一本R语言数据挖掘的书看看,就会了。
200挖掘机有几吨
1、 WekaWEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的可视化。
2、 Rapid MinerRapidMiner是世界领先的数据挖掘解决方案,在一个非常大的程度上有着先进技术。
它数据挖掘任务涉及范围广泛,包括各种数据艺术,能简化数据挖掘过程的设计和评价。
3、 OrangeOrange是一个基于组件的数据挖掘和机器学习软件套装,它的功能即友好,又很强大,快速而又多功能的可视化编程前端,以便浏览数据分析和可视化,基绑定了 Python以进行脚本开发。
它包含了完整的一系列的组件以进行数据预处理,并提供了数据帐目,过渡,建模,模式评估和勘探的功能。
其由C++ 和 Python开发,它的图形库是由跨平台的Qt框架开发。
4、 KnimeKNIME (Konstanz Information Miner) 是一个用户友好,智能的,并有丰演的开源的数据集成,数据处理,数据分析和数据勘探平台。
5、 jHepWorkjHepWork是一套功能完整的面向对象科学数据分析框架。
Jython宏是用来展示一维和二维直方图的数据。
该程序包括许多工具,可以用来和二维三维的科学图形进行互动。
6、 Apache MahoutApache Mahout 是 Apache Software Foundation (ASF) 开发的一个全新的开源项目,其主要目标是创建一些可伸缩的机器学习算法,供开发人员在 Apache 在许可下免费使用。
该项目已经发展到了它的最二个年头,目前只有一个公共发行版。
Mahout 包含许多实现,包括集群、分类、CP 和进化程序。
此外,通过使用 Apachehadoop库,Mahout 可以有效地扩展到云中。
7、 ELKIELKI(Environment for Developing KDD-Applications Supported by Index-Structures)主要用来聚类和找离群点。
ELKI是类似于weka的数据挖掘平台,用java编写,有GUI图形界面。
可以用来寻找离群点。
8、 RattleRattle(易于学习的 R 分析工具)提供数据的统计和可视化摘要,将数据转换成容易建模的形式,从数据中构建无监督和监督模型,以图形方式呈现模型的性能,并得出新的数据集。



