安装weka前需要先安装java吗
python和weka区别?
python和weka区别?
Weka的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),是一款免费的,非商业化(与之对应的是SPSS公司商业数据挖掘产品--Clementine )的,基于JAVA环境下开源的机器学习(machine learning)以及数据挖掘(data mining)软件。py thon比较方便,简洁,自由度高,模块,丰富语法简练,并渐渐地取代了weka。
如何优雅地转向大数据方向?
加米谷大数据为大家整理了Ofer Mendelevitch自己的观点。以下是他对不同人群给出的具体建议:
Java程序员
作为Java开发者,你对软件工程的规则已经了然于心,第一步需要了解机器学习的各种算法:现在有哪些算法,都能解决哪些问题以及如何实现。另外还需要学习使用R和Matlab等建模工具,此外WEKA、Vowpal Wabbit和OpenNLP等库也为大多数常见算法提供了经过验证的实现方法。如果你还不太熟悉Hadoop,也可以选择加米谷大数据带你入行!
Python程序员
如果你是Python程序员,对软件开发和脚本编写一定很熟悉,也许已经在使用很多数据科学中常见的库例如NumPy和SciPy。
Python对数据科学应用的支持很好,尤其是NumPy/Scipy, Pandas, Scikit-learn, IPython等用于探索性分析的库,在处理大型数据集方面,多学些Hadoop及其与Python的流式集成。
统计学从业者
如果你有统计学或者机器学习的背景,对于R、Matlab和SAS等工具一定非常熟悉,对于很多机器学习算法都有很成熟的实现方法。但是,这些工具通常被用于做数据勘探和模型开发,很少单独用来开发产品级的数据产品。显然,熟悉一门现代编程语言,例如Java是你的首要任务。
业务分析师
如果你的背景是SQL,那么说明你已经跟数据打交道很多年了,你很清楚如何通过数据获取业务分析结果。Hive能让你以你熟悉的SQL语言访问Hadoop上的大数据集,因此是你步入大数据殿堂的首选。
总结
通向大数据之路不可能一帆风顺,你必须学习很多新规则和最少一门编程语言,更重要的是还要积累实战经验(加米谷大数据培训机构所有项目均来自真实企业的真实项目)。这些都需要时间、精力以及金钱投入,但最终你会发现一切都物超所值。