Apache Mahout 0.10.1 发布,此版本是 Mahout 0.10.0 版本的修复版本,修复了一些 bugs,升级 Spark 到 Spark 1.2.2 版本,现已提供下载:http://www.apache.org/dist/mahout/0.10.1/。 值得关注的改进: 1. This release fixes a major memory usage bug in co-occurrence analysis used by the driver spark-itemsimilarity MAHOUT-1707 2. Support Spark 1.2.2 or less 3. Some minor fixes to Mahout-Samsara QR Decomposition and matrix ops. 4. Trim down packages size to < 200MB - MAHOUT-1704. 5. Minor testing indicates binary compatibility with Spark 1.3 except for the Mahout Shell, which does not run. 此版本总共解决了 9 个独立的 JIRA issues,包括 5 个 bug 修复。Mahout 0.10.2 计划 6 月 28 日发布。Mahout 0.11.0 计划特性:支持 Spark 1.3 序列文件编写;Spark Shell;Flink 作为后端集成。 更多内容请看发行说明。 Apache Mahout 是 Apache Software Foundation (ASF) 开发的一个全新的开源项目,其主要目标是创建一些可伸缩的机器学习算法,供开发人员在 Apache 在许可下免费使用。该项目已经发展到了它的最二个年头,目前只有一个公共发行版。Mahout 包含许多实现,包括集群、分类、CP 和进化程序。此外,通过使用 Apache Hadoop 库,Mahout 可以有效地扩展到云中。 Mahout 项目是由 Apache Lucene(开 源搜索)社区中对机器学习感兴趣的一些成员发起的,他们希望建立一个可靠、文档翔实、可伸缩的项目,在其中实现一些常见的用于集群和分类 的机器学习算法。该社区最初基于 Ngetal. 的文章 “Map-Reduce for Machine Learning on Multicore”,但此后在发展中又并入了更多广泛的机器学习方法。 Mahout 的目标还包括: 建立一个用户和贡献者社区,使代码不必依赖于特定贡献者的参与或任何特定公司和大学的资金。 专注于实际用例,这与高新技术研究及未经验证的技巧相反。 提供高质量文章和示例。 Apache Mahout 0.10.1 发布下载地址