
使用方便
可用于 Java、Scala、Python 和 R。
MLlib 适合Spark的 API,并与 Python(从 Spark 0.9 开始)和 R 库(从 Spark 1.5 开始)中的NumPy互操作 。您可以使用任何 Hadoop 数据源(例如 HDFS、HBase 或本地文件),从而轻松插入 Hadoop 工作流。
表现
高质量算法,比 MapReduce 快 100 倍。
Spark 擅长迭代计算,使 MLlib 能够快速运行。同时,我们关心算法性能:MLlib 包含利用迭代的高质量算法,并且可以产生比有时在 MapReduce 上使用的单遍近似更好的结果。
无处不在
Spark 在 Hadoop、Apache Mesos、Kubernetes 上独立运行,或在云中针对不同的数据源运行。
您可以使用其独立集群模式在EC2、Hadoop YARN、Mesos或Kubernetes上运行 Spark 。访问HDFS、 Apache Cassandra、 Apache HBase、 Apache Hive和数百个其他数据源 中的数据。
数据统计
数据评估
关于MLlib(ApacheSpark)特别声明
本站天天导航提供的MLlib(ApacheSpark)都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由天天导航实际控制,在2025年8月22日 上午7:20收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,天天导航不承担任何责任。
相关导航

Levity使非技术用户能够创建...

MAHOUT
开箱即用的分布式后端,或者可以扩展到其他分布式后端。

Keras
KerasPython版本的TensorFlow...

Procys
使用Procys自动从您的发票中...

Smoking Robot AI
里面的工具是一个目录的人工智能(AI)工具,评论和新闻。用户可以按类别浏览AI工具,提交自己的工具,并获得2023年十大令人费解的AI工具。

Datawhale
一个专注于AI开源组织,和学习者一起成长,让学习不再孤独。

DiffusionGPT
一个创新的文本到图像生成系统,它通过结合大语言模型的解析能力和领域专家模型的生成能力,实现了从多样化文本提示到高质量图像的高效转换。

Tabnine
Tabnine是一个AI代码助手,让你成为一个更好的开发人员,软件开发人员的人工智能助手,全行代码和全功能代码完成更快。
暂无评论...
