Scala 机器学习库

1、数据分析及数据可视化

  • MLlib in Apache Spark—Spark下的分布式机器学习库;

  • Scalding —CAscading的Scala接口;

  • Summing Bird—用Scalding 和 Storm进行Streaming MapReduce;

  • Algebird —Scala的抽象代数工具;

  • xerial —Scala的数据管理工具;

  • simmer —化简你的数据,进行代数聚合的unix过滤器;

  • PredictionIO —供软件开发者和数据工程师用的机器学习服务器;

  • BIDMat—支持大规模探索性数据分析的CPU和GPU加速矩阵库;

2、自然语言处理

  • ScalaNLP—机器学习和数值计算库的套装;

  • Breeze —Scala用的数值处理库;

  • Chalk—自然语言处理库;

  • FACTORIE—可部署的概率建模工具包,用Scala实现的软件库。为用户提供简洁的语言来创建关系因素图,评估参数并进行推断;

3、通用机器学习

  • Conjecture—Scalding下可扩展的机器学习框架;

  • brushfire—scalding下的决策树工具;

  • ganitha —基于scalding的机器学习程序库;

  • adam—使用Apache Avro, Apache Spark 和 Parquet的基因组处理引擎,有专用的文件格式,Apache 2软件许可;

  • bioscala —Scala语言可用的生物信息学程序库;

  • BIDMach—机器学习CPU和GPU加速库;

  • Figaro - 一个构造概率性模型的Scala库;



你可能感兴趣的:(数据分析,scala,机器学习,自然预言处理)