Tag archives for 大数据
开源的大数据查询引擎Presto
Presto是 Facebook 开源的大数据分布式 SQL 查询引擎,可对从数 G 到数 P 的大数据进行交互式的查询,查询的速度达到商业数据仓库的级别。支持查询包括 Hive、Cassandra …
英特尔分布式深度学习库BigDL
BigDL是英特尔开源的分布式深度学习库, 运行在 Apache Spark 集群上, 可简化从 Hadoop 的大数据集的数据加载。 特点: 提供全面的深度学习支持,包括数值计算(通过 Tensor…
Apache NiFi 1.0.0 发布,大数据管理分析工具
Apache NiFi 是一款简单易用且功能强大,非常可靠的处理和分发数据系统。Apache NiFi 是为数据流而存在的,支持高度可配置的数据路由、转换和系统调度逻辑直观图。 主要特性:  …
LinkedIn 开源其数据发现和管理工具 WhereHows
LinkedIn 近期开源了一个元数据中心工具 WhereHows,已经在 LinkedIn 内部长期使用。WhereHows 方便内部员工发现公司内部的数据,跟踪数据集的移动和查看各种内部工具和服务…