Presto是 Facebook 开源的大数据分布式 SQL 查询引擎,可对从数 G 到数 P 的大数据进行交互式的查询,查询的速度达到商业数据仓库的级别。支持查询包括 Hive、Cassandra 以及某些商业的数据存储产品。单个 Presto 查询可合并来自多个数据源的数据进行统一分析。Presto 不使用 MapReduce ,只需要 HDFS。

Facebook 在内部已经在多个数据存储中使用 Presto 交互式查询,包括 300PB 的数据仓库,超过 1000 个 Facebook 员工每天在使用 Presto 运行超过 3 万个查询,每天扫描超过 1PB 的数据。 Airbnb 和 Dropbox 目前也在使用 Presto 产品。

[repo owner=”prestodb” name=”presto”]