目前Hadoop生态系统有许多、存储、处理、分析和组织大数据。一些应用程序和使用 Hadoop 运行的应用程序包括: Spark, 一个 开源的 分布式处理系统。一般用于容纳大数据。Apache Spark 使用内部内存来存储 缓存 并优化进程,从而提高性能。
Spark 还支持通用处理 流分析
机器学习、图形数据库和 即席查询。 Presto, 一个 开源 分布式 SQL 查询引擎,用于低延迟和 即席数据分析。 Presto 可以处 菲律宾 WhatsApp 号码数据 理来自各种来源的数据,包括 Hadoop 分布式文件系统 (HDFS) 和 Amazon S3。
Hive, Hive用户可以通过SQL接口使用Hadoop MapReduce,使得大规模分析过程成为可能。 HBase 是一个 开源 、断开连接且版本化的数据库,在 Amazon S3 或 HDFS 上运行。
HBase具有可扩展性以分布式
随机的方式存储大数据,并可以 实时 访问由数十亿行和列组成的监控表。 Zeppelin 是一款交互式笔记本,可以进行交互式数据探索。
同时,在速度方面,Hadoop将能够在很短的时间内存储和检索数据,因为它使用MapReduce编程模型。发生这 海湾电话号码 种情况的原因是,如果将查询发送到数据库,则现有任务或请求将在整个服务器中共享和分发,这样它们就不会按顺序完成,因为这会花费更长的时间。