Impala】【大数据基础】Impala是什么意思

2020-11-13 18:35发布

3条回答
橘子奶茶冻
2楼 · 2020-11-13 19:13

Impala是Cloudera公司主导开发的新型查询系统,它提供SQL语义,能查询存储在Hadoop的HDFS和HBase中的PB级大数据。

1234
3楼 · 2020-11-15 16:53

Impala是Cloudera公司推出,提供对HDFS、Hbase数据的高性能、低延迟的交互式SQL查询功能。提供实时的查询效果,官方测试性能比hive快10到100倍,其sql查询比sparkSQL还要更加快速,号称是当前大数据领域最快的查询sql工具。

征戰撩四汸
4楼 · 2022-03-21 16:54

Impala

  同样支持HBase sql查询的还有Phoenix,不过公司集群环境用的CDH,考虑到使用Impala安装管理会更方便点,最终就选择了Impala。Impala是Cloudera由C++编写的基于MPP(massively parallel processing)理念的查询引擎,由运行在CDH集群上的不同的守护进程组成,它跟Hive的metastore集成,共用database和tables等信息。

Impala具有下面几个优势:

  •  impala跟现有的CDH组件自动集成,数据可以被CDH中的各种组件共用

  •  支持sql查询hbase、hdfs、kudu等。

  •  impala只需要几秒钟或者分钟级别就能返回数据

  •  支持parquet、text、rcfile、hfile等文件格式


相关问题推荐

  • 回答 4

    需要

  • 回答 6
    已采纳

    以常用的编程语言php为例:window系统推荐:phpStudy v8.0 (针对Windows系统,免费)针对Windows系统,一键安装,可以自行选择软件版本,你可在本地或者服务器端搭建与配置PHP运行环境。主要功能:1. 全新界面,更美观,操作更清晰2. 安装包内置最新版本Apa...

  • 回答 1

    生产环境下应该如何搭配hadoop生态系统个组件版本查了很多资料,觉得不完善的话请在评论区补充,谢谢!:hadoopCHDhadoop生态系统生产环境版本搭配单机伪分布式Hadoop用于本机练习的话,hadoop版本自定义选择都可以,各个组件搭配也随意,也可以自己本机测试...

  • 回答 2

    一、Impala简介Cloudera Impala对你存储在Apache Hadoop在HDFS,HBase的数据提供直接查询互动的SQL。除了像Hive使用相同的统一存储平台,Impala也使用相同的元数据,SQL语法(Hive SQL),ODBC驱动程序和用户界面(Hue Beeswax)。Impala还提供了一个熟悉的面...

  • 回答 2

    catalog节点yum install -y impala-server impala impala-state-store impala-catalogworker 节点yum install -y impala-server impala配置打开 短路读取 和 打开块位置跟踪所谓的短路读取,就是允许impala把一些信息存储在本地磁盘上,可以加快计算的速度。...

没有解决我的问题,去提问