生产环境下应该如何搭配hadoop生态系统个组件版本

查了很多资料，觉得不完善的话请在评论区补充，谢谢！：

hadoop
CHD
hadoop生态系统
生产环境版本搭配

单机伪分布式Hadoop

用于本机练习的话，hadoop版本自定义选择都可以，各个组件搭配也随意，也可以自己本机测试下版本兼容问题

常用版本搭配

Hadoop 1.2 + HBase 0.94.9 + Hive 0.10.0

Hadoop 2.2.0 + HBase 0.94.2 + Hive 0.13.1

Hadoop 2.5.1 + HBase 0.98.6.1 + Hive 0.13.11+zookeeper 3.4.6+jdk 1.6+mySql 5.6.12

Hadoop 0.2 + Hive 0.10.0

最后：参考CDH5.8.x的个组件版本组合：

Apache Zookeeper 3.4.5 + Apache Hadoop 2.6.0 + Apache HBase 1.2.0 + Apache Hive 1.1.0 + Apache Spark 1.6 + Apache Pig 0.12.0 + Apache Flume 1.6.0 + Apache Kafka 0.9.0 + Apache Sqoop 1.4.6/1.99.5
[+ Apache Avro 1.7.6 + Apache Crunch 0.11.0 + Apache DataFu 1.1.0 + HUE 3.10.0 + Apache Impala 2.6.0 + Kite SDK 1.0.0 + Apache Parquet 1.5 + Apache Mahout 0.9.0 + Apache Oozie 4.1.0 + Cloudera Search 1.0.0 + Apache Sentry 1.5.1]
from 这里

相关问题推荐

【大数据基础】impala需要hive环境吗 Impala 2021-01-28 20:59

回答 4

需要
【大数据基础】Impala环境如何搭建 Impala 2021-01-08 20:20

回答 6

已采纳

以常用的编程语言php为例：window系统推荐：phpStudy v8.0 （针对Windows系统，免费）针对Windows系统，一键安装，可以自行选择软件版本，你可在本地或者服务器端搭建与配置PHP运行环境。主要功能：1. 全新界面，更美观，操作更清晰2. 安装包内置最新版本Apa...
【大数据基础】Impala如何安装 Impala 2020-11-14 10:01

回答 2

一、Impala简介Cloudera Impala对你存储在Apache Hadoop在HDFS，HBase的数据提供直接查询互动的SQL。除了像Hive使用相同的统一存储平台，Impala也使用相同的元数据，SQL语法（Hive SQL），ODBC驱动程序和用户界面（Hue Beeswax）。Impala还提供了一个熟悉的面...
【大数据基础】Impala环境怎么配置 Impala 2020-11-14 10:00

回答 2

catalog节点yum install -y impala-server impala impala-state-store impala-catalogworker 节点yum install -y impala-server impala配置打开短路读取和打开块位置跟踪所谓的短路读取，就是允许impala把一些信息存储在本地磁盘上，可以加快计算的速度。...
【大数据基础】Impala是什么意思 Impala 2020-11-13 18:35

回答 3

Impala是Cloudera公司主导开发的新型查询系统，它提供SQL语义，能查询存储在Hadoop的HDFS和HBase中的PB级大数据。
hadoop集群中每台都必须启动DataNode Hadoop 2021-02-25 19:20

回答 1

/data/hadoop-2.7.0/logsgedit hadoop-neworigin-datanode-s100.log查看clusterID发现datanode和namenode之间的ID不一致进入hdfs-site.xml 配置文件查看：[hdfs-site.xml]dfs.namenode.name.dir/home/neworigin/hadoop/hdfs/namedfs.data......
回答 spark on yarn模式部署，spa Hadoop 2021-02-25 19:18

回答 1

Kafka是一个高吞吐量分布式消息系统。linkedin开源的kafka。 Kafka就跟这个名字一样，设计非常独特。首先，kafka的开发者们认为不需要在内存里缓存什么数据，操作系统的文件缓存已经足够完善和强大，只要你不搞随机写，顺序读写的性能是非常高效的。kafka的数...
java程序怎么向远程的hadoop提交mapre Hadoop 2021-02-02 19:22

回答 3

将 hadoop执行job命令写到shell脚本中。类似 hadoop jar x.jar ×××.MainClassName inputPath outputPath这种命令。hadoop客户机在本地，使用 Process执行shell脚本，java执行本地shell脚本的代码 1234Process process =null;String command1 ...
hadoop集群中每台都必须启动DataNode吗 Hadoop 2021-02-02 19:19

回答 1

1
hadoop集群配置了kerberos后，如何使用 Hadoop 2021-02-02 19:19

回答 1

public static void test1(String user, String keytab, String dir) throws Exception { Configuration conf = new Configuration(); // conf.set(fs.defaultFS, hdfs://hadoop01:8020); c...
【Hadoop基础】openSOC环境具体如何搭建 Hadoop 2021-02-02 19:18

回答 1

Hello, world! ]]>
【大数据基础】hadoop怎么用 Hadoop 2021-01-29 20:45

回答 2

Hadoop是由java语言编写的，在分布式服务器集群上存储海量数据并运行分布式分析应用的开源框架，其核心部件是HDFS与MapReduce。 HDFS是一个分布式文件系统：引入存放文件元数据信息的服务器Namenode和实际存放数据的服务器Datanode，对数据进行分布...
【大数据基础】hadoop的核心组件及作用是什么 Hadoop 2021-01-29 20:44

回答 2

Hadoop的三大核心组件分别是：HDFS（Hadoop Distribute File System）：hadoop的数据存储工具。YARN（Yet Another Resource Negotiator,另一种资源协调者）：Hadoop 的资源管理器。Hadoop MapReduce:分布式计算框架...

没有解决我的问题，去提问

【Impala】【大数据基础】Apache Hadoop环境如何搭配安装Impala?

生产环境下应该如何搭配hadoop生态系统个组件版本

单机伪分布式Hadoop

常用版本搭配

最后：参考CDH5.8.x的个组件版本组合：

相关问题推荐

等你来答

热门问答

相关文章

【Impala】【大数据基础】Apache Hadoop环境如何搭配安装Impala?

生产环境下应该如何搭配hadoop生态系统个组件版本

单机伪分布式Hadoop

常用版本搭配

最后：参考CDH5.8.x的个组件版本组合：

相关问题推荐

等你来答

热门问答

相关文章

采纳回答

编辑标签

举报内容

检举类型

检举原因

检举说明(必填)

打开微信“扫一扫”，打开网页后点击屏幕右上角分享按钮

付费偷看金额在0.1-10元之间