【Hadoop】Hadoop是做什么的_Hadoop

8条回答

Sunny

2楼 · 2020-11-05 20:47

开源大数据基础平台

kitidog2016

3楼 · 2020-11-06 09:49

Hadoop是一个由Apache基金会所开发的分布式系统基础架构。

用户可以在不了解分布式底层细节的情况下，开发分布式程序。充分利用集群的威力进行高速运算和存储。

Hadoop实现了一个分布式文件系统(Hadoop Distributed File System)，简称HDFS。HDFS有高容错性的特点，并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据，适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求，可以以流的形式访问(streaming access)文件系统中的数据。

Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储，则MapReduce为海量的数据提供了计算。

魏魏姐

4楼 · 2020-11-06 09:58

Hadoop应用领域还是挺广的，比如：

1、HADOOP应用于数据服务基础平台建设

2、HADOOP用于用户画像

3、HADOOP用于网站点击流日志数据挖掘

水默

5楼 · 2020-11-06 11:31

所谓大数据，对于它的定义，是有典型的4V特征，包括Volume、Variety、Value和Velocity，翻译过来就是数据体量大、数据类型多样、价值密度低、数据产生速度快。而大数据处理，就是要处理这些量大、类型多、密度低、产生速度快的数据。

相比于传统的数据，处理大数据需要的存储量大、计算量也大，除了数字、还有文字、声音、视频、网络日志、视频、图片、地理位置信息等多种数据，处理这样的数据，就需要Hadoop技术来实现。

大数据处理需要解决的关键性问题，包括数据采集与数据管理、分布式存储和并行计算、大数据应用开发、数据分析与挖掘、大数据前端应用、数据服务和展现等，而这些问题在Hadoop框架下，基本都能够有相应的解决方案。

我的网名不再改

6楼 · 2020-11-08 14:18

Hadoop主要是分布式计算和存储的框架，所以Hadoop工作过程主要依赖于HDFS(Hadoop Distributed File System)分布式存储系统和Mapreduce分布式计算框架。分布式存储系统HDFS中工作主要是一个主节点namenode(master)（hadoop1.x只要一个namenode节点，2.x中可以有多个节点）和若干个从节点Datanode(数据节点)相互配合进行工作,HDFS主要是存储Hadoop中的大量的数据，namenode节点主要负责的是：1、接收client用户的操作请求，这种用户主要指的是开发工程师的Java代码或者是命令客户端操作。2、维护文件系统的目录结构，主要就是大量数据的关系以及位置信息等。3、管理文件系统与block的关系，Hadoop中大量的数据为了方便存储和管理主要是以block块（64M）的形式储存。一个文件被分成大量的block块存储之后，block块之间都是有顺序关系的，这个文件与block之间的关系以及block属于哪个datanode都是有namenode来管理。Datanode的主要职责是：1、存储文件。2、将数据分成大量的block块。3、为保证数据的安全，对数据进行备份，一般备份3份。当其中的一份出现问题时，将由其他的备份来对数据进行恢复。MapReduce主要也是一个主节点JOPtracker和testtracker组成，主要是负责hadoop中的数据处理过程中的计算问题。joptracker主要负责接收客户端传来的任务，并且把计算任务交给很多testtracker工作，同时joptracker会不断的监控testtracker的执行情况。testtracker主要是执行joptracker交给它的任务具体计算，例如给求大量数据的最大值，每个testtracker会计算出自己负责的数据中的最大值，然后交给joptracker。Hadoop的主要两个框架组合成了分布式的存储和计算，使得hadoop可以很快的处理大量的数据。

HARPPRTのIT

7楼 · 2020-11-09 09:45

开源大数据基础平台

无奈的飘过

8楼 · 2020-11-16 14:47

Hadoop应用领域还是挺广的，比如：

1、HADOOP应用于数据服务基础平台建设

2、HADOOP用于用户画像

3、HADOOP用于网站点击流日志数据挖掘

【Hadoop】【Hadoop】Hadoop是做什么的

相关问题推荐

等你来答

热门问答

相关文章

【Hadoop】【Hadoop】Hadoop是做什么的

相关问题推荐

等你来答

热门问答

相关文章

采纳回答

编辑标签

举报内容

检举类型

检举原因

检举说明(必填)

打开微信“扫一扫”，打开网页后点击屏幕右上角分享按钮

付费偷看金额在0.1-10元之间