大数据生态系统】学大数据可以不学java吗

2020-04-08 18:06发布

10条回答
宝藏秦公子
2楼 · 2020-04-08 18:09

学习大数据一定要先学习java,因为大数据的好多软件、工具、环境都是基于java的,比如hadoop、zookeeper、flume,sqoop等。所以有java基础后,再学大数据是个锦上添花的事情,后期再学习大数据会比较轻松一点。

freediandianer
3楼 · 2020-04-08 18:24

大数据肯定是要有语言基础的,而Java是应用最广泛也是大数据中最常用的。为啥不想学Java呢?因为难么?

最美的佐小一
4楼 · 2020-04-08 21:06

不可以,很多大数据框架底层都是通过java语言来实现的,例如 Hadoop,在学习Hadoop的一个前提条件,就是掌握Java语言。学会java语言在一定程度上对学习大数据的起到了助力的作用。而且Java语言是目前最为广泛使用的编程语言,它十分的容易学习而且也很好用。学习java更有利于对代码的理解与运用。

璞璞
5楼 · 2020-04-08 21:09

如果不学习java,从本质上来说也可以学习大数据。也有python+大数据。但是个人觉得大数据很多核心内容是java语言编写的,要想学习的更好,更透彻,还是需要学习java语言。这样的前景和钱景都更好。加油吧,少年!

若梦
6楼 · 2020-04-09 10:49

正常来说 你是需要有一门语言支持的,正在大数据中  hadoop里mapreduces 也是用java写的,然后如果用spark的话那也需要有一门语言scala来支持,如果学会java了学scala很简单的。

苏橙C
7楼 · 2020-04-09 16:23

不可以哦,大数据是需要语言支撑的,

二大爷的三哥
8楼 · 2020-04-09 17:44

Java语言是大数据的基础

被迫营业
9楼 · 2020-04-13 15:34

学大数据还是要学习Java语言的

相关问题推荐

  • 回答 3

    Flume简介    Flume 是Cloudera(就是CDH的那个公司) 开发的实时日志收集系统,它是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。    Flume可以根据需求接收不同的数据类型,同时将接收的数据发送到其他的具有接收能力或者处理能力的地...

  • 回答 2

    对于相对简单的环境,按照通用的元数据管理标准建立一个集中式的元数据知识库。 对于比较复杂的环境,分别建立各部分的元数据管理系统,形成分布式元数据知识库,然后,通过建立标准的元数据交换格式,实现元数据的集成管理。...

  • 回答 5

    离线是将一定时间内的数据统一处理后加入到数据仓库中,实时是每来一条数据处理一条并加入到数据仓库中,数据的时效性较高

  • 回答 1

    分层是数据仓库解决方案中,数据架构设计的一种数据逻辑结构 ,通过分层理念建立的数据仓库,它的可扩展性非常好,这样设计出来的模型架构,可以任意地增减、替换数据仓库中的各个组成部分。数据仓库分层的原因1、用空间换时间,通过数据预处理提高效率,通过...

  • 回答 1

    兰州是二线城市,大数据发展不如一线城市,但是发展还是不错的,尤其兰州新区最近几年发展势头很高,所以说找工作以及未来的发展还是很不错的。现在大数据正式火爆的时候,所以现在学习还来的及,未来三到五年是大数据发展最为快速的时期。...

  • 回答 5

    首先,从架构上,实时数仓与离线数仓有比较明显的区别,实时数仓以Kappa架构为主,而离线数仓以传统大数据架构为主。Lambda架构可以认为是两者的中间态。其次,从建设方法上,实时数仓和离线数仓基本还是沿用传统的数仓主题建模理论,产出事实宽表。另外实时...

  • 回答 1

    Jdk的安装及配置Mysql5.5安装安装maven :本人使用的是idea自带的maven工具。

  • 回答 2

    你的意思是采用java语言编写的那些大数据工具吧,比如hadoop、flume、zookeeper,这些的话,每个人对难易的感受是不一样的,个人感觉不是学起来不是太难,但是要把握学习的深度,不要死抠底层,问题就不是很大...

  • 回答 2

    在互联网逐渐步入大数据时代后,不可避免的为企业及消费者行为带来一系列改变与重塑。其中最大的变化莫过于,消费者的一切行为在企业面前似乎都将是可视化的。随着大数据技术的深入研究与应用,企业的专注点日益聚焦于怎样利用大数据来为精准营销服务,进而深...

  • 回答 1

    这跟年限关系并不代表,主要看技术能力,工作10年技术不行,薪资一样相对较低,毕业一年技术很牛,工资也没有上限,技术可以的话,一线城市薪资能达到5位数

  • 回答 1

    在线上的hadoop集群运维过程中,hadoop 的balance工具通常用于平衡hadoop集群中各datanode中的文件块分布,以避免出现部分datanode磁盘占用率高的问题(这问题也很有可能导致该节点CPU使用率较其他服务器高)。可能的原因:突然磁盘使用率变高而文件块数并没...

  • 回答 1

    其实属于一个领域,先用大数据技术将数据进行采集、存储、计算,然后根据结果利用机器学习搞一些模型、算法进行预测,人工智能建立在这之上

  • 回答 1

      PageRank,即网页排名,又称网页级别、Google左側排名或佩奇排名。        是Google创始人拉里·佩奇和谢尔盖·布林于1997年构建早期的搜索系统原型时提出的链接分析算法,自从Google在商业上获得空前的成功后,该算法也成为其他搜索引擎和学术界十...

  • 回答 1

    是一种空间效率很高的随机数据结构,它利用位数组很简洁地表示一个集合,并能判断一个元素是否属于这个集合

  • 回答 3
    已采纳

    监督学习(supervised learning)从给定的训练数据集中学习出一个函数(模型参数),当新的数据到来时,可以根据这个函数预测结果。监督学习的训练集要求包括输入输出,也可以说是特征和目标。训练集中的目标是由人标注的。监督学习就是最常见的分类(注意和...

  • 回答 1

    分类:是已知类别时,对数据进行按标签进行划分到不同类别中,属于有监督的学习。聚类:是在没有标签的情况下,将相似的数据划分到一个类中,属于无监督的学习。

没有解决我的问题,去提问