大数据的核心是什么?是不是要很深厚的JAVA功底才行?

2020-12-31 13:44发布

大数据的核心是什么?是不是要很深厚的JAVA功底才行?

大数据的核心是什么?是不是要很深厚的JAVA功底才行?

7条回答
请叫我雷锋叔叔啊
2楼 · 2021-01-04 14:46

世界编程语言有很多种,但在网络编程中应用比较广泛又适合大数据开发的java是比较合适的,因为java具有简单性、面向对象、分布式、健壮性、安全性、平台独立与可移植性、多线程、动态性等特点。 如果你对java有一定的了解,就更应该清楚java是一个强类型编程语言,拥有极高的跨平台能力,还有就是java的异常处理能够保证系统的稳定性。

目前,java语言的应用是最广泛的,在全世界排名第一,对于要学习大数据的学生而言是最佳选择,hadoop及其他大数据处理技术都用到了java,像Apache的基于Java的HBase和Accumulo以及 ElasticSearchas等等。

studentaaa
3楼 · 2021-01-04 17:11

大数据的核心是存储、管理、分析与挖掘大数据存储和管理:将收集到的数据存储在内存中,建立相应的数据库,并进行管理和调用大数据挖掘:从大量、不完整、有噪声、模糊和随机的实际应用数据中提取隐藏信息和知识的过程,人们事先不知道,但也有可能有用的信息和知识。大数据分析:收集、存储、管理和分析大规模数据,重点是分析如何计算需要计算的数据(HDFS、S3、Hbase、Cassandra)以及如何计算(Hadoop、Spark)。本部分包含更多信息,其中的一些重点是:Hadoop:是一个具有多个组件的通用分布式系统基础结构;Hadoop生态系统主要由核心组件(如HDFS、MapReduce、Hbase、Zookeeper、Ozie、PIG、Hive)组成;Spark:重点关注集群中并行的处理数据,并使用RDD(灵活的分布式数据集)来处理RAM中的数据。风暴:连续处理从源源导入的数据流,并在任何时候获得增量结果。Hbase是一种分布式、面向列的开源数据库,可以被认为是HDFS的封装,它的本质是数据存储和NOSQL数据库。

不想说话-
4楼 · 2021-01-06 09:12

大数据的核心语言其实就是要掌握一门编程语言,java的话是应用的比较广,hadoop就是用java语言开发的,所以说想做这个的话是要有非常强的java功底的,但是python其实也是可以的,python主要是做数据分析。

Cici
5楼 · 2021-01-07 10:15

大数据的核心是存储、管理、分析与挖掘大数据存储和管理:将收集到的数据存储在内存中,建立相应的数据库,并进行管理和调用大数据挖掘:从大量、不完整、有噪声、模糊和随机的实际应用数据中提取隐藏信息和知识的过程,人们事先不知道,但也有可能有用的信息和知识。大数据分析:收集、存储、管理和分析大规模数据,重点是分析如何计算需要计算的数据(HDFS、S3、Hbase、Cassandra)以及如何计算(Hadoop、Spark)。本部分包含更多信息,其中的一些重点是:Hadoop:是一个具有多个组件的通用分布式系统基础结构;Hadoop生态系统主要由核心组件(如HDFS、MapReduce、Hbase、Zookeeper、Ozie、PIG、Hive)组成;Spark:重点关注集群中并行的处理数据,并使用RDD(灵活的分布式数据集)来处理RAM中的数据。风暴:连续处理从源源导入的数据流,并在任何时候获得增量结果。Hbase是一种分布式、面向列的开源数据库,可以被认为是HDFS的封装,它的本质是数据存储和NOSQL数据库。

大数据(Big Data)是指“无法用现有的软件工具提取、存储、搜索、共享、分析和处理的海量的、复杂的数据集合。”业界通常用4个V(即Volume、Variety、Value、Velocity)来概括大数据的特征。



数据体量巨大(Volume)。截至目前,人类生产的所有印刷材料的数据量是200PB,而历史上全人类说过的所有的话的数据量大约是5EB(1EB=210PB)。



数据类型繁多(Variety)。相对于以往便于存储的以文本为主的结构化数据,非结构化数据越来越多,包括网络日志、音频、视频、图片、地理位置信息等,这些多类型的数据对数据的处理能力提出了更高要求。



价值密度低(Value)。价值密度的高低与数据总量的大小成反比。如何通过强大的机器算法更迅速地完成数据的价值“提纯”成为目前大数据背景下亟待解决的难题。



处理速度快(Velocity)。大数据区分于传统数据挖掘的最显著特征。根据IDC的“数字宇宙”的报告,预计到2020年,全球数据使用量将达到35.2ZB。


  -------------------------------------------


  社交网络,让我们越来越多地从数据中观察到人类社会的复杂行为模式。社交网络,为大数据提供了信息汇集、分析的第一手资料。从庞杂的数据背后挖掘、分析用户的行为习惯和喜好,找出更符合用户“口味”的产品和服务,并结合用户需求有针对性地调整和优化自身,就是大数据的价值。



  所以,建立在上述的概念上我们可以看到大数据的产业变化:



  1 大数据飞轮效应所带来的产业融合和新产业驱动


  2 信息获取方式的完全变化带来的新式信息聚合


  3 信息推送方式的完全变化带来的新式信息推广


  4 精准营销


  5 第三方支付 —— 小微信贷,线上众筹为代表的互联网金融带来的全面互联网金融改革


  6 产业垂直整合趋势以及随之带来的产业生态重构


  7 企业改革以及企业内部价值链重塑,扩大的产业外部边界


  8 政府及各级机构开放,透明化,以及随之带来的集中管控和内部机制调整


  9 数据创新带来的新服务


张成秀 - 快乐开心每一天
7楼 · 2021-01-15 14:40

hadoop,学习大数据是要学习JAVA的,最好的精通的话会好一些,应该大数据肯定会应用到这方面的

yyy
8楼 · 2021-01-19 13:40

大数据的核心是存储、管理、分析与挖掘大数据存储和管理 需要很牛逼的java 基础才行呢

相关问题推荐

  • 大数据怎么样?2021-01-13 14:45
    回答 36

    大数据薪资待遇挺可观的

  • 回答 7

    用的挺多的呀,首先以前很多项目都是基于ssm的,所以现在如果不升级的话,就需要维护,然后现在很多项目也不一定非得用比如springboot或者springcloud来处理。

  • 回答 3
    已采纳

    大数据的主要特点有哪些?大数据这个概念自被各界媒体所关注后,便一直站在风口浪尖引人注目。不落后的你想要深入浅出地了解大数据?大圣众包以4V为你详尽讲述大数据的四个特点。大数据主要特点:1.准确(Veracity)这是一个在讨论大数据时时常被忽略的一个属性...

  • 回答 8

    Mybatis和hibernate不同,它不完全是一个ORM框架,因为MyBatis需要程序员自己编写Sql语句,不过mybatis可以通过XML或注解方式灵活配置要运行的sql语句

  • 回答 9

    redis没有直接使用C语言传统的字符串表示(以空字符结尾的字符串数组,以下简称C字符串)。C字符串并不能满足redis对字符串安全性、效率以及功能的要求,所以Ridis自定义SDS抽象类型。       Redis中,C字符串只会作为字符串字面量(string literal)用...

  • 大数据框架有哪些?2020-05-07 20:16
    回答 6

    Impala:hadoop的sql平台、支持hbase/hdfs、支持超大数据、支持多并发、sql支持好、对内存依赖比较严重。需要自己优化,并且有的语句超过内存会报错。Spark:各种格式、各种计算(机器学习、图形计算)、可sql、可代码处理、支持scala/java/python语言开发。...

  • 回答 5

    1、模板热部署        在SpringBoot中,模板引擎的页面默认是开启缓存的,如果修改了页面的内容,则刷新页面是得不到修改后的页面的,因此我们可以在application.properties中关闭模版引擎的缓存,如下:        Thymeleaf的配置:spring.thymeleaf...

  • 回答 2

    mysql默认用户名是 root ,默认没有密码

  • 回答 2

    一.成员变量和局部变量1.程序例子:public class HelloThreadTest{public static void main(String[] args){HelloThread r = new HelloThread();Thread t1 = new Thread(r);Thread t2 = new Thread(r);t1.start();t2.start();}}clas......

  • 回答 2

        方法一:使用ThreadLocal,ThreadLocal会为每一个线程提供一个独立的变量副本,这样在多线程对数据访问就不会出现冲突。因为每一个线程都拥有自己的变量副本,因此也就不需要同步该变量。ThreadLocal提供了线程安全的共享对象,在编写多线程代码时,可...

  • 回答 4

    我们知道Spring相对于之前框架的明显一点区别就是Spring容器生成的Bean都是默认单例的,初读到这里的时候我也是有点疑惑,所以写这篇文章来谈谈线程安全和单例多例的问题。在讲单例和线程安全之前首先我们要明白一点,那就是在单例模式下多线程也可以同时访问...

  • 回答 2

    一、在 SQL 映射文件的 select 标签中添加 useGeneratedKeys=true 属性与 keyProperty=  属性,keyProperty 的值表示的是将获取到的自增主键值赋给 JavaBean 中的某个字段。                  insert into t_employee(username, ge...

没有解决我的问题,去提问