大数据概论】大数据是什么?学完大数据可以做什么?

2020-07-07 15:08发布

1条回答
小猴哥哥
2楼 · 2020-07-07 19:13

大数据(big data),IT行业术语,是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

大数据能从事的岗位有很多,一下为大家介绍几种:

1. 数据分析师。

数据分析师 是数据师的一种,指的是不同行业中,专门从事行业数据搜集、整理、分析,并依据数据做出行业研究、评估和预测的专业人员。在工作中通过运用工具,提取、分析、呈现数据,实现数据的商业意义。

作为一名数据分析师、至少需要熟练SPSS、STATISTIC、Eviews、SAS等数据分析软件中的一门,至少能用Acess等进行数据库开发,至少掌握一门数学软件如matalab、mathmatics进行新模型的构建,至少掌握一门编程语言。总之,一个优秀的数据分析师,应该业务、管理、分析、工具、设计都不落下。

2. 数据架构师。

数据架构师是负责平台的整体数据架构设计,完成从业务模型到数据模型的设计工作 ,根据业务功能、业务模型,进行数据库建模设计,完成各种面向业务目标的数据分析模型的定义和应用开发,平台数据提取、数据挖掘及数据分析。

从事数据架构师这个职位,需要具备较强的业务理解和业务抽象能力,具备大容量事物及交易类互联网平台的数据库模型设计能力,对调度系统,元数据系统有非常深刻的认识和理解,熟悉常用的分析、统计、建模方法,熟悉数据仓库相关技术,如 ETL、报表开发,熟悉Hadoop,Hive等系统并有过实战经验。

3. 数据挖掘工程师。

一般是指从大量的数据中通过算法搜索隐藏于其中知识的工程技术专业人员。这些知识可用使企业决策智能化,自动化,从而使企业提高工作效率,减少错误决策的可能性,以在激烈的竞争中处于不败之地。

成为数据挖据工程师需要具备深厚的统计学、数学、数据挖掘理论基础和相关项目经验,熟悉R、SAS、SPSS等统计分析软件之一,参与过完整的数据采集.整理.分析和建模工作。.具有海量数据下机器学习和算法实施相关经验,熟悉hadoop,hive,map-reduce等。

4. 数据算法工程师。

在企业中负责大数据产品数据挖掘算法与模型部分的设计,将业务场景与模型算法进行融合等;深入研究数据挖掘模型,参与数据挖掘模型的构建、维护、部署和评估,支持产品研发团队模型算法构建,整合等;制定数据建模、数据处理和数据安全等架构规范并落地实施。

需要具备的知识有:扎实的数据挖掘基础知识,精通机器学习、数学统计常用算法;熟悉大数据生态,掌握常见分布式计算框架和技术原理,如Hadoop、MapReduce、Yarn、Storm、Spark等;熟悉Linux操作系统和Shell编程,至少熟悉Scala/Java/Python/C++/R等语言中的一种编程;熟悉大规模并行计算的基本原理并具有实现并行计算算法的基本能力。

5. 数据产品经理。

数据平台建设及维护,客户端数据的分析,进行数据统计协助,数据化运营整理、提炼已有的数据报告,发现数据变化,进行深度专题分析,形成结论,撰写报告;负责公司数据产品的设计及开发实施,并保证业务目标的实现;进行数据产品开发。


相关问题推荐

  • 回答 6

    大数据开发:1、负责公司大数据产品/项目的后台研发;2、负责技术预研,产品设计以及文档编写等工作;3、参与大数据的数据治理和数据处理相关java开发工作;4、参与海量数据处理,业务数据体系的设计、数据统计、分析及数据建模大数据开发要处理大规模的数据...

  • 回答 1

    修改log4j.properties文件中的:# Define the root logger to the system property plsql.root.logger.log4j.rootLogger=./sql.log# Logging Threshold to INFO for queryserver. root logger still at WARN for sqlline cl...

  • 回答 1

    如果没找到解决方法,最好的方法就是重装

  • 回答 1

    杀毒软件关了

  • 回答 2

    1、上传jar包到/opt/software/解压到/opt/module 改名为phoenix2、 复制server和client这俩个包拷贝到各个节点的hbase/lib在phoenix目录下3、向每个节点发送server jar4、向每个节点发送client jar5、在root权限下给/etc/profile 下添加如下内容6、启动Zookee...

  • 回答 1

    安装和配置Phoenix把下载好的安装包放入software目录下解压Phoenix到opt目录下[root@hadoop100 software]# tar -zxvf apache-phoenix-4.14.0-cdh5.14.2-bin.tar.gz -C /opt进入Phoenix的bin目录下把phoenix-4.14.0-cdh5.14.2-server.jar包复制到hbase目...

  • 回答 7

    phoenix是构建的Hbase之上的,使用标准的SQL操作Hbase,可以做联机事务处理,拥有低延迟的特性。phoenix会把SQL编译成一系列的Hbase的scan操作,然后把scan结果生成标准的JDBC结果集,其底层由于使用了Hbase的API,协处理器,过滤器,处理千万级行的数据也只...

  • 回答 3

    ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。...

  • 回答 2

    想考计算机相关证书或者想学技术的同学可以抓紧时间啦!双11更多优惠活动详情咨询18597153017(微信同号)

  • 回答 2

    一、Selector(选择器)Selector概述Selector(选择器)可以工作在复制或多路复用(路由) 模式下 。复制模式Selector复制模式-属性说明selector.type replicating 类型名称,默认是 replicatingselector.optional – 标志通道为可选Selector复制模式-案例 #命...

  • 回答 2

    (1)电子商务网站比如我们在做一个电子商务网站,然后我们想从消费用户中访问点特定的节点区域来分析消费者的行为或者购买意图. 这样我们就可以更加快速的将他想要的推送到界面上,实现这一点,我们需要将获取到的她访问的页面以及点击的产品数据等日志数据信...

  • 回答 4

    HBase是一个构建在HDFS之上的、分布式的、支持多版本的NoSQL数据库,它的出现补齐了大数据场景下快速查询数据能力的短板。它非常适用于对平台中的热数据进行存储并提供查询功能。...

  • 回答 4

    HBase数据结构运行原理

  • 回答 6

    传统数据库存储B树 B+树 B-树传统关系型数据普通索引就是采用B+树的方式B+树最大的性能问题是会产生大量的随机IO,随着新数据的插入,叶子节点会慢慢分裂,逻辑上连续的叶子节点在物理上往往不连续,甚至分离的很远,但做范围查询时,会产生大量读随机IO;Hba...

  • 回答 7

    对象存储:我们知道不少的头条类、新闻类的的新闻、网页、图片存储在HBase之中,一些病毒公司的病毒库也是存储在HBase之中时序数据:HBase之上有OpenTSDB模块,可以满足时序类场景的需求推荐画像:特别是用户的画像,是一个比较大的稀疏矩阵,蚂蚁的风控就是...

  • 回答 4

    Flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。Flume可以采集文件、socket数据包等各种形式源数据,又可以将采集到的数据输出到HDFS、hbase、hive、kafka等众多外部存储系统中。一般的采集需求,通过对flume的简单配置即可实现。Flume...

没有解决我的问题,去提问