大数据概论】文科生想转行大数据,需要学什么基础?

2020-04-07 11:45发布

汉语言专业,毕业一年,想转行大数据,需要有什么基础?

汉语言专业,毕业一年,想转行大数据,需要有什么基础?

2条回答

不是说需要一个啥基础 个人感觉这个跟文理科关系不算大  只要自己想去学习  找一个好的机构  踏踏实实的学习就完事了 剩下的都不是问题

zgtl_20
3楼 · 2021-12-29 11:33

相对于研发级岗位来说,应用级岗位的学习难度要相对低很多,即使没有计算机知识基础,经过一个系统的学习过程,往往也能够从事一些大数据领域的岗位,比如数据采集、数据清洗、数据分析等岗位都比较适合女生来从事。所以,在选择学习大数据知识的时候,应该根据自身的知识基础和能力特点来选择学习路线。

当前学习大数据知识,不论从事哪个具体的岗位,通常都需要学习三方面知识,其一是编程语言知识;其二是大数据平台知识;其三是行业知识。编程语言可以重点考虑一下Java、Python和R这三门语言,其中Python语言目前的上升趋势比较明显。大数据平台可以重点关注一下开源平台,比如Hadoop、Spark。关于行业知识,可以与自身的岗位相结合,也可以选择一个自己感兴趣的领域,比如金融、教育、医疗等领域都是不错的选择。


相关问题推荐

  • 回答 6

    大数据开发:1、负责公司大数据产品/项目的后台研发;2、负责技术预研,产品设计以及文档编写等工作;3、参与大数据的数据治理和数据处理相关java开发工作;4、参与海量数据处理,业务数据体系的设计、数据统计、分析及数据建模大数据开发要处理大规模的数据...

  • 回答 1

    修改log4j.properties文件中的:# Define the root logger to the system property plsql.root.logger.log4j.rootLogger=./sql.log# Logging Threshold to INFO for queryserver. root logger still at WARN for sqlline cl...

  • 回答 1

    如果没找到解决方法,最好的方法就是重装

  • 回答 1

    杀毒软件关了

  • 回答 2

    1、上传jar包到/opt/software/解压到/opt/module 改名为phoenix2、 复制server和client这俩个包拷贝到各个节点的hbase/lib在phoenix目录下3、向每个节点发送server jar4、向每个节点发送client jar5、在root权限下给/etc/profile 下添加如下内容6、启动Zookee...

  • 回答 1

    安装和配置Phoenix把下载好的安装包放入software目录下解压Phoenix到opt目录下[root@hadoop100 software]# tar -zxvf apache-phoenix-4.14.0-cdh5.14.2-bin.tar.gz -C /opt进入Phoenix的bin目录下把phoenix-4.14.0-cdh5.14.2-server.jar包复制到hbase目...

  • 回答 7

    phoenix是构建的Hbase之上的,使用标准的SQL操作Hbase,可以做联机事务处理,拥有低延迟的特性。phoenix会把SQL编译成一系列的Hbase的scan操作,然后把scan结果生成标准的JDBC结果集,其底层由于使用了Hbase的API,协处理器,过滤器,处理千万级行的数据也只...

  • 回答 3

    ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。...

  • 回答 3

    Flume简介    Flume 是Cloudera(就是CDH的那个公司) 开发的实时日志收集系统,它是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。    Flume可以根据需求接收不同的数据类型,同时将接收的数据发送到其他的具有接收能力或者处理能力的地...

  • 回答 2

    对于相对简单的环境,按照通用的元数据管理标准建立一个集中式的元数据知识库。 对于比较复杂的环境,分别建立各部分的元数据管理系统,形成分布式元数据知识库,然后,通过建立标准的元数据交换格式,实现元数据的集成管理。...

  • 回答 5

    离线是将一定时间内的数据统一处理后加入到数据仓库中,实时是每来一条数据处理一条并加入到数据仓库中,数据的时效性较高

  • 回答 1

    分层是数据仓库解决方案中,数据架构设计的一种数据逻辑结构 ,通过分层理念建立的数据仓库,它的可扩展性非常好,这样设计出来的模型架构,可以任意地增减、替换数据仓库中的各个组成部分。数据仓库分层的原因1、用空间换时间,通过数据预处理提高效率,通过...

  • 回答 1

    兰州是二线城市,大数据发展不如一线城市,但是发展还是不错的,尤其兰州新区最近几年发展势头很高,所以说找工作以及未来的发展还是很不错的。现在大数据正式火爆的时候,所以现在学习还来的及,未来三到五年是大数据发展最为快速的时期。...

  • 回答 5

    首先,从架构上,实时数仓与离线数仓有比较明显的区别,实时数仓以Kappa架构为主,而离线数仓以传统大数据架构为主。Lambda架构可以认为是两者的中间态。其次,从建设方法上,实时数仓和离线数仓基本还是沿用传统的数仓主题建模理论,产出事实宽表。另外实时...

  • 回答 1

    Jdk的安装及配置Mysql5.5安装安装maven :本人使用的是idea自带的maven工具。

  • 回答 2

    你的意思是采用java语言编写的那些大数据工具吧,比如hadoop、flume、zookeeper,这些的话,每个人对难易的感受是不一样的,个人感觉不是学起来不是太难,但是要把握学习的深度,不要死抠底层,问题就不是很大...

没有解决我的问题,去提问