Hive内置函数】如何自定义hive的udaf函数,能举例说明吗?

2020-07-20 09:00发布

1条回答
wjmmjr
2楼 · 2020-07-21 20:09

写一个程序,程序中创建一个类,类需要继承UDAF类,计算类Evaluator实现UDAFEvaluator接口。

Evaluator需要实现UDAFEvaluator的init、iterate、terminatePartial、merge、terminate这几个函数。

将程序编译成udaf_test.jar

进入hive客户端添加jar包:hive>add jar /home/hadoop/udaf_avg.jar

创建临时函数:hive>create temporary function udaf_avg 'hive.udaf.Avg'




相关问题推荐

  • 回答 2

    hive支持的存储格式:  hive支持的存储格式包括TextFile、SequenceFile、RCFile、Avro Files、ORC Files、Parquet。TextFile:  Hive默认格式,数据不做压缩,磁盘开销大,数据解析开销大。  可结合Gzip、Bzip2、Snappy等使用(系统自动检查,执行查询...

  • 回答 2

    MapReduce: 是一种离线计算框架,将一个算法抽象成Map和Reduce两个阶段进行处理,每个阶段都是用键值对(key/value)作为输入和输出,非常适合数据密集型计算。Map/Reduce通过把对数据集的大规模操作分发给网络上的每个节点实现可靠性;每个节点会周期性地返...

  • 回答 1

    结合实际的需求来选择存储格式1-TEXTFILE文本格式,Hive的默认格式,数据不压缩,磁盘开销大、数据解析开销大。对应的hive API为:org.apache.hadoop.mapred.TextInputFormat和org.apache.hive.ql.io.HiveIgnoreKeyTextOutputFormat;可结合Gzip、Bzip2使用(...

没有解决我的问题,去提问