如何自定义hive的udaf函数，能举例说明吗？_大数据

【Hive内置函数】如何自定义hive的udaf函数，能举例说明吗？

2020-07-20 09:00发布

1条回答

2楼 · 2020-07-21 20:09

写一个程序，程序中创建一个类，类需要继承UDAF类，计算类Evaluator实现UDAFEvaluator接口。

Evaluator需要实现UDAFEvaluator的init、iterate、terminatePartial、merge、terminate这几个函数。

将程序编译成udaf_test.jar

进入hive客户端添加jar包:hive>add jar /home/hadoop/udaf_avg.jar

创建临时函数:hive>create temporary function udaf_avg 'hive.udaf.Avg'

hive支持的存储格式有哪些？Hive内置函数 2020-05-25 08:48

回答 2

hive支持的存储格式：　　hive支持的存储格式包括TextFile、SequenceFile、RCFile、Avro Files、ORC Files、Parquet。TextFile：　　Hive默认格式，数据不做压缩，磁盘开销大，数据解析开销大。　　可结合Gzip、Bzip2、Snappy等使用（系统自动检查，执行查询...
hive和MR的区别 MapReduce Hive内置函数 2020-05-21 08:56

回答 2

MapReduce：是一种离线计算框架，将一个算法抽象成Map和Reduce两个阶段进行处理，每个阶段都是用键值对（key/value）作为输入和输出，非常适合数据密集型计算。Map/Reduce通过把对数据集的大规模操作分发给网络上的每个节点实现可靠性；每个节点会周期性地返...
hive支持的存储格式有哪些，各有啥特点？Hive内置函数 2020-05-20 08:51

回答 1

结合实际的需求来选择存储格式1-TEXTFILE文本格式，Hive的默认格式，数据不压缩，磁盘开销大、数据解析开销大。对应的hive API为：org.apache.hadoop.mapred.TextInputFormat和org.apache.hive.ql.io.HiveIgnoreKeyTextOutputFormat；可结合Gzip、Bzip2使用(...

没有解决我的问题，去提问

【Hive内置函数】如何自定义hive的udaf函数，能举例说明吗？