怎么实现kudu表数据的导入导出

2020-09-21 17:02发布生成海报

站内文章 / Hadoop

2702 0

一、kudu数据导出到文件

例：

impala-shell -l -u xuyi --auth_creds_ok_in_clear -q "select sms_content from warehouse.restart where eventId='filtrate_inbox_sms_delete_sms' " -B --output_delimiter=“,” --print_header -o /home/xuyi/sms.xls

-q:从命令行中传递一个查询或其他 shell 命令

-B:从命令行中传递一个查询或其他 shell 命令

--output_delimiter 选项指定分隔符

-o 保存所有查询结果到指定的文件

二、文件数据导入到kudu

1、put数据到hadoop文件系统

2、创建impala表

create table impala_table(

aid string,

ts timestamp,

count bigint

)

row format delimited fields terminated by ',';

3、hdfs下的数据文件导入impala表中

load data inpath '/tem/my_data.csv' into table impala_table;

4、创建kudu表

create table kudu_table(

aid string not null,

ts timestamp,

count bigint

primary key(aid)

)

partition by hash(aid) partition 3

stored as kudu;

5、把impala 表数据导入到kudu表中

insert into kudu_table select * from impala_table;

Ta的文章更多 >>

怎么实现kudu表数据的导入导出
0 个评论