博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Hive基本操作与应用
阅读量:5154 次
发布时间:2019-06-13

本文共 718 字,大约阅读时间需要 2 分钟。

通过hadoop上的hive完成WordCount

启动hadoop

ssh localhostcd /usr/local/hadoop./sbin/start-dfs.shcd /usr/local/hive/libservice mysql startstart-all.sh

 

Hdfs上创建文件夹

hdfs dfs -mkdir test1hdfs dfs -ls /user/hadoop

 

上传文件至hdfs

hdfs dfs -put ./try.txt test1hdfs dfs -ls /user/hadoop/test1

 

启动Hive

hive

 

创建原始文档表

create table docs(line string)

 

导入文件内容到表docs并查看

1
2
load data inpath
'/user/hadoop/tese1/try.txt'
overwrite
into
table docs
select
*
from
docs

  

用HQL进行词频统计,结果放在表word_count里

1
create table word_count
as
select
word,count(1)
as
count
from
(
select
explode(split(line,
" "
))
as
word
from
docs) word
group
by
word order
by
word;

  

查看统计结果

show tables;select * from word_count;

 

转载于:https://www.cnblogs.com/zd983886992/p/9047925.html

你可能感兴趣的文章
HTTP和WebSocket协议(二)
查看>>
项目练习(二)—微博数据结构化
查看>>
Jquery插件的编写和使用
查看>>
跨域请求
查看>>
灌水导论——灌水法初步
查看>>
Vim 使用教程(搬运)
查看>>
常问面试题
查看>>
《构建之法》课程总结及建议
查看>>
echarts使用
查看>>
SQL2005触发器和存储过程
查看>>
poj 2186 Popular Cows 有向图强连通分量 tarjan
查看>>
hdu 2545 并查集
查看>>
[BZOJ4568][SCOI2016]幸运数字(倍增LCA,点分治+线性基)
查看>>
尤金·卡巴斯基:卡巴斯基实验室调查内网遭黑客攻击事件
查看>>
android之Handler Runnable实现倒计时
查看>>
putty修改编码
查看>>
安全版字符串操作函数
查看>>
数据库msqlserver的几种类型及解决MSSQLServer服务启动不了的问题
查看>>
CSS轮廓 边距 填充 分组和嵌套
查看>>
JAVA多线程--线程阻塞与唤醒
查看>>