shell/hadoop/hive一些有用命令收集
有些命令工作中经常用到,记录在一个文章里用于查阅,本文经常更新。 shell命令 linux统计某个目录下所有 … Read more shell/hadoop/hive一些有用命令收集
博学之、审问之、慎思之、明辨之、笃行之
有些命令工作中经常用到,记录在一个文章里用于查阅,本文经常更新。 shell命令 linux统计某个目录下所有 … Read more shell/hadoop/hive一些有用命令收集
在使用hive开发数据分析代码时,经常会遇到需要改变运行参数的情况,比如select语句中对日期字段值的设定, … Read more Hive开发中使用变量的两种方法
Hive的insert语句能够从查询语句中获取数据,并同时将数据Load到目标表中。现在假定有一个已有数据的表 … Read more hive从查询中获取数据插入到表或动态分区
最近在搭一套Hive测试环境,使用mysql存储hive的元数据,然而当执行一个带有中文注释的建表文件时,出现 … Read more Hive元数据存于mysql中文乱码解决
java是hadoop开发的标准官方语言,本文下载了官方的WordCount.java并对其进行了编译和打包, … Read more hadoop第一个程序WordCount.java的编译运行过程
数据表设计过程中很多时候会设定字段的默认值,那么向该表插入数据时会出现以下情况: 情况1:如果该字段为NULL … Read more MYSQL向数据表插入默认字段值的方法
目录 1. Join操作分清join的类型很重要… 2. 启动程序中key字段和partition字 … Read more Hadoop-Streaming实战经验及问题解决方法总结
文章分析了hadoop借助streaming功能借助python完成map reduce的功能,并对集合间join操作的需求进行阐述,然后进行了具体实例代码的编写,同时对join操作进行了归类和易采坑的总结。