Skip to content

蚂蚁学Python

博学之、审问之、慎思之、明辨之、笃行之

  • 视频课程
  • 关于我

hive

Categories hive

[转]Hive中对group结果分组取limit N值的实现

2023-03-122014-01-14 Leave a comment by crazyant

转载引言: 数据处理中遇到了取全国各个省份的效果数据先排序后limit 100的需求,HIVE自带功能无法实现 … Read more [转]Hive中对group结果分组取limit N值的实现


Categories hive

HIVE的几个使用技巧

2023-03-122013-12-27 Leave a comment by crazyant

1.小表在前,大表在后,如果表很小就用mapjoin 写JOIN的时候,将小表写在JOIN的前面,这样HIVE … Read more HIVE的几个使用技巧


Categories hadoop, hive, linux

shell/hadoop/hive一些有用命令收集

2023-03-122013-09-24 Leave a comment by crazyant

有些命令工作中经常用到,记录在一个文章里用于查阅,本文经常更新。 shell命令 linux统计某个目录下所有 … Read more shell/hadoop/hive一些有用命令收集


Categories hive

Hive开发中使用变量的两种方法

2023-03-122013-09-13 4 Comments by crazyant

在使用hive开发数据分析代码时,经常会遇到需要改变运行参数的情况,比如select语句中对日期字段值的设定, … Read more Hive开发中使用变量的两种方法


Categories hive

hive从查询中获取数据插入到表或动态分区

2023-03-122013-09-06 1 Comment by crazyant

Hive的insert语句能够从查询语句中获取数据,并同时将数据Load到目标表中。现在假定有一个已有数据的表 … Read more hive从查询中获取数据插入到表或动态分区


Categories hive, mysql

Hive元数据存于mysql中文乱码解决

2023-03-122013-09-04 6 Comments by crazyant

最近在搭一套Hive测试环境,使用mysql存储hive的元数据,然而当执行一个带有中文注释的建表文件时,出现 … Read more Hive元数据存于mysql中文乱码解决


Post navigation
Newer posts
← Previous 1 2

文章分类

  • C++ (8)
  • chatgpt (3)
  • django (16)
  • docker (4)
  • fastapi (3)
  • flask (11)
  • hadoop (5)
  • hive (14)
  • java (20)
  • javascript (1)
  • kafka (1)
  • linux (18)
  • mac (4)
  • mysql (26)
  • numpy (2)
  • paddlepaddle (1)
  • pandas (42)
  • php (39)
  • pyecharts (1)
  • pyqt (6)
  • python (34)
  • python环境 (30)
  • python趣味小程序 (3)
  • redis (4)
  • sklearn (1)
  • spark (6)
  • tensorflow (3)
  • zookeeper (1)
  • 产品想法 (1)
  • 办公自动化 (10)
  • 大数据 (1)
  • 大模型 (3)
  • 推荐系统 (7)
  • 数据科学 (1)
  • 数据结构与算法 (1)
  • 机器学习 (4)
  • 爬虫 (24)
  • 电商 (2)
  • 程序人生 (26)
  • 程序员自媒体 (12)
  • 腾讯课堂 (1)
  • 自动化测试 (1)
  • 读书心得 (8)
  • 软件工具 (9)
  • 量化投资 (6)
© 2025 蚂蚁学Python • Theme Xena