最新发布
今日更新0 文章总数2869

hive 怎么解决数据倾斜?

hive 怎么解决数据倾斜?

hive 怎么解决数据倾斜? (1)group by 注:group by 优于 distinct group…

Hive 的 join 有几种方式,怎么实现 join 的

Hive 的 join 有几种方式,怎么实现 join 的

Hive 的 join 有几种方式,怎么实现 join 的 (1)Hive 中常见的 join 方式 Hive…

hive over gc limit、java.lang.OutMemoryError:Java heap space

hive  over gc limit、java.lang.OutMemoryError:Java heap space

Hive 在 select 查询数据后,执行 insert 操作插入 ORC 表和 parquet 表操作的过…

Hive 中,collect_list()、collect_set()两个函数的区别是什么?参数类型有什么限制

Hive 中,collect_list()、collect_set()两个函数的区别是什么?参数类型有什么限制

Hive 中,collect_list()、collect_set()两个函数的区别是什么?参数类型有什么限制…

Hive 中创建表有哪几种方式,其区别是什么?

Hive 中创建表有哪几种方式,其区别是什么?

Hive 中创建表有哪几种方式,其区别是什么? 1.hive 创建表有以下几种方式 1)create tabl…

Hive 中的 UDF 函数有哪几种?你写过哪些

Hive 中的 UDF 函数有哪几种?你写过哪些

(1)Hive 中有三种 UDF:(普通)UDF、用户定义聚集函数(user-defined aggregat…

怎样对大数据集群进行有效监控?如何实现预警、报警?

怎样对大数据集群进行有效监控?如何实现预警、报警?

怎样对大数据集群进行有效监控?如何实现预警、报警? 1. 可以有很多方式对大数据集群进行监控 1) 可以使用 …

什么是 Hadoop 分布式缓存

什么是 Hadoop 分布式缓存

什么是 Hadoop 分布式缓存 1)Hadoop 分布式缓存是 Map-Reduce 框架提供的用于缓存应用…

怎么解决 MapReduce 的数据倾斜?

怎么解决 MapReduce 的数据倾斜?

怎么解决 MapReduce 的数据倾斜? 现象:Mapreduce 程序在运行的时候,运行了大部分,但是还有…

MapReduce 数据处理及 shuffle 的流程,以及各个阶段的先后顺序

MapReduce 数据处理及 shuffle 的流程,以及各个阶段的先后顺序 1、Map阶段 1)读取hdf…