BigData
hive基础 hive基础
数据类型转换强转cast(‘4’ as INT) 如果强制类型转换失败,如执行CAST(‘X’ AS INT),表达式返回空值 NULL. DDL之后在复习,先过 DML之后在复习,先过 DSLEDIT: sql里的基本语法就不再做赘述了
2021-11-19
awk函数辨析 awk函数辨析
awk命名基础解析前言awk会将传递过来的数据按照一个整体处理的 awk主要有三模块组成:(可以按照junit测试来理解.) BEGIN{}:开始执行前的准备阶段,可以理解为初始化 PATTERN{}
2021-11-18
ctrl+c,ctrl+z等指令解析 ctrl+c,ctrl+z等指令解析
命令解析ctrl+z 英文名: suspend foreground process 详解: 发送SIGSTOP型号给前台进程组中的所有进程. 由名字可知,他是用于挂起前台进程的命令.那么就可以使用fg命令回复. 实用案例: 在使用vi
2021-11-18
适用所有情况的VM扩容(在做数仓时遇到的问题) 适用所有情况的VM扩容(在做数仓时遇到的问题)
edti: 起因: 在做数仓项目的时候,由于数据过多,划分的磁盘不够用了,需要在根目录下扩容. 但是: 由于当初下载的是最小版centos,导致根本没有分组卷等等一些情况.网上的扩容方法并不适用于我. 解决思路: 于是乎
2021-11-17
hive常用函数 hive常用函数
判空nvlselect nvl(salary,0) from emp; coalescecoalesce(a,b,c,’ddd’)解析: // scala if(a != null){ a }else if(b !=
2021-11-17
DQL-排序 DQL-排序
order by全排序 reduce数只有一,不管设置没设置。 select d.name,e.name from dept d left join emp e on d.id = e.deptId order by d.id;
2021-11-17
开天窗与否的区别 开天窗与否的区别
关于开天窗与不开天窗的区别使用 over()是对最终结果集进行开天窗。 如果不使用,即不开天窗。受到group by等函数影响。 example:select name,count(1) from business where subs
2021-11-17
shell指令(电商数仓项目) shell指令(电商数仓项目)
集群分发脚本#!/bin/bash #使用方法: #第一个参数输入文件路径 #如果只同步到一个服务器上就只要在第二个参数上填写服务器编号就行 #如果是要同步一个范围的服务器,那么写上开始节点和结束节点就行 num=$# if [ $
hadoop端口使用情况汇总(记) hadoop端口使用情况汇总(记)
汇总表 端口名称 hadoop2.x hadoop3.x NameNode内部通信端口 8082/9000 8082/9000/9820 NameNode Web端口 50070 9870 MapReduce查看执行任务端
2021-11-17
数仓分成 数仓分成
数据库分层图 数据库各层的功能解析 ODS:元数据层,对于原始数据的一个备份 DWD:数据明细层,对数据的一个清洗(判空过滤,去除脏数据),保存业务事实明细,一行数据代表用户的一次业务行为。如:一次下单。 ADS:数据应用层,为各种报表
2021-11-17
git常规指令 git常规指令
一些常用指令汇总首先建立本地仓库,初始化git init remote 一下远程仓库git remote add origin https://gitee.com/xxxx pull一下我的分支(学号)git
2021-11-17
UDTF原理 UDTF原理
原理解释Hive 的每一个sql会被解释成一个个的operator组成operators,数据放在java中的object中,数据类型放在object inspector中在oprator之间传递. edit:(object inspec
2021-11-16
4 / 5