BigData
11
17
17
DQL-排序 DQL-排序
order by全排序 reduce数只有一,不管设置没设置。 select d.name,e.name from dept d left join emp e on d.id = e.deptId order by d.id;
2021-11-17
17
开天窗与否的区别 开天窗与否的区别
关于开天窗与不开天窗的区别使用 over()是对最终结果集进行开天窗。 如果不使用,即不开天窗。受到group by等函数影响。 example:select name,count(1) from business where subs
2021-11-17
17
shell指令(电商数仓项目) shell指令(电商数仓项目)
集群分发脚本#!/bin/bash #使用方法: #第一个参数输入文件路径 #如果只同步到一个服务器上就只要在第二个参数上填写服务器编号就行 #如果是要同步一个范围的服务器,那么写上开始节点和结束节点就行 num=$# if [ $
17
17
数仓分成 数仓分成
数据库分层图 数据库各层的功能解析 ODS:元数据层,对于原始数据的一个备份 DWD:数据明细层,对数据的一个清洗(判空过滤,去除脏数据),保存业务事实明细,一行数据代表用户的一次业务行为。如:一次下单。 ADS:数据应用层,为各种报表
2021-11-17
17
git常规指令 git常规指令
一些常用指令汇总首先建立本地仓库,初始化git init remote 一下远程仓库git remote add origin https://gitee.com/xxxx pull一下我的分支(学号)git
2021-11-17
16
UDTF原理 UDTF原理
原理解释Hive 的每一个sql会被解释成一个个的operator组成operators,数据放在java中的object中,数据类型放在object inspector中在oprator之间传递. edit:(object inspec
2021-11-16
16
电商数仓-测试与优化 电商数仓-测试与优化
电商数据仓库项目基准测试为什么要做基准测试?在企业中非常关心每天从Java后台拉取过来的数据,需要多久能上传到集群?消费者关心多久能从HDFS上拉取需要的数据? 为了搞清楚HDFS的读写性能,生产环境上非常需要对集群进行压测。 怎么做 第
16
mysql基础 mysql基础
数据库的好处1.持久化数据到本地 2.可以实现结构化查询,方便管理 数据库相关概念1、DB:数据库,保存一组有组织的数据的容器 2、DBMS:数据库管理系统,又称为数据库软件(产品),用于管理DB中的数据 3、SQL:结构化查询语言,用于
2021-11-16
5 / 6