数仓项目-用户行为数据


用户行数据的目标数据组成

启动数据

  1. 启动入口————图标(icon),通知(notification),安装后启动(install)
  2. 加载时间————100
  3. 开屏广告id————2
  4. 广告播放时间————1000
  5. 用户跳过广告时间
  6. 启动时间

页面数据

  1. 页面id
  2. 上一页id
  3. 页面对象类型
  4. 页面对象id
  5. 页面来源类型
  6. 停留时间
  7. 跳入时间

事件数据

  1. 动作id
  2. 动作目标类型
  3. 动作目标id
  4. 动作时间

曝光数据

  1. 曝光类型
  2. 曝光对象类型
  3. 曝光对象id
  4. 曝光顺序
  5. 曝光位置

错误数据

  1. 错误码
  2. 错误信息

ODS层构建用于存放用户行为数据的表ods_log

drop table if exists ods_log;
create external table ods_log(
line string
)partitioned by (dt string)
stored as -- 采用lzo压缩格式
 inputformat 'com.hadoop.mapred.DeprecatedLzoTextInputFormat'
 outputformat 'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
 location '/warehouse/gmall/ods/ods_log'

文章作者: tzkTangXS
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 tzkTangXS !
  目录