数仓实战04:数仓搭建-DWD层

た 入场券 2022-11-29 03:17 252阅读 0赞

1)对用户行为数据解析
2)对核心数据进行判空过滤。
3)对业务数据采用维度模型重新建模,即维度退化。

1.用户行为启动表数据解析

1.1创建启动表

1)建表语句

  1. hive (gmall) > DROP TABLE
  2. IF EXISTS dwd_start_log;
  3. CREATE EXTERNAL TABLE dwd_start_log (
  4. `mid_id` string,
  5. `user_id` string,
  6. `version_code` string,
  7. `version_name` string,
  8. `lang` string,
  9. `source` string,
  10. `os` string,
  11. `area` string,
  12. `model` string,
  13. `brand` string,
  14. `sdk_version` string,
  15. `gmail` string,
  16. `height_width` string,
  17. `app_time` string,
  18. `network` string,
  19. `lng` string,
  20. `lat` string,
  21. `entry` string,
  22. `open_ad_type` string,
  23. `action` string,
  24. `loading_time` string,
  25. `detail` string,
  26. `extend1` string
  27. ) PARTITIONED BY (dt string) stored AS parquet lo

发表评论

表情:
评论列表 (有 0 条评论,252人围观)

还没有评论,来说两句吧...

相关阅读