用户画像:用户画像表

古城微笑少年丶 2023-09-27 18:41 94阅读 0赞

================ 用户画像表 结构图================

  1. 用户画像表 ADM
  2. 每天汇总出的用户画像表仅包含当天的数据,因此还需要和之前汇总好的用户画像表进行新的合并操作后,才算真正的最新数据的用户画像表
  3. 用户画像宽表 ADM adm.itcast_adm_personas(时间分区)
  4. 用户画像宽表 ADM = 用户基本属性表 GDM gdm.itcast_gdm_user_basic(时间分区)(第 1 张表)
  5. + 客户消费模型表 GDM gdm.itcast_gdm_user_consume_order(时间分区)(第 7 张表 = 2 + 3 + 4 + 5 + 6
  6. + 客户喜好消费的商品分类模型表 GDM gdm.itcast_gdm_user_buy_category(时间分区)(第 12 张表 = 8 + 9 + 10 + 11
  7. + 用户访问模型表 GDM gdm.itcast_gdm_user_visit(时间分区)(第 15 张表 = 13 + 14
  8. 用户标签表
  9. 可根据 客户消费模型表 + 客户喜好消费的商品分类模型表 + 用户访问模型表 分析出 该人的购买喜好、购买习惯、购买实力,从而推荐相似的商品给该用户

================ 用户画像表 ================

  1. 用户画像 宽表:根据 用户基本属性表、客户消费订单表、客户购买类目表、用户访问信息表 生成 用户画像宽表
  2. create database if not exists adm; //ADM 层(对 GDM 层指标数据 进行指标数据的业务汇总分析):高度聚合
  3. create table if not exists adm.itcast_adm_personas(
  4. user_id string ,--用户ID
  5. user_name string ,--用户登陆名
  6. user_sex string ,--用户性别
  7. user_birthday string ,--用户生日
  8. user_age bigint ,--用户年龄
  9. constellation string ,--用户星座
  10. province string ,--省份
  11. city string ,--城市
  12. city_level string ,--城市等级
  13. hex_mail string ,--邮箱
  14. op_mail string ,--邮箱运营商
  15. hex_phone string ,--手机号
  16. fore_phone string ,--手机前3
  17. op_phone string ,--手机运营商
  18. add_time timestamp ,--注册时间
  19. login_ip string ,--登陆ip地址
  20. login_source string ,--登陆来源
  21. request_user string ,--邀请人
  22. total_mark bigint ,--会员积分
  23. used_mark bigint ,--已使用积分
  24. level_name string ,--会员等级名称
  25. blacklist bigint ,--用户黑名单
  26. is_married bigint ,--婚姻状况
  27. education string ,--学历
  28. monthly_money double ,--收入
  29. profession string ,--职业
  30. sex_model bigint ,--性别模型
  31. is_pregnant_woman bigint ,--是否孕妇
  32. is_have_children bigint ,--是否有小孩
  33. children_sex_rate double ,--孩子性别概率
  34. children_age_rate double ,--孩子年龄概率
  35. is_have_car bigint ,--是否有车
  36. potential_car_user_rate double ,--潜在汽车用户概率
  37. phone_brand string ,--使用手机品牌
  38. phone_brand_level string ,--使用手机品牌档次
  39. phone_cnt bigint ,--使用多少种不同的手机
  40. change_phone_rate bigint ,--更换手机频率
  41. majia_flag string ,--马甲标志
  42. majie_account_cnt bigint ,--马甲账号数量
  43. loyal_model bigint ,--用户忠诚度
  44. shopping_type_model bigint ,--用户购物类型
  45. figure_model bigint ,--身材
  46. stature_model bigint ,--身高
  47. first_order_time timestamp, --第一次消费时间
  48. last_order_time timestamp, --最近一次消费时间
  49. first_order_ago bigint, --首单距今时间
  50. last_order_ago bigint, --尾单距今时间
  51. month1_hg_order_cnt bigint, --近30天购买次数(不含退拒)
  52. month1_hg_order_amt double, --近30天购买金额(不含退拒)
  53. month2_hg_order_cnt bigint, --近60天购买次数(不含退拒)
  54. month2_hg_order_amt double, --近60天购买金额(不含退拒)
  55. month3_hg_order_cnt bigint, --近90天购买次数(不含退拒)
  56. month3_hg_order_amt double, --近90天购买金额(不含退拒)
  57. month1_order_cnt bigint, --近30天购买次数(含退拒)
  58. month1_order_amt double, --近30天购买金额(含退拒)
  59. month2_order_cnt bigint, --近60天购买次数(含退拒)
  60. month2_order_amt double, --近60天购买金额(含退拒)
  61. month3_order_cnt bigint, --近90天购买次数(含退拒)
  62. month3_order_amt double, --近90天购买金额(含退拒)
  63. max_order_amt double, --最大消费金额
  64. min_order_amt double, --最小消费金额
  65. total_order_cnt bigint, --累计消费次数(不含退拒)
  66. total_order_amt double, --累计消费金额(不含退拒)
  67. user_avg_amt double, --客单价(含退拒)(每一个顾客平均购买商品的金额,客单价也即是平均交易金额)
  68. month3_user_avg_amt double, --近90天的客单价
  69. common_address string, --常用收货地址
  70. common_paytype string, --常用支付方式
  71. month1_cart_cnt bigint, --近30天购物车的次数
  72. month1_cart_goods_cnt bigint, --近30天购物车商品件数
  73. month1_cart_submit_cnt bigint, --近30天购物车提交商品件数
  74. month1_cart_rate double, --近30天购物车成功率
  75. month1_cart_cancle_cnt double, --近30天购物车放弃件数
  76. return_cnt bigint, --退货商品数量
  77. return_amt double, --退货商品金额
  78. reject_cnt bigint, --拒收商品数量
  79. reject_amt double, --拒收商品金额
  80. last_return_time timestamp, --最近一次退货时间
  81. school_order_cnt bigint, --学校下单总数
  82. company_order_cnt bigint, --单位下单总数
  83. home_order_cnt bigint, --家里下单总数
  84. forenoon_order_cnt bigint, --上午下单总数
  85. afternoon_order_cnt bigint, --下午下单总数
  86. night_order_cnt bigint, --晚上下单总数
  87. morning_order_cnt bigint, --凌晨下单总数
  88. first_category_id BIGINT, --一级分类ID
  89. first_category_name STRING, --一级分类名称
  90. second_category_id BIGINT, --二分类ID
  91. second_catery_name STRING, --二级分类名称
  92. third_category_id BIGINT, --三级分类ID
  93. third_category_name STRING, --三级分类名称
  94. month1_category_cnt BIGINT, --近30天购物类目次数
  95. month1_category_amt STRING, --近30天购物类目金额
  96. month3_category_cnt BIGINT, --近90天购物类目次数
  97. month3_category_amt STRING, --近90天购物类目金额
  98. month6_category_cnt BIGINT, --近180天购物类目次数
  99. month6_category_amt STRING, --近180天购物类目金额
  100. total_category_cnt BIGINT, --累计购物类目次数
  101. total_category_amt STRING, --累计购物类目金额
  102. month1_cart_category_cnt BIGINT,--近30天购物车类目次数
  103. month3_cart_category_cnt BIGINT,--近90天购物车类目次数
  104. month6_cart_category_cnt BIGINT,--近180天购物车类目次数
  105. total_cart_category_cnt BIGINT, --累计购物车类目次数
  106. last_category_time TIMESTAMP, --近90天之内最后一次购买类目时间
  107. last_category_ago BIGINT, --近90天之内最后一次购买类目距今天数
  108. latest_pc_visit_date string, --近90天之内最近一次PC端访问日期
  109. latest_app_visit_date string, --近90天之内最近一次APP端访问日期
  110. latest_pc_visit_session string, --近90天之内最近一次PC端访问的session
  111. latest_pc_cookies string, --近90天之内最近一次PC端访问的cookies
  112. latest_pc_pv string, --近90天之内最近一次PC端访问的PV
  113. latest_pc_browser_name string, --近90天之内最近一次PC端访问使用的游览器
  114. latest_pc_visit_os string, --近90天之内最近一次PC端访问使用的操作系统
  115. latest_app_name string, --近90天之内最近一次APP端访问app名称
  116. latest_app_visit_os string, --近90天之内最近一次APP端访问使用的操作系统
  117. latest_visit_ip string, --近90天之内最近一次访问IP(不分APPPC)
  118. latest_city string, --近90天之内最近一次访问城市(不分APPPC)
  119. latest_province string, --近90天之内最近一次访问省份(不分APPPC)
  120. first_pc_visit_date string, --近90天之内第一次PC端访问日期
  121. first_app_visit_date string, --近90天之内第一次APP端访问日期
  122. first_pc_visit_session string, --近90天之内第一次PC端访问的session
  123. first_pc_cookies string, --近90天之内第一次PC端访问的cookies
  124. first_pc_pv string, --近90天之内第一次PC端访问的PV
  125. first_pc_browser_name string, --近90天之内第一次PC端访问使用的游览器
  126. first_pc_visit_os string, --近90天之内第一次PC端访问使用的操作系统
  127. first_app_name string, --近90天之内第一次APP端访问app名称
  128. first_app_visit_os string, --近90天之内第一次APP端访问使用的操作系统
  129. first_visit_ip string, --近90天之内第一次访问IP(不分APPPC)
  130. first_city string, --近90天之内第一次访问城市(不分APPPC)
  131. first_province string, --近90天之内第一次访问省份(不分APPPC)
  132. day7_app_cnt bigint, --近7APP端访问次数
  133. day15_app_cnt bigint, --近15APP端访问次数
  134. month1_app_cnt bigint, --近30APP端访问次数
  135. month2_app_cnt bigint, --近60APP端访问次数
  136. month3_app_cnt bigint, --近90APP端访问次数
  137. day7_pc_cnt bigint, --近7PC端访问次数
  138. day15_pc_cnt bigint, --近15PC端访问次数
  139. month1_pc_cnt bigint, --近30PC端访问次数
  140. month2_pc_cnt bigint, --近60PC端访问次数
  141. month3_pc_cnt bigint, --近90PC端访问次数
  142. month1_pc_days bigint, --近30PC端访问天数
  143. month1_pc_pv bigint, --近30PC端访问PV
  144. month1_pc_avg_pv bigint, --近30PC端访问平均PV
  145. month1_pc_diff_ip_cnt bigint, --近30PC端访问不同ip
  146. month1_pc_diff_cookie_cnt bigint, --近30PC端访问不同的cookie
  147. month1_pc_common_ip string, --近30PC端访问最常用ip
  148. month1_pc_common_cookie string, --近30PC端访问最常用的cookie
  149. month1_pc_common_browser_name string, --近30PC端访问最常用游览器
  150. month1_pc_common_os string, --近30PC端访问最常用的操作系统
  151. month1_hour025_cnt bigint, --近30PC0-5点访问次数
  152. month1_hour627_cnt bigint, --近30PC6-7点访问次数
  153. month1_hour829_cnt bigint, --近30PC8-9点访问次数
  154. month1_hour10212_cnt bigint, --近30PC10-12点访问次数
  155. month1_hour13214_cnt bigint, --近30PC13-14点访问次数
  156. month1_hour15217_cnt bigint, --近30PC15-17点访问次数
  157. month1_hour18219_cnt bigint, --近30PC18-19点访问次数
  158. month1_hour20221_cnt bigint, --近30PC20-21点访问次数
  159. month1_hour22223_cnt bigint --近30PC22-23点访问次数
  160. ); //第二版本:partitioned by (dt string);
  161. -----加载数据:根据 用户基本属性表、客户消费订单表、客户购买类目表、用户访问信息表 生成 用户画像宽表
  162. insert overwrite table adm.itcast_adm_personas //第二版本:insert overwrite table adm.itcast_adm_personas partition(dt=${partdt})
  163. select
  164. a.user_id,
  165. a.user_name,
  166. a.user_sex,
  167. a.user_birthday,
  168. a.user_age,
  169. a.constellation,
  170. a.province,
  171. a.city,
  172. a.city_level,
  173. a.hex_mail,
  174. a.op_mail,
  175. a.hex_phone,
  176. a.fore_phone,
  177. a.op_phone,
  178. a.add_time,
  179. a.login_ip,
  180. a.login_source,
  181. a.request_user,
  182. a.total_mark,
  183. a.used_mark,
  184. a.level_name,
  185. a.blacklist,
  186. a.is_married,
  187. a.education,
  188. a.monthly_money,
  189. a.profession,
  190. a.sex_model,
  191. a.is_pregnant_woman,
  192. a.is_have_children,
  193. a.children_sex_rate,
  194. a.children_age_rate,
  195. a.is_have_car,
  196. a.potential_car_user_rate,
  197. a.phone_brand,
  198. a.phone_brand_level,
  199. a.phone_cnt,
  200. a.change_phone_rate,
  201. a.majia_flag,
  202. a.majie_account_cnt,
  203. a.loyal_model,
  204. a.shopping_type_model,
  205. a.figure_model,
  206. a.stature_model,
  207. b.first_order_time,
  208. b.last_order_time,
  209. b.first_order_ago,
  210. b.last_order_ago,
  211. b.month1_hg_order_cnt,
  212. b.month1_hg_order_amt,
  213. b.month2_hg_order_cnt,
  214. b.month2_hg_order_amt,
  215. b.month3_hg_order_cnt,
  216. b.month3_hg_order_amt,
  217. b.month1_order_cnt,
  218. b.month1_order_amt,
  219. b.month2_order_cnt,
  220. b.month2_order_amt,
  221. b.month3_order_cnt,
  222. b.month3_order_amt,
  223. b.max_order_amt,
  224. b.min_order_amt,
  225. b.total_order_cnt,
  226. b.total_order_amt,
  227. b.user_avg_amt,
  228. b.month3_user_avg_amt,
  229. b.common_address,
  230. b.common_paytype,
  231. b.month1_cart_cnt,
  232. b.month1_cart_goods_cnt,
  233. b.month1_cart_submit_cnt,
  234. b.month1_cart_rate,
  235. b.month1_cart_cancle_cnt,
  236. b.return_cnt,
  237. b.return_amt,
  238. b.reject_cnt,
  239. b.reject_amt,
  240. b.last_return_time,
  241. b.school_order_cnt,
  242. b.company_order_cnt,
  243. b.home_order_cnt,
  244. b.forenoon_order_cnt,
  245. b.afternoon_order_cnt,
  246. b.night_order_cnt,
  247. b.morning_order_cnt,
  248. c.first_category_id,
  249. c.first_category_name,
  250. c.second_category_id,
  251. c.second_catery_name,
  252. c.third_category_id,
  253. c.third_category_name,
  254. c.month1_category_cnt,
  255. c.month1_category_amt,
  256. c.month3_category_cnt,
  257. c.month3_category_amt,
  258. c.month6_category_cnt,
  259. c.month6_category_amt,
  260. c.total_category_cnt,
  261. c.total_category_amt,
  262. c.month1_category_cnt,
  263. c.month3_category_cnt,
  264. c.month6_category_cnt,
  265. c.total_category_cnt,
  266. c.last_category_time,
  267. c.last_category_ago,
  268. d.latest_pc_visit_date,
  269. d.latest_app_visit_date,
  270. d.latest_pc_visit_session,
  271. d.latest_pc_cookies,
  272. d.latest_pc_pv,
  273. d.latest_pc_browser_name,
  274. d.latest_pc_visit_os,
  275. d.latest_app_name,
  276. d.latest_app_visit_os,
  277. d.latest_visit_ip,
  278. d.latest_city,
  279. d.latest_province,
  280. d.first_pc_visit_date,
  281. d.first_app_visit_date,
  282. d.first_pc_visit_session,
  283. d.first_pc_cookies,
  284. d.first_pc_pv,
  285. d.first_pc_browser_name,
  286. d.first_pc_visit_os,
  287. d.first_app_name,
  288. d.first_app_visit_os,
  289. d.first_visit_ip,
  290. d.first_city,
  291. d.first_province,
  292. d.day7_app_cnt,
  293. d.day15_app_cnt,
  294. d.month1_app_cnt,
  295. d.month2_app_cnt,
  296. d.month3_app_cnt,
  297. d.day7_pc_cnt,
  298. d.day15_pc_cnt,
  299. d.month1_pc_cnt,
  300. d.month2_pc_cnt,
  301. d.month3_pc_cnt,
  302. d.month1_pc_days,
  303. d.month1_pc_pv,
  304. d.month1_pc_avg_pv,
  305. d.month1_pc_diff_ip_cnt,
  306. d.month1_pc_diff_cookie_cnt,
  307. d.month1_pc_common_ip,
  308. d.month1_pc_common_cookie,
  309. d.month1_pc_common_browser_name,
  310. d.month1_pc_common_os,
  311. d.month1_hour025_cnt,
  312. d.month1_hour627_cnt,
  313. d.month1_hour829_cnt,
  314. d.month1_hour10212_cnt,
  315. d.month1_hour13214_cnt,
  316. d.month1_hour15217_cnt,
  317. d.month1_hour18219_cnt,
  318. d.month1_hour20221_cnt,
  319. d.month1_hour22223_cnt
  320. from gdm.itcast_gdm_user_basic a //用户基本属性表
  321. left join gdm.itcast_gdm_user_consume_order b on a.user_id=b.user_id //客户消费订单表
  322. left join gdm.itcast_gdm_user_buy_category c on a.user_id=c.user_id //客户购买类目表
  323. left join gdm.itcast_gdm_user_visit d on a.user_id=d.user_id; //用户访问信息表
  324. 第二版本:
  325. from gdm.itcast_gdm_user_basic a where dt=${partdt}
  326. left join gdm.itcast_gdm_user_consume_order b where dt=${partdt} on a.user_id=b.user_id
  327. left join gdm.itcast_gdm_user_buy_category c where dt=${partdt} on a.user_id=c.user_id
  328. left join gdm.itcast_gdm_user_visit d where dt=${partdt} on a.user_id=d.user_id;

================== 每天的 用户画像表 进行汇总 ==================

  1. beeline -u jdbc:hive2://node1:10000 -n root
  2. 1.每天用户画像表:
  3. adm.itcast_adm_personas_日期时间 即为 adm.itcast_adm_personas_${partdt}



用户画像 用户画像表_あずにゃん的博客-CSDN博客

发表评论

表情:
评论列表 (有 0 条评论,94人围观)

还没有评论,来说两句吧...

相关阅读

    相关 用户画像总结

            最近在工作之余,结合自己的理解和论坛上的一些帖子,整理了份用户画像的文章,个人觉得这篇文章在宏观上很好地描述了用户画像的主要内容。(文章内的图片来源于不同帖子,

    相关 用户画像简介

            随着我国电子商务的高速发展,越来越多的人注意到数据信息对于电商市场的推动作用。基于数据分析的精准营销方式,可以最大限度的挖掘并留住潜在客户,数据统计与分析为电商

    相关 用户画像

    1、用户画像        用户画像主要是为了刻画一个用户的特征,主要分为定量画像和定性画像,定量的主要是数量,定性的主要是一种特征,i并不能用数量表示,一般是使用标签来

    相关 用户画像

    什么是用户画像 简单来说,就是根据数据来描述用户,比如用标签:宅男、宅女、汽车迷、电影迷等等 是对现实世界中用户的数学建模 是描述用户的数据,是符合特定业务需

    相关 用户画像

    这里不包含算法、技术、架构内容,因为相对来说,用户画像落地比较简单,难的是用户画像的价值落地。 用户画像是一个挺新颖的词,最初它是大数据行业言必及之的时髦概念。现在我们谈及用

    相关 用户画像建设

    用户画像 用户画像,即用户信息标签化,是大数据精细化运营和精准营销服务的基础。 在大数据的时代下,用户的一切行为是可追溯和分析的。 用户画像是通过分析用户的基础信息、