如何构建用户画像 爱被打了一巴掌 2022-05-12 18:08 224阅读 0赞 ## 三、如何构建用户画像 ## 一 个标签通常是人为规定的高度精炼的特征标识,如年龄段标签:25~35岁,地域标签:北京,标签呈现出两个重要特征:语义化,人能很方便地理解每个标签含 义。这也使得用户画像模型具备实际意义。能够较好的满足业务需求。如,判断用户偏好。短文本,每个标签通常只表示一种含义,标签本身无需再做过多文本分析 等预处理工作,这为利用机器提取标准化信息提供了便利。 人制定标签规则,并能够通过标签快速读出其中的信息,机器方便做标签提取、聚合分析。所以,用户画像,即:用户标签,向我们展示了一种朴素、简洁的方法用于描述用户信息。 ### 3.1 数据源分析 ### 构建用户画像是为了还原用户信息,因此数据来源于:所有用户相关的数据。 对 于用户相关数据的分类,引入一种重要的分类思想:封闭性的分类方式。如,世界上分为两种人,一种是学英语的人,一种是不学英语的人;客户分三类,高价值客 户,中价值客户,低价值客户;产品生命周期分为,投入期、成长期、成熟期、衰退期…所有的子分类将构成了类目空间的全部集合。 这样的分类方式,有助于后续不断枚举并迭代补充遗漏的信息维度。不必担心架构上对每一层分类没有考虑完整,造成维度遗漏留下扩展性隐患。另外,不同的分类方式根据应用场景,业务需求的不同,也许各有道理,按需划分即可。 本文将用户数据划分为静态信息数据、动态信息数据两大类。 ![用户画像][10] [![User3][]][User3] ### 静态信息数据 ### 用户相对稳定的信息,如图所示,主要包括人口属性、商业属性等方面数据。这类信息,自成标签,如果企业有真实信息则无需过多建模预测,更多的是数据清洗工作,因此这方面信息的数据建模不是本篇文章重点。 ### 动态信息数据 ### 用 户不断变化的行为信息,如果存在上帝,每一个人的行为都在时刻被上帝那双无形的眼睛监控着,广义上讲,一个用户打开网页,买了一个杯子;与该用户傍晚溜了 趟狗,白天取了一次钱,打了一个哈欠等等一样都是上帝眼中的用户行为。当行为集中到互联网,乃至电商,用户行为就会聚焦很多,如上图所示:浏览凡客首页、 浏览休闲鞋单品页、搜索帆布鞋、发表关于鞋品质的微博、赞“双十一大促给力”的微博消息。等等均可看作互联网用户行为。 本篇文章以互联网电商用户,为主要分析对象,暂不考虑线下用户行为数据(分析方法雷同,只是数据获取途径,用户识别方式有些差异)。 在互联网上,用户行为,可以看作用户动态信息的唯一数据来源。如何对用户行为数据构建数据模型,分析出用户标签,将是本文着重介绍的内容。 ### 3.2 目标分析 ### 用户画像的目标是通过分析用户行为,最终为每个用户打上标签,以及该标签的权重。如,红酒 0.8、李宁 0.6。 标签,表征了内容,用户对该内容有兴趣、偏好、需求等等。 权重,表征了指数,用户的兴趣、偏好指数,也可能表征用户的需求度,可以简单的理解为可信度,概率。 ### 3.3 数据建模方法 ### 下面内容将详细介绍,如何根据用户行为,构建模型产出标签、权重。一个事件模型包括:时间、地点、人物三个要素。每一次用户行为本质上是一次随机事件,可以详细描述为:什么用户,在什么时间,什么地点,做了什么事。 什么用户:关键在于对用户的标识,用户标识的目的是为了区分用户、单点定位。 ![用户画像][10 1] 以上列举了互联网主要的用户标识方法,获取方式由易到难。视企业的用户粘性,可以获取的标识信息有所差异。 **什么时间:**时 间包括两个重要信息,时间戳+时间长度。时间戳,为了标识用户行为的时间点,如,1395121950(精度到 秒),1395121950.083612(精度到微秒),通常采用精度到秒的时间戳即可。因为微秒的时间戳精度并不可靠。浏览器时间精度,准确度最多也 只能到毫秒。时间长度,为了标识用户在某一页面的停留时间。 **什么地点:**用户接触点,Touch Point。对于每个用户接触点。潜在包含了两层信息:网址 + 内容。网址:每一个url链接(页面/屏幕),即定位了一个互联网页面地址,或者某个产品的特定页面。可以是PC上某电商网站的页面url,也可以是手机 上的微博,微信等应用某个功能页面,某款产品应用的特定画面。如,长城红酒单品页,微信订阅号页面,某游戏的过关页。 **内容:**每个url网址(页面/屏幕)中的内容。可以是单品的相关信息:类别、品牌、描述、属性、网站信息等等。如,红酒,长城,干红,对于每个互联网接触点,其中网址决定了权重;内容决定了标签。 注: 接触点可以是网址,也可以是某个产品的特定功能界面。如,同样一瓶矿泉水,超市卖1元,火车上卖3元,景区卖5元。商品的售卖价值,不在于成本,更在于售 卖地点。标签均是矿泉水,但接触点的不同体现出了权重差异。这里的权重可以理解为用户对于矿泉水的需求程度不同。即,愿意支付的价值不同。 标签 权重 矿泉水 1 // 超市 矿泉水 3 // 火车 矿泉水 5 // 景区 类似的,用户在京东商城浏览红酒信息,与在品尚红酒网浏览红酒信息,表现出对红酒喜好度也是有差异的。这里的关注点是不同的网址,存在权重差异,权重模型的构建,需要根据各自的业务需求构建。 所以,网址本身表征了用户的标签偏好权重。网址对应的内容体现了标签信息。 **什么事:**用户行为类型,对于电商有如下典型行为:浏览、添加购物车、搜索、评论、购买、点击赞、收藏 等等。 不同的行为类型,对于接触点的内容产生的标签信息,具有不同的权重。如,购买权重计为5,浏览计为1 红酒 1 // 浏览红酒 红酒 5 // 购买红酒 综合上述分析,用户画像的数据模型,可以概括为下面的公式:用户标识 + 时间 + 行为类型 + 接触点(网址+内容),某用户因为在什么时间、地点、做了什么事。所以会打上\*\*标签。 用户标签的权重可能随时间的增加而衰减,因此定义时间为衰减因子r,行为类型、网址决定了权重,内容决定了标签,进一步转换为公式: **标签权重=衰减因子×行为权重×网址子权重** 如:用户A,昨天在品尚红酒网浏览一瓶价值238元的长城干红葡萄酒信息。 * 标签:红酒,长城 * 时间:因为是昨天的行为,假设衰减因子为:r=0.95 * 行为类型:浏览行为记为权重1 * 地点:品尚红酒单品页的网址子权重记为 0.9(相比京东红酒单品页的0.7) 假设用户对红酒出于真的喜欢,才会去专业的红酒网选购,而不再综合商城选购。 则用户偏好标签是:红酒,权重是0.95\*0.7 \* 1=0.665,即,用户A:红酒 0.665、长城 0.665。 上述模型权重值的选取只是举例参考,具体的权重值需要根据业务需求二次建模,这里强调的是如何从整体思考,去构建用户画像模型,进而能够逐步细化模型。 ## 四、总结: ## 本文并未涉及具体算法,更多的是阐述了一种分析思想,在计划构建用户画像时,能够给您提供一个系统性、框架性的思维指导。 核心在于对用户接触点的理解,接触点内容直接决定了标签信息。内容地址、行为类型、时间衰减,决定了权重模型是关键,权重值本身的二次建模则是水到渠成的进阶。模型举例偏重电商,但其实,可以根据产品的不同,重新定义接触点。 比如影视产品,我看了一部电影《英雄本色》,可能产生的标签是:周润发 0.6、枪战 0.5、港台 0.3。 最后,接触点本身并不一定有内容,也可以泛化理解为某种阈值,某个行为超过多少次,达到多长时间等。 比如游戏产品,典型接触点可能会是,关键任务,关键指数(分数)等等。如,积分超过1万分,则标记为钻石级用户。钻石用户 1.0。 百分点现已全面应用用户画像技术于推荐引擎中,在对某电商客户,针对活动页新访客的应用中,依靠用户画像产生的个性化效果,对比热销榜,推荐效果有显著提升:推荐栏点击率提升27%, 订单转化率提升34%。 [10]: /images/20220504/e863e5d865f44ddabf5d2d3154fc86ca.png [User3]: /images/20220504/2073ac3f1767485c9933881ac9ab6558.png [10 1]: /images/20220504/739ff84966d849cdaa8fccc9c130da2c.png
相关 用户画像浅析 这篇文章主要和大家分享对于[用户画像][Link 1]的认识,包括如何理解用户画像,为什么需要用户用画像,以及在建设和应用用户画像过程中总结的方法论,让大家了解如何构建好的用户 £神魔★判官ぃ/ 2023年10月16日 16:00/ 0 赞/ 15 阅读
相关 用户画像 ![watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhp 青旅半醒/ 2023年02月22日 10:59/ 0 赞/ 3 阅读
相关 用户画像总结 最近在工作之余,结合自己的理解和论坛上的一些帖子,整理了份用户画像的文章,个人觉得这篇文章在宏观上很好地描述了用户画像的主要内容。(文章内的图片来源于不同帖子, 系统管理员/ 2022年05月28日 02:56/ 0 赞/ 268 阅读
相关 用户画像简介 随着我国电子商务的高速发展,越来越多的人注意到数据信息对于电商市场的推动作用。基于数据分析的精准营销方式,可以最大限度的挖掘并留住潜在客户,数据统计与分析为电商 冷不防/ 2022年05月25日 01:11/ 0 赞/ 211 阅读
相关 如何构建用户画像 三、如何构建用户画像 一 个标签通常是人为规定的高度精炼的特征标识,如年龄段标签:25~35岁,地域标签:北京,标签呈现出两个重要特征:语义化,人能很方便地理解每个标签含 爱被打了一巴掌/ 2022年05月12日 18:08/ 0 赞/ 225 阅读
相关 用户画像 1、用户画像 用户画像主要是为了刻画一个用户的特征,主要分为定量画像和定性画像,定量的主要是数量,定性的主要是一种特征,i并不能用数量表示,一般是使用标签来 青旅半醒/ 2022年04月12日 14:12/ 0 赞/ 215 阅读
相关 用户画像 什么是用户画像 简单来说,就是根据数据来描述用户,比如用标签:宅男、宅女、汽车迷、电影迷等等 是对现实世界中用户的数学建模 是描述用户的数据,是符合特定业务需 缺乏、安全感/ 2022年04月02日 13:47/ 0 赞/ 230 阅读
相关 用户画像总结 转载:https://blog.csdn.net/zzhhoubin/article/details/79727130 最近在工作之余,结合自己的理解和论坛上 小咪咪/ 2022年02月24日 02:14/ 0 赞/ 355 阅读
相关 用户画像 这里不包含算法、技术、架构内容,因为相对来说,用户画像落地比较简单,难的是用户画像的价值落地。 用户画像是一个挺新颖的词,最初它是大数据行业言必及之的时髦概念。现在我们谈及用 朱雀/ 2021年11月05日 09:42/ 0 赞/ 372 阅读
相关 用户画像建设 用户画像 用户画像,即用户信息标签化,是大数据精细化运营和精准营销服务的基础。 在大数据的时代下,用户的一切行为是可追溯和分析的。 用户画像是通过分析用户的基础信息、 男娘i/ 2021年09月21日 16:12/ 0 赞/ 408 阅读
还没有评论,来说两句吧...