数据挖掘学习笔记(一) 喜欢ヅ旅行 2023-07-17 05:59 27阅读 0赞 由于疫情原因我们学校开展了网课教学,总溜号,课下补回来叭。 第六章前半部 1. 关联规则 ![在这里插入图片描述][20200319203522152.png] 支持度:牛奶和面包“同时”购买的事物。占所有事物的2% 置信度:在所有购买牛奶的事物中,购买面包的占比60% ![在这里插入图片描述][20200319203841976.png] ![在这里插入图片描述][2020031920390255.png] 2. 频繁项集 ![在这里插入图片描述][2020031920435787.png] 关联规则的挖掘过程 找出所有的频繁项集→产生强关联规则。 有趣的关联规则(强规则):设定支持度和 置信度的最小阈值。 3. 频繁项集发现的算法–Apriori算法(先验算法) 应用范畴:布尔型关联规则。 集合的反单调性:若一个集合不能通过测试,则它所有的超集都不能通过测试。[超集概念][Link 1] 先验性质:某项集不是频繁得→其所有超集都不是频繁的 某项集是频繁的→其所有非空项集一定是频繁的 ![在这里插入图片描述][watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MzEzMDY2OQ_size_16_color_FFFFFF_t_70] 4. 生成强规则 ![在这里插入图片描述][watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MzEzMDY2OQ_size_16_color_FFFFFF_t_70 1] ![在这里插入图片描述][2020031921065137.png] 若满足,则输出一个强规则:s→(l-s)。 [20200319203522152.png]: /images/20230528/af9c8a24fd3241748c77428d78c67961.png [20200319203841976.png]: /images/20230528/6ba673a49ae148b390327894b89a020b.png [2020031920390255.png]: /images/20230528/d088ff7452d645918fbaa7ae2f093474.png [2020031920435787.png]: /images/20230528/e893e9164a404ce3893ab43d1a7d148f.png [Link 1]: https://www.baidu.com/s?wd=%E4%BB%80%E4%B9%88%E6%98%AF%E8%B6%85%E9%9B%86 [watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MzEzMDY2OQ_size_16_color_FFFFFF_t_70]: /images/20230528/277f45d584624548b66ca7b8002e02b3.png [watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MzEzMDY2OQ_size_16_color_FFFFFF_t_70 1]: /images/20230528/7ca458a35bc34ddeb818f5a79e7bf941.png [2020031921065137.png]: /images/20230528/c158e24e6c4649fd82d2765dad2a1eb3.png
还没有评论,来说两句吧...