发表评论取消回复
相关阅读
相关 大数据之Hadoop(一)
目录 一、准备三台服务器 二、虚拟机间配置免密登录 三、安装JDK 四、关闭防火墙 五、关闭安全模块SELinux 六、修改时区和自动时间同步 ---------
相关 大数据Hadoop学习之——网页排名PageRank算法
一、算法说明 PageRank即网页排名,也称佩奇排名(社会)。一些基本概念: 1、网页入链:即投票,网页中对其他网页的超链接作为其他网
相关 大数据Hadoop学习之——TF-IDF算法实现
一、算法说明 1、词频TF:是指给定词语在给定文件中出现的次数,一般会做归一化,即除以文件的总词数(注意是分词数,不是字数)。
相关 大数据Hadoop学习之————基于物品的协同过滤算法实现物品推荐
一、基础概念 协同过滤算法一般分为两种实现: 1. 基于用户的协同过滤算法(userCF):通过寻找相似兴趣的其他用户,为指定用户推荐物品。比如用户A喜欢商品A、B,
相关 大数据入门学习之Hadoop技术优缺点
大数据入门学习之Hadoop技术优缺点 (1)Hadoop具有按位存储和处理数据能力的高可靠性。 (2)Hadoop通过可用的计算机集群分配数据,完成存储和计算任务,这些集
相关 spark实现tfidf
package xxx import org.apache.log4j.Logger import org.apache.log4j.Leve
相关 大数据学习之Hadoop环境搭建
一、Hadoop的优势 1)高可靠性:因为Hadoop假设计算元素和存储会出现故障,因为它维护多个工作数据副本,在出现故障时可以对失败的节点重新分布处理。 2)
还没有评论,来说两句吧...