发表评论取消回复
相关阅读
相关 SparkCore RDD概述
1 RDD 概述 1.1 什么是 RDD RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是 Spark 中最基本...
相关 struts2杂记(一)——使用doubleSelect
一、前言 这段时间忙的要死,做项目,学框架,时间根本不够用,只能尽量抽出时间记录自己学过的东西。 1.1、doubleSelect 在之前学习中,我们使用过二
相关 SparkCore杂记二
这篇博客主要讲解Spark中任务shuffle与persistence, 首先来说说shuffle洗牌,学过hadoop的同学应该都了解mapreduce,每一个
相关 SparkCore杂记一
接触Spark也有一段时间了,最开始一直都是上网看一些博客,自己搭建个虚拟机倒腾,都是一些零散的学习,回头想想还是有必要系统性的学习、理解一遍,本系列博客将会
相关 Spark系列--SparkCore(一)RDD简介
前言 RDD是Spark的基石,是实现Spark数据处理的核心抽象。那么RDD为什么会产生呢? Hadoop的MapReduce是一种基于数据集的工作模式,面向数据,这
相关 shell脚本杂记(一)
1,登陆系统时,$代表普通用户,\代表管理员用户 2,执行多个命令时cmd1;cmd2 使用分号隔开 3,ehco -e "abc\\nabc" 转换转义字符,会生成两
相关 SparkCore(一)
1.什么是RDD RDD分布式数据集,是Spark中最基础的数据抽象,代码中谁一个抽象类,它代表一不可变、可分区、元素可并行计算的集合。 1.2RDD的特点 分区
还没有评论,来说两句吧...