大数据测试之大数据系统及特点

不念不忘少年蓝@ 2024-04-03 14:11 140阅读 0赞

一、大数据系统简介

扫健康码了没?相信大家每天都会不厌其烦地听到这种询问。

支付宝付款,相信大家也是每天都在扫码付款,这已经成为了生活的一部分。

这些能产生非常巨量数据的应用系统,我们称之为大数据系统。

f6bbc9702f02d540c2170f934c8af88e.png

大数据系统还需要从巨量数据中进行有效数据的筛选、处理,比如对健康码进行赋红码、绿码等。

1、大数据系统定义

比较官方的定义:大数据(BigData)是将包括结构化、非结构化、甚至多结构化海量数据进行整合,并通过对这些数据的分析发现其中隐藏的相关信息,进而优化业务和管理。

c38b0caeb27394bbca65b01e40851cde.png

2、大数据系统的特征

对于大数据系统一般具备数据量巨大、数据类型繁多、速度快、时效短、价值密度低的特点,因此处理速度要求快、及时,这样才能体现出价值,因此大数据系统要求计算效率要高。

dfa44a0baf2a30bf396136e2486ef821.png

1)数据量巨大

我们日常使用的网络从3G、4G到现在的5G,网速的不断提升,带来也是数据存储上的提升,从最初的MB、GB到TB,乃至现在有了PB,EB等存储。

我们每天都在产生数据,我们扫一次健康码、使用支付宝进行一次支付、我们发一条知乎文章、刷一条微博评论,都在为大数据系统提供数据,而千千万万个他们也在这么做。

因此,大数据系统的一个很重要的特点就是数据量巨大,而且还在不断地产生新的数据,从大量的数据中,我们才能分析出行为、规律,乃至能预测。

54814623ce72509d8e70944963ebf775.png

2)数据类型多样化

大数据系统还具备一个特点就是数据的多样,他可以是文字、图片、视频、语音等等,只要是在网络上传播的数据,都可以是大数据系统可以操作的对象。

今天你在朋友圈晒了一张三亚旅游的照片。

明天你与密友发了肉麻的语音。

你将珍藏多年岛国爱情片上传的BD网盘。

这些可能在你不知情的情况下,就已经被大数据系统盯上了,你还别不信。

你有没有发现,你刚和朋友商量中午吃什么,你的今日头条可能就给你推送外卖了。

你有没有发现,你刚夸了朋友买的衣服漂亮,淘宝首页就开始展示各种漂亮衣服了。

156d3ccd53728c4e9ce210074ad7a9d1.png

3)传输快、时效短

对于大数据系统来说,数据多、类型繁杂,本来处理起来就是很棘手的事情,但是它还有一个致命的问题就是时效短,今天的数据可能今天有效、明天就无效了。

比如我们的健康码显示核酸数据,今天你是第一天,明天可能就是两天了,再过一天你就要再做核酸了,也就是说核酸数据的只有三天,处理上也就需要及时,如果你的核酸数据,隔两天才能展示,意义又在哪里呢?

而且传输、处理快,必然要求系统硬件要跟得上,像去年的西安健康宝、钉钉都有不止一次因服务器资源不够而导致的宕机。

9b26918593a144564b627dceaf9fc36a.png

4)价值密度低

大数据系统有时候可能会花费大量精力,而徒劳无功,我们费劲收集了大量数据,如果不能在有效时间内处理,并获得有效数据,过时就无效了,相当于前面的工作白做,价值为零。

大数据分析、处理,也像是大海捞针,付出很多,结果不一定好。

比如,知乎粉丝的地域分布,可能这个数据分析起来没那么麻烦,但是如果作为用户,我们不关注,可见它的价值密度基本为零。

0384b5da6a6004754e9a69cc6cbd45e6.png

(本文图片源自网络,若有侵权联系立即删除)

发表评论

表情:
评论列表 (有 0 条评论,140人围观)

还没有评论,来说两句吧...

相关阅读

    相关 数据的四特点

    ![format_png][] 说起大数据,估计大家都觉得只听过概念,但是具体是什么东西,怎么定义,没有一个标准的东西,因为在我们的印象中好像很多公司都叫大数据公司,业务形态

    相关 怎么测试数据

    先抛出个问题 我们为什么要测试大数据 什么大数据测试 大数据测试可以定义为涉及`检查和验证大数据应用程序功能的过程`。大数据是传统存储系统无法处理的大量数据的集