📜  大数据特征

📅  最后修改于: 2020-12-04 02:18:49             🧑  作者: Mango

大数据特征

大数据包含大量未由传统数据存储或处理单元处理的数据。许多跨国公司使用它来处理许多组织的数据和业务。复制之前,每天的数据流将超过150艾字节。

大数据有五个v可以解释这些特征。

5 V的大数据

  • 真实性
  • 品种
  • 速度

大数据本身就是一个巨大的名称。大数据是每天从许多来源(例如业务流程,机器,社交媒体平台,网络,人机交互等等)中生成的海量数据。

Facebook可以产生大约10亿条消息,是记录“赞”按钮的45亿次,每天上传超过3.5亿条新帖子。大数据技术可以处理大量数据。

品种

从不同来源收集的大数据可以是结构化,非结构化和半结构化的。过去只能从数据库和工作中收集数据,但是如今,数据将以数组形式出现,即PDF,电子邮件,音频,SM帖子,照片,视频等。

数据分类如下:

  • 结构化数据:在结构化架构中,以及所有必需的列。它是表格形式。结构化数据存储在关系数据库管理系统中。
  • 半结构化:在半结构化中,未正确定义架构,例如JSON,XML,CSV,TSVemail 。 OLTP(在线交易处理)系统旨在处理半结构化数据。它存储在关系中,即table
  • 非结构化数据:所有非结构化文件,日志文件,音频文件图像文件都包含在非结构化数据中。一些组织拥有大量可用数据,但由于数据是原始数据,因此他们不知道如何得出数据的价值。
  • 准结构数据:数据格式包含文本数据,数据格式不一致,某些工具会费时费力地将其格式化。

示例:Web服务器日志,即日志文件是由包含活动列表的某些服务器创建和维护的。

真实性

准确性意味着多少数据是可靠的。它有很多方法可以过滤或转换数据。准确性是能够有效处理和管理数据的过程。大数据在业务发展中也至关重要。

例如, Facebook带有标签的帖子。

价值是大数据的基本特征。这不是我们处理或存储的数据。我们存储,处理分析这些宝贵可靠的数据。

速度

与其他人相比,速度起着重要作用。速度创造了实时创建数据的速度。它包含传入数据集速度,变化率活动突发的链接。大数据的主要方面是快速提供要求苛刻的数据。

大数据速度处理来自应用程序日志,业务流程,网络和社交媒体站点,传感器,移动设备等来源的数据流速度。