涨姿势|提升bigger的大数据术语,春节聚会你可能需要!

供稿:菲尼克斯(中国)投资有限公司

  • 关键词:大数据
  • 摘要:大数据(big data),是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。


大数据(big data),是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。


大数据已经成为近年来的热点,围绕大数据,又衍生了一堆高大上的专业术语,小伙伴们知道吗?小编特地整理了一些术语跟大家分享,趁现在赶紧了解了解,春节期间亲朋聚会、酒桌闲聊的时候,不经意间随便撂几个术语,bigger立马提升有木有?


敲黑板敲黑板,划重点啦!


1.算法(Algorithms):可以完成某种数据分析的数学公式,是解决问题的清晰指令。


2.分析法(Analytics):利用大量数据来进行推断和讲故事,用于发现数据的内在涵义。比如年末某APP提供了这一年你在衣食住行等方面的消费占比,并得出一个结论关键词。


3.Hadoop:一个开源软件框架,主要组成部分是Hadoop分布式文件系统(HDFS),Hadoop部署了分布式硬件以支持大型数据集的存储、检索和分析。


4. 分布式文件系统(HDFS):由于大数据太大而无法在单个系统上进行存储,分布式文件系统提供一种数据存储系统,方便跨多个存储设备进行大量数据的存放,并有助于降低大量数据存储的成本和复杂度。


5.IOT (Internet of things,简称IOT):通过互联网将嵌入式对象(传感器、可穿戴设备、汽车、冰箱等)中的计算设备互连在一起,并且能够发送/接收数据。



6.黑暗数据(Dark data):黑暗数据并不可怕,它是针对单一目标而收集的数据,通常用过之后就被归档闲置,并未用于任何有意义的用途,但是利用得好也会带来很大收益。例如一家电气销售公司,通过分析十年内的销售数据,按照电气设备的生命周期,通过拜访老客户,获得了大量设备维修订单。


7.块数据(Block data):是大数据发展的高级形式,指在一个物理空间或行政区域内形成的涉及人、事、物的各类数据的总和。例如百货商场销售的商品种类、数量,男女老少在商场的购物、娱乐情况,天气、公交和停车场对商场经营情况的影响等等,这些数据可以称为块数据。




8.数据湖(Data lake):一种区别于原始数据仓库的数据存储架构,以原生格式保存大量的原始数据,可以包含结构化、非结构化数据,直到数据被使用的时候再进行处理。


9.ETL(Extract提取,Transform转换,Load加载):一种用于数据库或者数据仓库的处理过程。即从各种不同的数据源提取(E)数据,并转换(T)成能满足业务需要的数据,最后将其加载(L)到数据库。


10.MapReduce(Map映射,Reduce归纳):一种编程模型,首先将大数据的数据集分成几个部分,然后部署到不同位置的不同计算机上,即Map。接下来该模型收集到所有结果并将“减少”到同一份报告中,即Reduce。


发布时间:2018年2月1日 16:27  人气:   审核编辑(何为)
相关链接

我有需求