大数据-百度百科
大数据(big data,mega data),或称巨量资料,指的是需要新处理模【mó】式才能具有更强的决策力、洞察力和流程优【yōu】化能力的海量、高增长率和多样化的信息资产。
在维克托·迈尔-舍恩伯格及肯尼斯·库克耶【yē】编写的《大数据时代》 中大数据指不用随机分析法(抽样调查)这样的捷径,而采用所【suǒ】有数据进行分析处理。大数据的【de】4V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。
对于“大数【shù】据”(Big data)研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工【gōng】能力”,通【tōng】过“加工”实现数据的“增值”。
从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机【jī】进行处理,必须采用分布式架构。它的特色在【zài】于对海量数据进行分布式数据挖掘,但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化【huà】技术。
随着云时代的来【lái】临,大数据(Big data)也吸引了越来越多的关注。《著云台》的分析师团队认为,大数据(Big data)通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据【jù】库用于分析时会花费过多时间和金钱。大数据分析常和云计算联【lián】系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。
大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理(MPP)数【shù】据库、数据挖掘电网、分布式文件系统、分布式【shì】数据库、云计算平台、互联网和可扩展的存储系统。
大数据-维基百科
大数据(英语:Big data或Megadata),或称巨量数据、海量数【shù】据、大资料,指的是所涉及的数据量规模巨大到无法【fǎ】通过人工,在合理时间内达到截取、管理、处理、并整理成为人类所能解读的信息[3][4]。在总数据量相同的情况下,与个别分析独立的小型数据集(data set)相比,将各个小型数据集合并后进行分【fèn】析可得出许多额外的信息和数据关系性,可用来【lái】察觉商业趋势、判定研究质量【liàng】、避免疾病扩散、打击犯罪或测定实时交通路况等;这样的用途正是大型数据集盛行的原因。
截至2012年,技术上可在合理时间内分析处理的数据集大小单位为艾字节(exabytes)。在许多领域,由于数据集过度庞大,科学家经常在分析处理上遭遇限制和阻碍;这些领域【yù】包括气象学、基因组学[9]、神经网【wǎng】络体学、复杂的物理模拟,以及生物和环境【jìng】研究。这样的限制也对网络搜索、金融与经济信息学造成影响。数据集大小增长的部分原因来自于信息持续从各种来源被【bèi】广泛收集,这些来源包括搭【dā】载感测设备的移动设备、高空感测科技(遥感)、软件记录、相机、麦克风、无线射频辨识(RFID)和无线感测网络。自1980年代起,现代科技可存储数据的容量【liàng】每40个月即增加一倍;截至2012年,全世界每天产生2.5艾字节(2.5×1018)的数据。
大数据几乎无法使用大多数的数据库管理系统处理,而必须使用“在数十、数百甚至数千台服务器上同时平行运行的软件”。大数据的定义取决于持有数据组的机【jī】构之能力,以及其平常用来处理分析数据的软件之能力。“对某些组织来说,第一次面对数百【bǎi】GB的数据集可能让【ràng】他们需要重新思考数据管理【lǐ】的选项。对于其他组织来说,数据集可能需要达到数十或数百兆字节才会对他们造成困扰。”
随着大数据被越来越多的提及,有些人惊呼大数据时代已经到来了,2012年《纽约时报》的一篇专栏中写到,“大数据”时代【dài】已经降临,在商业、经济及其他领域中,决策【cè】将日益基于数据和分析而作出,而并非基于经验和直觉。但是并不是所有人都对big data感兴趣,有些人甚至认为这是商学院或咨询公司用来哗众取宠的buzzword,看起来很新颖,但只是把传统重新包装,之前在学术研究或者政策决策中也有海量数据的支撑,大数据并不是一件新兴事【shì】物。
大数据时代的来临带来无数的机遇【yù】,但是与此同时个人或机构【gòu】的隐私权也极有可能受到冲击,大数据包含了各种个人信息数据,现有的隐私保护法律或政策无力解决这些新出现的问题【tí】。有人提出,大数据时代,个人是否拥有“被遗忘权”,被遗忘权即是否有权利要求数据商不保留自己的某些【xiē】信息,大数据时代信息为某些互联网巨头所控制,但是数据商收集任何数据未必都获得用户的许可,其对数据的控制权不具有合法性。12-05欧盟法院就“被遗忘权”(right to be forgotten)一案作出裁定,判决Google应根据用户请求删除不完整的、无关紧要的、不相关的数据以保证数据不出现在搜索结果中。这说明在大数据时代,加强对用户个人权利的尊重才是时势所趋的潮流。
大数据的应用
大数据应用在生活中可以帮助我们获取到有用的价值。
随着大数据的应用越来越广泛,应用的行业也越来越低,我们每日都可以看到大数据的一些【xiē】新颖的应用,从而帮助人们从中获取到真正有用的价值【zhí】。许多组织或者个人都【dōu】会受到大数据的剖析影响,但是大数据是怎样帮助人们挖掘出有价值的信息呢?下面就让我们一起来看看九个价值极度高的大数据的应用,这些都是大数据在剖析应用上的关键领域:
1.理解客户、满足客户服务需求
大数据的应用现在在这领域是最广为人知的。重点是怎样应用大数据更好的了解客户以及他们的喜好和行为。企业极度喜欢搜集社交方面的数据、浏览器的日志、剖析出文本和传感器的数据,为了更加全面的了解客户。在通常情况下,创建出数据模型进行预测。好比美国的著【zhe】名零售【shòu】商Target就是【shì】通过大数据的剖析,获得有价值的信息,精准得预测到客【kè】户在什么时间想要小孩【hái】。另外,通过大数据的应用,电信公司可以更好预测出流失的客户,沃尔玛则更加精准的预测哪个产品会大卖,汽车保险行业会了解客户的需求和驾驶水平,政府也能了解到选民的偏好。
2.业务流程优化
大数据也更多的帮助业务流程的优化。可以通过利用社交媒体数据、网络搜索以及天气预告挖掘出有价值的数据,其中大数据的应用最广泛的就是供应链以及配送路线【xiàn】的优【yōu】化。在这2个方面,地理定位和无线电频率的识别追踪货物和送货车,利用实时交通路线数据【jù】制订更加优化的路线。人力资源业务也通过大数据的剖析来进行改良,这其【qí】中就包括了人才招聘的优化。
3.大数据正在改善我们的生活
大数据不但单只是应用于企业和政府,同【tóng】样也适用我们生活当中的每个人。我们可以利用穿着的装备(如智能手表或者智能手环)生成【chéng】最新的数据,这让我们可以凭据我们热量的消耗以及睡眠模式来进行追踪。而且还利用利用大数据剖析来寻找属于我们的爱情,大多数时间交友网站就是大数据应用工具来帮助需要的人匹配【pèi】合适的对象。
4.提高医疗和研发
大数据剖析应用的计算能力可以让我们能够在几分钟内就可以解码整个DNA。而且让我们可以制订出最新的治疗方案。同时可以更好的去理解和预测疾病。就好像人们戴上智能手表等可以形成【chéng】的数据一样,大数据同样可以帮助病人对于病情进行更好的治疗【liáo】。大数据技术现在已经在医院【yuàn】应用监视早产婴儿和患病婴儿的情况,通过记录和剖析婴儿的心跳,医生针对婴儿的身体可能会出现不适症状做出预测。这【zhè】样可以帮助医生更好的救助婴儿。