关于大数据时代的读后感的文字专题页,提供各类与大数据时代的读后感相关的句子数据。我们整理了与大数据时代的读后感相关的大量文字资料,以各种维度呈现供您参考。如果大数据时代的读后感未能满足您的需求,请善用搜索找到更适合的句子语录。
3月11日下午两节课后,我校全体教师和受邀而来的金南学区各友好学校的领导及教师汇聚于多媒体教室,共同分享、交流。
老师们从:何谓大数据;立足国情对大数据进行探讨;大数据在教育教学中的主要应用等几个方面畅谈了自己的感悟。
张萌老师说:大数据体量庞大、结构复杂、是产生巨大价值的数据集合。大数据这种方法在*的国情下需要以更加科学、合适的方式进行实践,不可生搬硬套。
董译雯老师说:在你我感叹《大数据》里深植于美国民众血液中的自由、民主、严谨的价值观的同时,可否想过*教育体制下的孩子们身上还残留多少独立与自我意识?作为典型的八零后,我们这一代人身上最缺失的便是独立思考能力。但愿,我的学生哪怕是因为我所做的一点点努力而开始思考“我”这个字的含义,足矣!
张红杰老师说:很感谢校长给我们推荐了《大数据》这本书。在教学工作中,应该有大数据意识,创新意识。学*一些专业的教学统计法、数据分析法,从中发现一些教育现象,并采取相应的策略。让我们的教育教学工作少一些随意和盲目,多一份严谨与科学。
白媛媛老师通过文中的三个事例,结合教学实际,谈了自己教学中对数据使用的价值;结合自己的工作,谈了如何实现工作的最高境界。
交流活动尾声,身为阅读《大数据》的倡议者、发起者、以及忠实的读者韩校长幽默风趣的同大家分享了他读后的感悟:我们心中要装着学校,因为我们个人的命运依赖群体的命运;工作要追求精细化,不能做胡适书中的“差不多”先生;尊重数据,拥有数据意识,建立数据团队!
此次活动从寒假期间倡导读《大数据》一书,到开学伊始的分组沙龙,再到今日的阅读共享,现已圆满告一段落。相信此次活动定会增强我校全体教师的数据意识,掌握大数据,运用大智慧助推我校的教育教学上一个新的台阶!
读完《大数据》,我才意识到这并不是一本枯燥无味的书籍。作者运用案例和讲故事的方式,把美国数据开放、收集、使用背后的立法故事、公民故事、技术故事、商业故事娓娓道来,引人入胜,令我大开眼界。
我在想,大数据概念对于教育来说会产生什么样的实用价值呢?一直以来,*教育在研究教育的数字化,比如数字化校园,这个思路就是把我们教育的内容进行数字化,其结果指向的就是电子教材的研发或者是教学过程的数字化。美其名曰,这是教育技术的重要内涵。在教学过程中,学生的行为表现都可以被数据化,而这项研究不是任何一个专业可以深入下去的,它的'专业性太强,所以我才会想到,所谓教育技术与其研究教育的数字化,不如研究教育的数据化来得实在,来的有意义。长期以来,我们并不了解教育对一个人的影响具体会如何表现,我们有的只是一个轮廓,我们也并不确定一个教师的行为对学生具体产生了哪些影响。所以,人们对教育一直有一个深深的质疑,它是不是科学的?大数据概念至少提出了关注“是什么”比“为什么”要有实际意义得多。而我们的教育恰好需要把注意力从“为什么”转移到“是什么”上面来,只有如此,才能把教育从为什么发展成“可能成为什么”上来,这会是一次思想上的革命。而对于现在地位岌岌可危的教育技术来说,把研究的重点从数字化转移到数据化上面,这才是它的出路。
如何将数据融入教学,教育者首先通过标准化全科教学处方,实现了教师授课模板和教学内容的标准化,保证每个教学过程和内容是可控的,然后结合每天的教学内容,处理好面对的数据,处理好数据,自然也就处理好了课堂的反馈,最终形成了既注重教学体验又以教学结果为导向的教学体系。
与此同时,不仅要注重课上的学生资源,在课后还要对这些资源进行跟踪处理。这与过去的教育教学显然是不同的,面对大数据时代的到来,教学有所改变是必然的。所以,无论环境怎么变换,数据如何复杂,我们都不能不去改变自己的`教学去迎合将来的这个大数据时代。
世界的本质就是数据,当你掌握了数据,你便掌控了世界—你可以轻而易举地通过数据中的相关关系预测事物的发展,将一切不利因素扼杀于摇篮之中—这远胜于"防患于未然"。
《大数据时代》一书,让我们在观念上有了三大转变:要全体不要抽样,要效率不要绝对精确,要相关不要因果。全书介绍了 "大数据"时代三种大的变革:思维变革,商业变革和管理变革。在这些巨大变革如洪水一般的"冲击"之下,现代社会的运作方式必将有重大的改变,若不顺应这种变革的潮流,就像古*固步自封,最终被坚船利炮打开国门而自己还用着长钩铁戟抗争一样,不可避免被掠夺,被落于世界进程之后,所以我们必须转变我们的思想。
"我们不再热衷于寻找因果关系,而应该寻找事物间的相关关系",我想这句话是本书的核心思想。大数据时代,信息与数据已成为了一切的本源,我们生活在各种数据构成的海洋之中,如果从另一种视角看,就好像无数条"看不见的线"将我们与这些数据联系到一起,这是我们以前从未有过、从未想过的。大数据改变了我们以前的通过因果关系了解世界的方法,而提供了几种新的途径,因为,在大数据时代,我们可以分析更多数据,有时甚至可以处理和某个特别现象相关的所有数据,也就是:样本=总体;而且,当研究数据如此之多时,我们已不热衷于"精确",而是"混乱",若不接受"混乱",那么有95%的非结构化数据无法利用,这将无法使我们构建完整的数据世界,在分析更多、更全面的数据之后,我们就可以从这些数据之中发掘它们的相关关系,即以"是什么"而不是"为什么"的角度看待数据,不用管其从何而来,只要分析其如何影响其他事物既可,即"让数据自己发声",这些,彻底推翻了人类以前探索数据的方法,展现了一个全新的世界。
这种观念以惊人的力量给现知识状况带来了巨大的冲击,通过对海量数据的分析,获得巨大价值的产品和服务,或深刻的洞见。比如谷歌公司,2009年H1N1流行之时,通过检测检索词条,处理34。5亿个不同的数据模型,通过预测并与2007、2008年的美国疾控中心记录的实际流感病例进行对比后,确定了45条检索词条组合,并将其用于一个特定的数学模型后,预测结果与官方数据相关系数高达97%,这种大数据技术,以前所未有的方式,通过海量数据分析得出流感所传播的范围,为预测流感提供了一种更快速、高效的工具。
同时,虽然大数据可为人类造福、对抗病症,但这仅限于掌握这门技术而言,若不重视这种技术,当我们的对手早于我们一步构建这种数据网络之时,便是我们的灾难,想想,大数据虽核心的在于预测,当敌人通过这种手段预测我方下一步的行动,将是可怕的—比如你的导弹将从何处发射,将飞往哪,你的军队动向、目标,总之所有一切"未来"将掌控于敌手,敌方甚至可以借此发现那些将来有"大作为"的人,从而进行渗透或扼杀,这对我们的发展无疑是致命的,所以,尽快加速大数据系统的构建进程是必须的。
对于我们国防生,也必须顺应这种发展趋势,未来的时代必将是数据极易获取,数据网络共享化的时代,通过这些数据,建立数据模型,可以准确分析并给出适合每一个人的计划,如运动量、训练强度,可以"先知、先觉",及时发现一个人的负面情绪前及时疏导,这些必将成为现实,我们必须跟进时代,做好准备,去应对大数据时代的一切!
去年的“云计算”炒得热火朝天的,今年的“大数据”又突袭而来。仿佛一夜间,各厂商都纷纷改旗换帜,推起“大数据”来了。于是乎,各企业的CIO也将热度纷纷转向关注“大数据”来了。有一张来自《程序员》微博的漫画很形象。我觉得这张图,很真实地反映了现实中小企业云计算,大数据的现状。
不过话又还得说回来,《大数据时代》是本好书。
当然,很多IT知名人士也大力推荐,写了好多读后感来表述对这本书的喜欢没看此书之前,对所谓大数据的概念基本上是一头雾水,虽则有了解关注过现在也比较火热的BI,觉得也差不多,可能就是更多的数据,更细致的数据分析与数据挖掘。看过此书后,感觉到之前的想法,只能算是中了一小半吧———巨量的数据,而另一前:着眼于数据关联性,而非数据精确性,或许才是大数据与现时BI的不同,不仅仅是方法,更多的时思想方法。不过坦白讲,到底是数据的关联性重佳,还是数据的精确性更好,还真的需要时间来检验一下,至少从现在的数据分析方法来论,更多的倾向于数据的精确性。
看完此书,我心中的一些问题:
1、什么是大数据?
查了查百度百科,是这样定义的:大数据(bigdata),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的.的资讯。大数据的4V特点:Volume、Velocity、Variety、Veracity这个好像是IBM的定义吧。
以个人的观点来看:数据海量,存储海量都是大数据的基本原型吧。
2、大数据适合什么样的企业?
诚然,大数据的前提是海量的数据,只有拥有巨量的数据资源,方能从中查找出数据的关联性,才可以让通过专业化的处理,让其为企业产生价值。针对电信运营,互联网应用这样海量用户的数据的大企业,也是在应用大数据的道路上拥有得天独厚的条件,但是针对中小企业呢?销售订单数据?若非百年老店,估计数据也是少得可怜,能用的可能只有消费者数据了吧。貌似大多数厂商,用来举例的也就是消费都购买行为分析为最多。
同样,在公共事业类的*机构,大数据的作用也许也能很好的发挥。反而感觉在大多数中小型企业应用大数据,似乎有点大题小作。书中说:大数据是企业竞争力。诚然,数据是一个企业的核心无形资源(利用得好的话),但是否所有的数据,或都换则方式说:所有的企业都以大数据为竞争力,是否真的合适么?是否在中小企业中,会显示得小题大做呢?
3、大数据带来的影响
当一波又一波的IT技术热潮源源不断地向我们铺面而来的时候,你甚至都没有做好准备,你都要开始迎接它所给你带来的影响了。经过物联网,云计算的推波助澜下,大数据开始登场了。但它到底给我们带来了什么呢?
1)预测未来书中以Google成功预测了未来可能发生流感的案例来开篇,表明通过大数据的应用,可以为我们的生活起一个保驾护航的指向标。实质很简单,技术改变世界。
2)变革商业大数据所带来的商机,同时会衍生出一系列与大数据相关的商业机遇与商业模式,数据的潜在价值会源源不断地发挥作用可以容易想到的是未来有专门的数据收集,数据分析,数据生成的一条数据产业链产生。影响的,当然是IT公司
3)变革思维书中所说:因为有海量的数据作基础,未来,我们可能更关注数据的相关,而非精细度。对这条,本人还是持保留意见的。
读完《大数据时代》这本书后,我意识到:我们即将或正在迎接由书面到电子的跳跃之后的又一重大变革。
这本书介绍了大数据时代来临后,接踵而至的三项变革——商业变革、管理变革和思维变革。
其实,这场变革已经打响。商业领域由于大数据时代的到来而推陈出新。前几年,一家名为Farecast的公司,让预订到更优惠的机票价格不再是梦想。公司利用航班售票的数据来预测未来机票价格的走势。现在,使用这种工具的乘客,*均每张机票可以省大约50美元,这就是大数据给人们带来的便利。
大家应该都知道2009年出现的H1N1型流感,就拿美国为例,疾控中心每周只进行一次数据统计,而病人一般都是难以忍受病痛的折磨才会去医院就诊,因此也导致了信息的滞后。然而,对于飞速传播的疾病,Google公司却能及时地作出判断,确定流感爆发的地点,这便是基于庞大的数据资源,可见大数据时代对公共卫生也产生了重大的影响!
在我看来,如果想在在大数据时代里畅游,不仅要学会分析,而且还要能够大胆地决断。
在美国,每到七、八月份时,正是台风肆虐之时,防涝用品也摆上了商品货架。沃尔玛公司注意到,每到这时,一种蛋挞的销售量较其他月份明显增加。于是,商家作了大胆的`推测,出现这样的结果源于两种物品的相关性,便将这种蛋挞摆在了防涝用品的旁边。这样的举措大大增加了利润,这就是属于世界头号零售商的大数据头脑!
大数据时代的到来,可以让我们的生活更加便利。但是,如果让大数据主宰一切,也存在一定的风险。
大家应该都知道电子地图,它可以为人们指引方向。但大家应该还不知道,它会默默地积累人们的行程数据,通过智能分析可以推断出哪里是自己的家,哪里是工作单位。我们的隐私就这样被不为人知地收集着。
大数据时代的到来,让我们的生活更安全,更方便,但与此同时,我们的隐私不再是隐私,数据的收集变得无所不包、无孔不入。世界已经向大数据时代迈进了一小步,一个崭新的时代正向我们走来。让我们用知识武装大脑,做好准备,迎接新时代的到来!
去年的“云计算”炒得热火朝天的,今年的“大数据”又突袭而来。仿佛一夜间,各厂商都纷纷改旗换帜,推起“大数据”来了。于是乎,各企业的CIO也将热度纷纷转向关注“大数据”来了。有一张来自《程序员》微博的漫画很形象。我觉得这张图,很真实地反映了现实中小企业云计算,大数据的现状。
不过话又还得说回来,《大数据时代》是本好书。
当然,很多IT知名人士也大力推荐,写了好多读后感来表述对这本书的喜欢没看此书之前,对所谓大数据的概念基本上是一头雾水,虽则有了解关注过现在也比较火热的BI,觉得也差不多,可能就是更多的数据,更细致的数据分析与数据挖掘。看过此书后,感觉到之前的想法,只能算是中了一小半吧---巨量的数据,而另一前:着眼于数据关联性,而非数据精确性,或许才是大数据与现时BI的不同,不仅仅是方法,更多的时思想方法。不过坦白讲,到底是数据的关联性重佳,还是数据的精确性更好,还真的需要时间来检验一下,至少从现在的数据分析方法来论,更多的倾向于数据的精确性。
看完此书,我心中的一些问题:
1、什么是大数据?
查了查百度百科,是这样定义的:大数据(bigdata),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。大数据的4V特点:Volume、Velocity、Variety、Veracity这个好像是IBM的定义吧。
以个人的观点来看:数据海量,存储海量都是大数据的基本原型吧。
2、大数据适合什么样的企业?
诚然,大数据的前提是海量的数据,只有拥有巨量的数据资源,方能从中查找出数据的关联性,才可以让通过专业化的处理,让其为企业产生价值。针对电信运营,互联网应用这样海量用户的数据的大企业,也是在应用大数据的道路上拥有得天独厚的条件,但是针对中小企业呢?销售订单数据?若非百年老店,估计数据也是少得可怜,能用的可能只有消费者数据了吧。貌似大多数厂商,用来举例的也就是消费都购买行为分析为最多。
同样,在公共事业类的*机构,大数据的作用也许也能很好的发挥。反而感觉在大多数中小型企业应用大数据,似乎有点大题小作。书中说:大数据是企业竞争力。诚然,数据是一个企业的核心无形资源(利用得好的话),但是否所有的数据,或都换则方式说:所有的企业都以大数据为竞争力,是否真的合适么?是否在中小企业中,会显示得小题大做呢?
3、大数据带来的影响
当一波又一波的IT技术热潮源源不断地向我们铺面而来的时候,你甚至都没有做好准备,你都要开始迎接它所给你带来的影响了。经过物联网,云计算的推波助澜下,大数据开始登场了。但它到底给我们带来了什么呢?
1)预测未来书中以Google成功预测了未来可能发生流感的案例来开篇,表明通过大数据的应用,可以为我们的生活起一个保驾护航的指向标。实质很简单,技术改变世界。
2)变革商业大数据所带来的商机,同时会衍生出一系列与大数据相关的商业机遇与商业模式,数据的潜在价值会源源不断地发挥作用可以容易想到的是未来有专门的数据收集,数据分析,数据生成的一条数据产业链产生。影响的,当然是IT公司
3)变革思维书中所说:因为有海量的数据作基础,未来,我们可能更关注数据的相关,而非精细度。对这条,本人还是持保留意见的。
书中虽只是阐述了大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型,并未提及会对我们教育教学产生什么影响,但在这样的大环境之中,我们同样可以获得启示,寻求大数据在教育工作中可实现的价值。
1、教师角度:从基于经验到基于数据的教学转型
“经验主义”是指形而上学的思想方法和工作作风,其特点是在观察和处理问题的时候,从狭隘的个人经验出发,不是采用联系、发展、全面的观点,而是采取鼓励、精致、片面的观点。在教学中,我们有时会凭借以往经验认定本节课学生的起点,从而制定教学目标、重难点以及教学过程。这往往忽略了上届学生和这届学生是有差异的,这班学生和另一班学生也是存在差异的,那如何准确把握学生的起点呢?我想可以借助前测数据,它可以为有效教学指明了方向。
如教学“复式统计表”时,前期查找资料的时候就发现早在一年级上册P96的时候学生就见过复式统计表,意让学生初步认识统计表,渗透统计思想。而二三年级的书中练*也多有涉及,就是这种复式统计表没有“表头”,生活中的复式统计表也很多。既然在以前练*时碰到这么多次复式统计表,学生对复式统计表到底认识多少呢?我们对157名学生进行这样的调查(如下图),第1题:像上表这样的统计表以前见过吗?见过约占65%,没见过约占35%,学生在练*中碰到过、生活中也经常看见,但还是约35%的学生回答自己没见过,说明学生*时在看这个复式统计表的时候就浮于表面,所以这节课我们重点应该让学生经历复式统计表的产生过程,加深学生对复式统计表的印象。第2题:上表中的16表示什么意思?能完整表达出二班身高在130~139厘米的学生有16人,约占41%;表达一半,如二班16人,或130~139厘米16人,约占22%,其他约占37%,真正能正确读懂复式统计表的学生一半不到,需要在课中进行读图方法的指导。而知道这个表叫做复式统计表的学生不到20%。
基于这样的前测数据,我们将原先的教学设计进行修改,制定出符合这样学情的教学目标、教学重难点和教学流程,以实现“以生为本”的课堂。同样练*课和复*课,也可以借助本班学生的错题数据,准备适合这个班学生情况的教学设计。
2、学生角度:建立数据分析观念
未来肯定是“大数据时代”,那我们的学生作为未来的主人,在小学时应该掌握什么样能力呢?我想数据分析观念必不可少,2011年修订的《义务教育数学课程标准》(以下简称《课标》)把过去核心词里的“统计观念”,改成“数据分析观念”,就是希望身为老师的我们知道,数据分析是很重要的,并且希望教学能够构建适当的背景,让学生感受到数据分析是很重要的。那到底要让学生掌握数据分析观念的什么知识呢?
史宁中教授的《大数据与小学数学教育》这篇文章就阐述很清楚,他在文章中提到,结合大数据的主题,回想在“数据分析观念”中提到的三件事情是非常重要的。
第一件事情,感悟数据中蕴含的信息。要让孩子们知道,所有的道理不一定都是老师教的,不一定都是父母说的,也不一定是书本上说的,有一些信息,有一些道理是通过数据知道的。这个叫做数学的“实事求是”。有些东西是要经过思考的,根据什么来思考呢?根据事实思考,然后得出自己的结论。这样,孩子就可能会想问题,就可能会发现问题,提出问题,分析问题,解决问题。
第二件事情,知道数据中的信息可以用不同的办法获取。数据中的信息不像纯数学那样,只能靠一个办法得到。世界上绝对真理是不存在的,很多事情是相对的,相对的意思就是同样的数据,用不同的方法分析会得到不同的结论。因此它取决于这个人的判断准则,取决于他的价值观。什么样的办法好呢?大家讨论叫做民主,或者是最符合背景的方法就是一个好办法。这个是判断准则,也可以自己定。这个事情得从小开始重视,应该让孩子们知道,有些标准是老师定的,但是有些标准你也可以定。
第三件事情,感悟数据是随机的。可能这次取得的数据是这样的,下一次取得的数据是那样的。虽然是随机的,但是只要你取得相当多的数据之后,就能发现其中的规律性。
以上是读了这本书之后又找了一些相关文章阅读后,一些凌乱、零碎的想法,有些想法还得细细思考如何落实到自己的实际教学中,*期也一直在整理《基于作业中错题数据改进数学练*课的教学研究》的课题成果,通过对班级学生作业中错题数据的统计分析,从而发现其中典型错误、易错题等等,帮助教师确定练*课的重难点,就不会像书里的练*板块那样流水账式地复*,以此更有效地针对班级学情设计练*课教学,提高了练*课的效率;另一方面,也可以利用这些数据,知道各层次学生的错误点,分析原因,从而设计出针对不同层次学生的作业练*,让不同的学生能在作业中得到不同的发展,避免学生一直重复做已经掌握的题。
世界的本质就是数据,当你掌握了数据,你便掌控了世界—你可以轻而易举地通过数据中的相关关系预测事物的发展,将一切不利因素扼杀于摇篮之中—这远胜于"防患于未然"。
《大数据时代》一书,让我们在观念上有了三大转变:要全体不要抽样,要效率不要绝对精确,要相关不要因果。全书介绍了"大数据"时代三种大的变革:思维变革,商业变革和管理变革。在这些巨大变革如洪水一般的"冲击"之下,现代社会的运作方式必将有重大的改变,若不顺应这种变革的潮流,就像古*固步自封,最终被坚船利炮打开国门而自己还用着长钩铁戟抗争一样,不可避免被掠夺,被落于世界进程之后,所以我们必须转变我们的思想。
"我们不再热衷于寻找因果关系,而应该寻找事物间的相关关系",我想这句话是本书的核心思想。大数据时代,信息与数据已成为了一切的本源,我们生活在各种数据构成的海洋之中,如果从另一种视角看,就好像无数条"看不见的线"将我们与这些数据联系到一起,这是我们以前从未有过、从未想过的。大数据改变了我们以前的通过因果关系了解世界的方法,而提供了几种新的途径,因为,在大数据时代,我们可以分析更多数据,有时甚至可以处理和某个特别现象相关的所有数据,也就是:样本=总体;而且,当研究数据如此之多时,我们已不热衷于"精确",而是"混乱",若不接受"混乱",那么有95%的非结构化数据无法利用,这将无法使我们构建完整的数据世界,在分析更多、更全面的数据之后,我们就可以从这些数据之中发掘它们的相关关系,即以"是什么"而不是"为什么"的角度看待数据,不用管其从何而来,只要分析其如何影响其他事物既可,即"让数据自己发声",这些,彻底推翻了人类以前探索数据的方法,展现了一个全新的世界。
这种观念以惊人的力量给现知识状况带来了巨大的冲击,通过对海量数据的分析,获得巨大价值的产品和服务,或深刻的洞见。比如谷歌公司,2009年流感流行之时,通过检测检索词条,处理34.5亿个不同的数据模型,通过预测并与2007、2008年的美国疾控中心记录的实际流感病例进行对比后,确定了45条检索词条组合,并将其用于一个特定的数学模型后,预测结果与官方数据相关系数高达97%,这种大数据技术,以前所未有的方式,通过海量数据分析得出流感所传播的范围,为预测流感提供了一种更快速、高效的工具。
同时,虽然大数据可为人类造福、对抗病症,但这仅限于掌握这门技术而言,若不重视这种技术,当我们的对手早于我们一步构建这种数据网络之时,便是我们的灾难,想想,大数据虽核心的在于预测,当敌人通过这种手段预测我方下一步的行动,将是可怕的—比如你的导弹将从何处发射,将飞往哪,你的军队动向、目标,总之所有一切"未来"将掌控于敌手,敌方甚至可以借此发现那些将来有"大作为"的人,从而进行渗透或扼杀,这对我们的发展无疑是致命的,所以,尽快加速大数据系统的构建进程是必须的。
对于我们国防生,也必须顺应这种发展趋势,未来的时代必将是数据极易获取,数据网络共享化的时代,通过这些数据,建立数据模型,可以准确分析并给出适合每一个人的计划,如运动量、训练强度,可以"先知、先觉",及时发现一个人的负面情绪前及时疏导,这些必将成为现实,我们必须跟进时代,做好准备,去应对大数据时代的一切!
《大数据时代》是英国维克托·迈尔-舍恩伯格教授的著作,这本书也被尊为国外大数据研究的先河之作。这本书最大的优点就在于作者利用上百个例子来对大数据的方方面面做了详细解说,让外行也很容易理解。结构上,作者通过大数据时代的思维变革、商业变革和管理变革三个角度依次阐述,条理清晰。
所谓"大数据",按作者的说法,就是"所有数据"。随着计算机运算速度和存储能力的发展,收集数据变得越来越简单,储存数据的成本越来越低。在过去,由于技术限制,人们做统计时只能收集有限的数据做样本,其中要考虑随机样本的选择,努力减小因样本问题出现的误差;统计结果往往不能重复使用,造成数据利用率低。而现在则可以做到"样本=总体"。数据的增多带来不可避免的精确性问题。 "小数据"时代,一个样本的错误就可以造成对总体估计的失败,幸运的是,"大数据"时代对精确性不再那么要求苛刻——也无法要求太严格——数据的数量足以弥补这一缺陷。在对思维变革这一部分的阐述中,最重要也是全书的核心观点就是大数据时代,我们应该从追求"因果关系"的旧思维方式向追求"相关关系"转变。 在我看来,这实际上是通过大数据来透视一种事物的发展趋势,而很多精确学科领域依然需要探寻"因果关系"解决更有针对性的问题,所以,这局限了这一转变只能在特定的领域发生。作者自己也说,"大数据的相关性将人们指向了比探讨因果关系更有前景的领域。"
大数据时代的数据获取方式是多种多样,数据形式也是千变万化,任何文字、行为、万物都可以被数据化后用来分析。对这些数据的利用,不仅要考虑到其初次使用价值,更要放眼它未来可能的用途以提高数据的利用率。当然数据并不是无限使用,时效、环境的变化肯定会对数据提出新的要求,所以数据的折旧也是应当考虑的。这又引出了对数据这一无形资产的估值可能性。对于Facebook, Twitter这样的公司来说,数据就是他们的核心,如何在资产负债表上给他们一个公正的体现正是我们需要考虑的。
大数据时代的价值链由三部分构成,我把它们简化为"生产—分析—使用"三个环节,这对应书中的三种类型公司: 第一种是基于数据本身的公司,第二种是基于技能,第三种则是基于思维。在大数据早期,技能和思维最有价值,但作者认为,最终,大部分的价值还是必须从数据本身来挖掘。这是假定了一个成熟的市场,人人都了解了大数据的用途。
对于普通人来说,大数据时代最关心的还是隐私问题。不知不觉中,个人的一举一动都暴露在*甚至私人企业之下,还面临潜在的泄露风险。对此,作者提出了使用者承担责任的解决办法,而不是过去那种流于形式的使用授权。大数据甚至能预测一个人的犯罪动机,这给监管者带来的难题是,预测一个人要犯罪,惩罚还是不惩罚?在这点上,社会达成"个人仅需对行为而非动机负责"的共识非常重要。
大数据时代的风险控制靠的是"算法师",类似会计师一样的职业,对大数据的准确度或有效性进行鉴定。这能在一定程度上防止数据滥用的发生和数据独裁。当今的法律亦需对大数据监管进行修订补充。
当代大数据发展主要由科技公司推动,相信在不久的将来更多的传统领域会意识到大数据的重要性。但我们也应该保持清醒,大数据并不是万能药,对某些领域或环节,使用大数据是一种简单且实用的选择;但对某些领域,盲目使用大数据只会适得其反。
信息时代的到来,我们感受到的是技术变化日新月异,随之而来的是生活方式的转变我们这样评论着的信息时代已经变为曾经。如今,大数据时代成为炙手可热的话题。笔者在这说明信息和数据,只是试图首先说明信息、数据的关系和不同,也试图说明,为什么信息时代转变为了大数据时代?大数据时代带给了我们什么?
信息和数据的定义。*解释:信息,又称资讯,是一个高度概括抽象概念,是一个发展中的动态范畴,是进行互相交换的内容和名称,信息的界定没有统一的定义,但是信息具备客观、动态、传递、共享、经济等特性却是大家的共识。数据:或称资料,指描述事物的符号记录,是可定义为意义的实体,它涉及到事物的存在形式。它是关于事件之一组离散且客观的事实描述,是构成信息和知识的原始材料。数据可分为模拟数据和数字数据两大类。数据指计算机加工的“原料”,如图形、声音、文字、数、字符和符号等。从定义看来,数据是原始的处女地,需要耕耘。信息则是已经处理过的可以传播的资讯。信息时代依赖于数据的爆发,只是当数据爆发到无法驾驭的状态,大数据时代应运而生。这是否是《大数据时代》一书所未曾阐述的背景材料?
在《大数据时代》一书中,大数据时代与小数据时代的区别:
1、思维惯例。大数据时代区别与转变就是,放弃对因果关系的渴求,而取而代之关注相关关系。也就是说只要知道“是什么”,而不需要知道“为什么”。作者语言绝对,却反思其本质区别。数据的更多、更杂,导致应用主意只能尽量观察,而不是倾其所有进行推理?这也是明智之举。
2、使用用途。小数据停留在说明过去,大数据用驱动过去来预测未来。笔者认为数据的用途意在何为,与数据本身无关,而与数据的解读者有关,而相关关系更有利于预测未来。
3、结构。大数据更多的体现在海量非结构化数据本身与处理方法的整合。大数据更像是理论与现实齐头并进,理论来创立处理非结构化数据的方法,处理结果与未来进行验证。
4、分析基础。大数据是在互联网背景下数据从量变到质变的过程。笔者认为,小数据时代也即是信息时代,是大数据时代的前提,大数据时代是升华和进化,本质是相辅相成,而并非相离互斥。
数据未来的故事。数据的发展,给我们带来什么预期和启示?银行业天然有大数据的潜质。客户数据、交易数据、管理数据等海量数据不断增长,海量机遇和挑战也随之而来,适应变革,适者生存。我们可以有更广阔的业务发展空间、可以有更精准的决策判断能力、可以有更优秀的经营管理能力可以这些都基于数据的收集、整理、驾驭、分析能力,基于脱颖而出的创新思维和执行。因此,建设“数据仓库”,培养“数据思维”,养成“数据治理”,创造“数据融合”,实现“数据应用”才能拥抱“大数据”时代,从数据中攫取价值,笑看风云变换,稳健赢取未来。
我主要读了第一部分和第三部分。
第一部分是大数据的思维变革,作者舍恩伯格提出了三个观点,一是"不是随机样本,而是全体数据",二是"不是精确性,而是混杂性",三是"不是因果关系,而是相关关系",作者被誉为"大数据时代的预言家",抛出的观点是掷地有声的,下面我将谈谈我对这三点的理解。
对于一,我们必须承认我们以往做的处理抽样数据得到结果的方法,是省时省力省钱的,而且判断结果是相对高精准的,如人口普查这一案例,如果采用全体数据进行统计分析的话,工作难度是相当大的,最后的结果也不会很满意,这是得不偿失的。但是随着数据处理技术的飞速发展,我们已经具备了处理大量数据的能力,如果在数据分析过程中采用全体数据,就能避免抽样数据可能由于选取偏见带来的非随机性,处理全体数据也必将成为一种趋势。用在国防生管理工作中,就是管理层要对每个个体都给予充分的关心与互动,对于优秀的固然要偏爱,但是对于较差的也要保持"不抛弃不放弃"的态度,让每一个个体都找到自己的定位与价值。
对于二,作者强调通过掌握更多的数据,暂时牺牲精确性,关注更多容易被忽略的细节,来做更多的事,得到更多的结果,也就是说我们要有一定的包容错误的能力。我们在收集数据时,要主动获取更多的数据,少加一些限制性条件,然后应用我们处理大数据的能力,或许会获得意想不到的结果。作者举了一个谷歌翻译系统的例子,通过英语作为中转,进行各语言之间的转换。此处的启发就是用我们最擅长的途径,不拘泥于特定规则,来达到我们的目的,也就是说我们要先认清自己,不去刻意的模仿,找出最适合自己的一套方法。
对于三,作者指出知道"是什么"就够了,没必要知道"为什么",乍一看这个观点觉得有点无脑,但是结合第二点就合理了,降低对精确性及原因结果的要求,通过对相关数据的广泛分析,进而得到更丰富更多元的结果。如购物时,系统的购物推荐,并不是肯定你会购买,仅仅是你感兴趣进而可能会买就足够了。其实作者对"相关关系"的强调,主要是大数据强大的预测能力,而且这种预测性能还是相当精确的。以上只是我用作者的观点佐证他自己的观点,证明其一定的合理性,但是我是不完全认同的,在航天领域,我们对成功率的要求是极高的,尤其是载人航天领域,我们必须做到万无一失,我们对每一个结果都会深究其根,找出原因。对于国防生体能成绩的分析也是如此,结果只是我们的一个评价机制,而最重要的还是产生这一结果的原因及过程。
第三部分是大数据的管理变革,本来以为作者会讲点如何通过大数据来改革管理机制和提高管理效率,没想到作者只是讲了大数据其实就是我们的隐私的暴露,提出了要让数据采集管理公司对数据的使用负起责任的解决途径。个人感觉,一是我们在*时要意识到个人隐私的保护,而是相关法律政策的完善,真正的让大数据服务我们的工作生活,而不是一种变相的威胁。
这本书比我预想的可读性强多了……
深入简出,以简明扼要的概括性观点和国外各种著名的事例解释,让外行人一眼明白大数据时代是什么,做什么,对未来生活有何益处,有何副作用。
首先改变我的认知的是,大数据的特点不是大,而是全。一改传统的抽样数据属性(因为以前的计算机无法存储运算收集这么庞大的数据),用整体的数据形成了一个更宏观的上帝视角,进而发现更多意想不到的结论。
其二是分析的思路由因果关系发展到关联关系。因果关系容易理解,因为人们去医院检查出了感染病所以要对这个人隔离治疗,对周围的人隔离检查,这个地域可能是重要爆发点。然而关联关系则是更加意想不到,比如谷歌公司利用人们的搜索关键字预测出感染病的爆发,这便不是因果,不是搜索了流感就一定患了病,这只是有关联,只有当拿到全面的数据,关联性才能形成一个结论。
应该说,大数据的时代会带来新一波思想的冲击,不再是按部就班地推导式逻辑,而是由现象直接得出结论的跳跃式思维,以海量数据的比对和验证显示出的新的关联。
大数据时代的分析与预测会达到前所未有的准确和预见性,会让人们更容易得出最优解,选择不再变得那么纠结,广告更知道给什么人投,新闻更知道哪一类人爱看哪一个,地块更知道是需要住宅还是办公,区域更知道是适合作为经济现代化的中心还是环境优美宜居的景区。
然而,大数据时代带来的问题也令人细思极恐。
其一,最直观的就是隐私泄密问题。信息时代的今天,几乎没有人是脱离网络通信生存的。而我们的无数信息也无时无刻不在沿着网络线传输到看不见的地方。这是十分可怕的,因为你搜索到每个关键词,点击的每个页面、看过的每个图片甚至和别人交谈的每一句话都暴露在开发者眼中。这些信息被记录下来,联系起来就可以勾勒出一个完整的个人档案,可能比你自己填写的还要准确。如果只是作为记录还好,如果被别人,比如说你家附*的小偷利用这分析哪家有钱又经常不在家比较好偷…
其二,大数据分析通过分析人们的喜好选择,得出人们最偏爱的选项,对人们选择产生影响……如此其实会产生一层问题,人们会知道他们想知道的而还有很多他们应该知道的被过滤掉了。人们会越来越分裂越来越偏执以自我为中心。也就是说过度的迎合市场不见得会一直长盛不衰。
其三也是最最可怕的,和电影里动漫里的幻想那样,利用大数据对人是否有犯罪动机进行评判与预测…那么对数据预测的即将犯罪的人我们应不应该逮捕呢?说逮捕,其并未造成犯罪事实,说不逮捕,可能就无法阻止一场惨剧……
大数据带来冲击带来革命也带不安……但是就像法律上有律师来填补漏洞或者说为人们辩护,也许未来真的会有算法师成为大数据时代中新一代维护秩序的职业。
辩证地,准备迎接更加普及化的大数据时代吧。
我们已经在大数据里生活了好多年,而最*观看了《大数据时代》带给了我的是更多的思考。随着互联网的快速发展,特别是*年来,随着社交网络,物联网,云计算和各种传感器的广泛应用,具有大量,多样性和强时效性的非结构化数据不断涌现。数据存储和分析技术的重要性难以实时处理大量非结构化信息。大数据的概念应运而生。如何获取,汇总和分析大数据已成为广泛关注的热门问题。
对于普通企业而言,大数据的作用主要体现在两个方面,即数据的分析和使用以及二次开发项目。通过分析信息的大数据,不仅可以挖掘隐藏数据,还可以通过这些隐藏的消息,通过销售实体,增强其客户来源。至于数据的二次开发,它用于网络服务项目。通过总结和分析这些信息,我们可以开发出满足客户需求的个性化解决方案,并创造一种新的广告和营销方式。
同时作为一名人力资源工作者,我也在想人力资源管理因为大数据而获得价值提升的可能,但也有可能在大数据的海洋中迷失方向。伴随着业务发展要求及劳动力的变迁,人力资源管理从最初行政事务性的人事管理,到聚焦资源使用效率的人力资源管理,再到目前追求有竞争力投资回报的人力资本管理,管理内容不断丰富,管理模式不断创新,其价值也不断得到提升。
过去,人力资源管理没有太多数据的支撑,决策常常依靠直觉、经验和个人偏好。大数据时代的来临,让人力资本用数量的方式来进行投资分析和管理成为可能。但未来的挑战不是数据缺乏,而是如何有效地选取和利用数据,而不会在数据的海洋中迷失了方向。
2012年,麦肯锡提出了“大数据时代”的说法,用最通俗的说法来说,就是这个世界的各行各业,将会出现海量信息,即“信息爆炸时代”。而这些信息,都是由各种数据组成,通过收集、整理、分析、研究这些数据,就能找到对自己有利的方法。夸张一点说,掌握了大数据,就掌握了未来。时代的步伐进入了2019年,许多企业都在谈“大数据时代”,都在研究如何与时俱进,将“大数据”与数据分析融入到企业管理中去,为自己带来创新性的优势。归根到底,大数据时代下企业人力资源管理的创新,还是通过数据化信息的动态收集和梳理,对企业人力资源的不同模块进行分析,从而达到全面提升人力资源管理水*的目的。
书中虽只是阐述了大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型,并未提及会对我们教育教学产生什么影响,但在这样的大环境之中,我们同样可以获得启示,寻求大数据在教育工作中可实现的价值。
1、教师角度:从基于经验到基于数据的教学转型
“经验主义”是指形而上学的思想方法和工作作风,其特点是在观察和处理问题的时候,从狭隘的个人经验出发,不是采用联系、发展、全面的观点,而是采取鼓励、精致、片面的观点。在教学中,我们有时会凭借以往经验认定本节课学生的起点,从而制定教学目标、重难点以及教学过程。这往往忽略了上届学生和这届学生是有差异的,这班学生和另一班学生也是存在差异的,那如何准确把握学生的起点呢?我想可以借助前测数据,它可以为有效教学指明了方向。
如教学“复式统计表”时,前期查找资料的时候就发现早在一年级上册P96的时候学生就见过复式统计表,意让学生初步认识统计表,渗透统计思想。而二三年级的书中练*也多有涉及,就是这种复式统计表没有“表头”,生活中的复式统计表也很多。既然在以前练*时碰到这么多次复式统计表,学生对复式统计表到底认识多少呢?我们对157名学生进行这样的调查,第1题:像上表这样的统计表以前见过吗?见过约占65%,没见过约占35%,学生在练*中碰到过、生活中也经常看见,但还是约35%的学生回答自己没见过,说明学生*时在看这个复式统计表的时候就浮于表面,所以这节课我们重点应该让学生经历复式统计表的产生过程,加深学生对复式统计表的印象。第2题:上表中的16表示什么意思?能完整表达出二班身高在130~139厘米的学生有16人,约占41%;表达一半,如二班16人,或130~139厘米16人,约占22%,其他约占37%,真正能正确读懂复式统计表的学生一半不到,需要在课中进行读图方法的指导。而知道这个表叫做复式统计表的学生不到20%。
基于这样的前测数据,我们将原先的教学设计进行修改,制定出符合这样学情的教学目标、教学重难点和教学流程,以实现“以生为本”的课堂。同样练*课和复*课,也可以借助本班学生的错题数据,准备适合这个班学生情况的教学设计。
2、学生角度:建立数据分析观念
未来肯定是“大数据时代”,那我们的`学生作为未来的主人,在小学时应该掌握什么样能力呢?我想数据分析观念必不可少,2011年修订的《义务教育数学课程标准》(以下简称《课标》)把过去核心词里的“统计观念”,改成“数据分析观念”,就是希望身为老师的我们知道,数据分析是很重要的,并且希望教学能够构建适当的背景,让学生感受到数据分析是很重要的。那到底要让学生掌握数据分析观念的什么知识呢?
读完《大数据时代》这本书后,我意识到:我们即将或正在迎接由书面到电子的跳跃之后的又一重大变革。
这本书介绍了大数据时代来临后,接踵而至的三项变革——商业变革、管理变革和思维变革。
其实,这场变革已经打响。商业领域由于大数据时代的到来而推陈出新。前几年,一家名为Farecast的公司,让预订到更优惠的机票价格不再是梦想。公司利用航班售票的数据来预测未来机票价格的走势。现在,使用这种工具的乘客,*均每张机票可以省大约50美元,这就是大数据给人们带来的便利。
大家应该都知道20xx年出现的h1n*型流感,就拿美国为例,疾控中心每周只进行一次数据统计,而病人一般都是难以忍受病痛的折磨才会去医院就诊,因此也导致了信息的滞后。然而,对于飞速传播的疾病,Google公司却能及时地作出判断,确定流感爆发的地点,这便是基于庞大的数据资源,可见大数据时代对公共卫生也产生了重大的影响!
在我看来,如果想在在大数据时代里畅游,不仅要学会分析,而且还要能够大胆地决断。
在美国,每到七、八月份时,正是台风肆虐之时,防涝用品也摆上了商品货架。沃尔玛公司注意到,每到这时,一种蛋挞的销售量较其他月份明显增加。于是,商家作了大胆的推测,出现这样的结果源于两种物品的相关性,便将这种蛋挞摆在了防涝用品的旁边。这样的举措大大增加了利润,这就是属于世界头号零售商的大数据头脑!
大数据时代的到来,可以让我们的生活更加便利。但是,如果让大数据主宰一切,也存在一定的风险。
大家应该都知道电子地图,它可以为人们指引方向。但大家应该还不知道,它会默默地积累人们的行程数据,通过智能分析可以推断出哪里是自己的家,哪里是工作单位。我们的隐私就这样被不为人知地收集着。
大数据时代的到来,让我们的生活更安全,更方便,但与此同时,我们的隐私不再是隐私,数据的收集变得无所不包、无孔不入。世界已经向大数据时代迈进了一小步,一个崭新的时代正向我们走来。让我们用知识武装大脑,做好准备,迎接新时代的到来!
在看《大数据》之前,我只知道社会越来越数字化了,看完之后,才觉悟到:人类将迎来一个新的时代。
数字化已经把我们带入一个信息时代,大数据却把我们卷进了一场科技风暴之中,这本书中,作者为我们开启了一个更包容更广阔的新时代,大数据把社会的方方面面融合在了一起,曾经看似因果联系紧密的事物,可能变得不再那么重要;毫无关联的事物,可能隐藏着重要的信息,从科技、商业,到医疗、政治、教育、文化,大数据一概*卷囊括,它改变着我们的传统思维,为这个时代注入了新鲜的血液,就像作者书中所说:“这项技术终将改变我们所居住的星球上的许多东西。”
大数据最显著的影响是对于电子商务,通过大数据,最先洞察出潜在市场的,也必然最先占领市场。而电子商务对实业的冲击又是势不可挡,可见,掌握了大数据就主导了市场,拥有了先进的科技才能拥有坚实的竞争力。在医疗方面,曾经的非典时期,就是一个很好的例证,正是有大数据的预测功能,才使疫情得到了控制。在更小的方面,他也同样改变着我们的生活,书中提到美国著名计算机专家奥伦 · 埃齐奥尼发明了飞机机票价格预测软件,就是利用大数据造福我们生活的很好例子。
大数据不仅节省了时间,提高了效率,更将人类带入一个新的文明阶段。从分析因果总结经验,转变为搜集数据预测未来;由原来的滞后性变为现在的预见性——大大提高了人类认识世界、改造世界的能力,变被动为主动。大数据为我们掀开了历史新纪元,不敢想象它将会为我们带来什么,或许会出现新奇的生活方式,从未有过的职业,闻所未闻的商业模式,百家争鸣的文化高峰;也或许会解开更多未解之谜,探索到宇宙之外的秘密。总之,毫无疑问的是,大数据为我们带来的未来是超乎想象的。
这本书中作者提到最多的是:改变我们的`传统思维,摒弃精确性转向宏观。从总结因果转向预测。这个世界正以惊人的速度向前发展,数据大爆炸的波及范围远超乎我们的想象,单纯靠人类的主观判断力是多么的有限,大数据早晚会取而代之这一现象,这必将影响我们的生活和工作,我们也只有认清这种趋势,改变思维,调整步伐,紧跟时代才行。即使不能与时代同步,也尽量做到避免固步自封,认识大数据、利用大数据趋利避害,为我们的生活造福!
《大数据时代》是由盛扬燕、周涛翻译的英国维克托·迈尔——舍恩伯格、肯尼思·库克耶的一部力作。作者维克托·迈尔——舍恩伯格,被誉为“大数据时代的预言家”;译者周涛,是我国大数据和网络科学领域的青年领军人物。强强联合、中西合璧,使这部中译本自20xx年1月与英文原版同步面世以来,即获好评如潮。至20xx年10月,在短短不到三年时间里,已加印到第18版,足见其阅读面之广、影响力之深。
《大数据时代》,是我目前最喜欢的一本书。它点燃了我的“纸质阅读”热情,引导我从以休闲、娱乐为主的片断阅读转向了与工作需要相统一的深度阅读。我是比较爱读书的,但自从去年手机启用了上网功能后,我对网上阅读也由最初的好奇逐步发展为*惯,坐着看手机、躺着看手机,甚至上厕所都拿着手机。但在这样的阅读中,思维仿佛禁锢在了手机屏幕的方寸之间,怠于思考。久而久之,思考能力怕是会退化,甚至只是生活在自己的网络空间里,与现实脱节。对此,我感到警醒和焦虑,一直想从这样的阅读*惯中摆脱出来,尽管期间也读了几本书,但被动阅读成分居多,直到我读到《大数据时代》。这一次,我只用一个周末两、三天的时间就读完了这本书,阅读速度堪比早年读《哈里·波特》。这样的手不释卷,这样的阅读速度,让我对自己又有了信心,我还是可以阅读纸质书的。《大数据时代》字里行间洋溢的时代气息深深地感染了我,令我发自内心地渴望了解时事,理解国家、企业面临的形势任务。于是,捧读起《*油气产业发展分析与展望报告蓝皮书》、《*国情报告》,也同样兴趣盎然。这一刻,我感到我的阅读兴趣与我的工作需要统一起来了,这是我*年来一直在努力探索和追求的。《大数据时代》,让我的生活充满阅读快乐。
喜欢《大数据时代》,偶然中有必然。本书语言生动,内容丰富,可读性强。特别是上百个与现实生活密切相关、基于大数据应用的鲜活案例,发人深醒。比如,书中所举的排查纽约可能发生爆炸的沙井盖(下水道检修口)案例,就非常有代表性。纽约每年会发生多起沙井盖爆炸,爆炸能使重达300磅的沙井盖冲上几层楼的高度,非常危险。为纽约提供电力支持的联合爱迪生电力公司每年都会对沙井盖进行常规检查和维修,但因沙井盖量大,仅在纽约最小的行政区曼哈顿就有大约51000个沙井盖和服务设施,难以及时发现爆炸隐患并排除。哥伦比亚大学的统计学家鲁丁和她的同事,从大数据角度切入,通过对一些历史数据的研究,预测出可能会出现问题并且需要维修的沙井盖,既利于及时发现并排除隐患,又有效降低了检修成本。由此我联想到,我们大庆油田经过50多年的开发建设,水网、电网、油气网密布。即使没有大的事故发生,也容易出现“跑、冒、滴、漏”的情况。随着岁月的增长,这样那样的问题会更加令人疲于应对。特别是随着燃气入户,天然气管网遍布身边,一旦发生事故,直接关系到居民的生命财产安全,影响人心稳定,影响社会稳定。若能从大数据角度系统考虑这些安全问题,配套完善技术装备和手段,及时收集数据、整理数据,让数据说话,倾听数据声音,排查事故隐患,必能事半功倍。否则,就会像爱迪生电力公司初期“撞大运”式的抽检沙井盖那般,即使全员日夜不停地努力工作,也难以有效解决问题。
《大数据时代》提出的观点,同样令我眼界大开。本书前瞻性地指出,大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型,并用三个部分讲述了大数据时代的思维变革、商业变革和管理变革。以大数据时代的思维变革为例,本书明确提出“让数据‘发声’”、“允许不精确”、“知道‘是什么’就够了”等观点,非常有冲击性。尤其是“知道‘是什么’就够了,没必要知道‘为什么’”的观点,与我们的传统认知和行为*惯相去甚远。但仔细想来,却非常适用、实用、管用。在这个越来越讲究效率、越来越讲究速度的时代,若是对任何事情,都执着于探索现象背后的原因,也就是必须在知道为什么的基础上开展下一步工作,难免会降低工作效率,甚至会错失良机。就像上文提到的排查纽约可能发生爆炸的沙井盖案例,若鲁尔和她的同事纠结于探索因果关系,总是试图揭示“为什么”,怕是其有生之年都不能完成该项任务。也许,作者本身并非不重视“为什么”,只是用这样的阐释方式,引起人们对“是什么”的重视。突然想起孔夫子那句颇受争议的“民可使由之,不可使知之”,想来以孔子之“仁”,一定没有小看“民”的意思,他所关注和强调的也只是效率。跨越20xx多年,东西方文化在此相互碰撞、相互佐证,令人叹为观止。
去年召开的党的十八届五中全会,从国家战略层面,做出了实施大数据战略的部署和要求。善用大数据、融入新时代,是我们提高企业竞争力的重要手段,也是我们贯彻落实中央精神的重要体现。真诚希望更多人阅读《大数据时代》,在尽享阅读快乐的同时,关注大数据、开发大数据、应用大数据,充分释放数据效能,加快成功脚步,实现人生精彩,为企业发展、国家富强、民族振兴做出更大的贡献。
这两年,大数据,云计算的思想就像小苹果的音乐一样,传的到处都是,每一个公司不管是互联网公司还是传统企业,都标榜自己的大数据。
1、实体物联网与虚拟物联网
曾几何时,物联网的概念闹得风生水起,庞大的物联网能够让世间大量的物体,都能够被检测 并联网,包括了人、车、房等一切能够被联网的物体,这些物体都能够以种方式被感知他的存在,并对其信息记录在案,以供使用。在若干年前,这还是一种看似遥不可及的事物,要对每个物体都贴上一个所谓的RFID的标签,显得不切实际。如今,随着手机的大量使用,人类本身也被加入了物联网中。为什么要物联网?是为了获取什么?要知道物联网获取了什么,只需要看看在一个物体在没有加入物联网与加入物联网之后,我们多出了哪些东西便能够知晓。那么,很明显,我们需要通过某种方式来获取该物体的信息,这种存储下来的信息,就叫做——数据。
物联网产生的数据是实体的物品之间的信息,而现在的互联网上,占最大数据量的,是虚拟物品,或者叫做网络虚拟物品。由于网络物体是直接寄生于网络,具有能够方便的接入网络的特征,因此,在获取实体物体信息还有一定难度的时期,占有很大优势。但今后实体的物联网产生的数据量一定会不断增加,或许,能够超越网络上的物物相连数据量。
网络的广泛使用,使得信息的产生于传遍变得容易,每个接入网络的人都以一定的角色存在,都是网络的信息的创造者。对于所产生的信息而言,每个接入网络的人又身兼多角,对于网络服务商,他是网络使用者的角色;对于门户网站而言,他是使用的用户;对于社交网站而言,我们则扮演一个虚拟或者真实的网络角色;对于浏览器而言,他是一系列的浏览网页、一些列鼠标动作的角色… 不同的角色取决于对方需要从我们的行为中获取哪些信息。将网络上各种角色看成是虚拟的物体,那么,这种虚拟物体构成的虚拟物联网便产生了巨大的数据量。经历过一直以来缺乏信息获取渠道的日子,现在,既然信息获取变得如此容易,那么,必然迎来信息量暴增的时代——大数据时代。
2、思维的转变
技术的改变,使得我们思维方式也要随之发生变化。在过去的小数据时代,由于获取信息、存储信息、整理信息都是费时费力的活,我们只能精打细算,捉摸着如何以最小的代价、最快的方式来收集尽可能准确的信息。之所以会有抽样统计的方式,是受技术所限,无法获得全体的样本,或者就算获取了也无法在合理的时间内进行处理。由于信息获取代价大,使得我们不得不在获取信息前,就把一切都想清楚,才能够着手处理。这就像在计算机出现的初期,使用纸袋来编码的时期,一次出错的代价太大,所以人们不得不在输入前将代码验证过无数遍之后才敢输入到机器中。而现代计算机让编码的效率大大提升,这才使得人们能够创造出更加强大的软件。人们不需要在着手编码前就对代码过分深思熟虑,因为机器会帮助你解决一些问题。因此,那些担心由于获取数据太方便,进行数据处理、分析代价太小而使人们变得懒惰或者做事欠考虑的家伙,真是杞人忧天。历史上,技术的进步都会提升人类的生产力,但却没有让人们变得懒惰,因为与此同时,欲望也随之增长。人类只会变得更伟大。
因此,大数据时代,这个数据更加全面的时代,我们可以涉足一些之前由于缺乏数据而无法涉及的领域,例如——预测。这是一个令人兴奋的领域,但其实这个领域早有苗头,而且大家都是受益者。我们*时使用的输入法中的智能联想功能,能够根据我们之前输入的文字,来预测我们接下来有可能输入的文字,以节省我们的输入时间。这种算法里,没有人工智能,而只有人们大量的输入*惯的统计,通过大量数据的统计来预测,是一个统计学的方式而非加入了特有的规则或者逻辑。这便引出了在大数据时代,对于信息处理的一种重要方式,基于统计,得出不同个体的相关关系,却无需了解其因果关系,而我们则受益于相关关系。这种方式,看似有些投机取巧,却能够在关键时刻令我们处于优势地位。我们已经*惯了先知道某些事物的因果逻辑,继而推断出相应的结果。但世间总会有一些令人无法用合理的逻辑进行解释的现象,若通过大数据分析,我们能够跳过逻辑阶段直接享用某些一些结果(沃尔玛的啤酒加尿布案例),岂不乐哉。当然,严密的逻辑永远是值得尊敬的。
3、互联网的黏性
在经历过了从广度上通过新花样来吸引用户的时代,由于技术的提高,一个创业者在一个新的领域开辟的东西很容易被其他人所复制。在这个时候,深度很重要。特别是购物网站、微薄、门户网站这类信息量大的网站,越是了解一个用户,优势就越大。所以,在技术已经不是最重要的因素的时代,如何增加用户的黏性、忠诚度便是首要的。通过用户之前的信息,来推测用户的喜好,给用户推荐相应的信息或物品。当你越了解一个用户,而别人却不了解时,这个用户就越离不开你。微薄中有他的`智能排序功能、新闻门户中有“今日头条”应用,各类购物网站有他的推荐算法(但这个纯粹为了增加消费而非增加用户黏性),都能够根据用户之前的浏览、偏好来给出相应的推荐。这些的基础,都是拥有用户的行为记录,否则,都无从谈起。
各行各业,都在疯狂的抓紧时机,获取数据,拥有足量的数据,那一切就变得皆有可能。
*两周用业余时间读了《大数据时代》这本书,是听培训时杜威老师推荐的,我快速阅读了一遍,觉得受到了一些启发,发现了一些原来没有想到看到的事情。
首先是大数据代表着数据的样本=全体,这是一个与传统统计学的显著区别。大数据有能力获得全体数据并对其进行分析。
第二就是相关性与因果性同样重要。相关性说明了什么事情与什么什么事情有关系,如商场周围车流量的增多与商场销售额的相关性,因果性说明什么是什么的原因,如睡10个小时是有精神的原因。在大数据中,相关性要比因果性容易获得,而且相关性已经能为客户带来较大的收益。
第三就是大数据允许存在不精确性、混杂性,由于数据量巨大,存在少量的异变不会对结果产生任何影响,如收益是1个亿与1亿零1元的差别可能决策者不关心。
第四是大数据中的三个主要因素,思维、数据、技术,思维觉得你在哪些地方使用大数据。在这三个因素之中,会产生数据中间商,来处理加工数据并出售。
世界的本质就是数据,当你掌握了数据,你便掌控了世界—你可以轻而易举地通过数据中的相关关系预测事物的发展,将一切不利因素扼杀于摇篮之中—这远胜于"防患于未然"。
《大数据时代》一书,让我们在观念上有了三大转变:要全体不要抽样,要效率不要绝对精确,要相关不要因果。全书介绍了"大数据"时代三种大的变革:思维变革,商业变革和管理变革。在这些巨大变革如洪水一般的"冲击"之下,现代社会的运作方式必将有重大的改变,若不顺应这种变革的潮流,就像古*固步自封,最终被坚船利炮打开国门而自己还用着长钩铁戟抗争一样,不可避免被掠夺,被落于世界进程之后,所以我们必须转变我们的思想。
"我们不再热衷于寻找因果关系,而应该寻找事物间的相关关系",我想这句话是本书的核心思想。大数据时代,信息与数据已成为了一切的本源,我们生活在各种数据构成的海洋之中,如果从另一种视角看,就好像无数条"看不见的线"将我们与这些数据联系到一起,这是我们以前从未有过、从未想过的。大数据改变了我们以前的通过因果关系了解世界的方法,而提供了几种新的途径,因为,在大数据时代,我们可以分析更多数据,有时甚至可以处理和某个特别现象相关的所有数据,也就是:样本=总体;而且,当研究数据如此之多时,我们已不热衷于"精确",而是"混乱",若不接受"混乱",那么有95%的非结构化数据无法利用,这将无法使我们构建完整的数据世界,在分析更多、更全面的数据之后,我们就可以从这些数据之中发掘它们的相关关系,即以"是什么"而不是"为什么"的角度看待数据,不用管其从何而来,只要分析其如何影响其他事物既可,即"让数据自己发声",这些,彻底推翻了人类以前探索数据的方法,展现了一个全新的世界。
这种观念以惊人的力量给现知识状况带来了巨大的冲击,通过对海量数据的分析,获得巨大价值的产品和服务,或深刻的洞见。比如谷歌公司,2009年流感流行之时,通过检测检索词条,处理34.5亿个不同的数据模型,通过预测并与2007、2008年的美国疾控中心记录的实际流感病例进行对比后,确定了45条检索词条组合,并将其用于一个特定的数学模型后,预测结果与官方数据相关系数高达97%,这种大数据技术,以前所未有的方式,通过海量数据分析得出流感所传播的范围,为预测流感提供了一种更快速、高效的工具。
同时,虽然大数据可为人类造福、对抗病症,但这仅限于掌握这门技术而言,若不重视这种技术,当我们的对手早于我们一步构建这种数据网络之时,便是我们的灾难,想想,大数据虽核心的在于预测,当敌人通过这种手段预测我方下一步的行动,将是可怕的—比如你的导弹将从何处发射,将飞往哪,你的军队动向、目标,总之所有一切"未来"将掌控于敌手,敌方甚至可以借此发现那些将来有"大作为"的人,从而进行渗透或扼杀,这对我们的发展无疑是致命的,所以,尽快加速大数据系统的构建进程是必须的。
对于我们国防生,也必须顺应这种发展趋势,未来的时代必将是数据极易获取,数据网络共享化的时代,通过这些数据,建立数据模型,可以准确分析并给出适合每一个人的计划,如运动量、训练强度,可以"先知、先觉",及时发现一个人的负面情绪前及时疏导,这些必将成为现实,我们必须跟进时代,做好准备,去应对大数据时代的一切!
这本书里主要介绍的是大数据在现代商业运作上的应用,以及它对现代商业运作的影响。
《大数据时代》这本书的结构框架遵从了学术性书籍的普遍方式。也既,从现象入手,继而通过对现象的解剖提出对这一现象的解释。然后在通过解释在对未来进行预测,并对未来可能出现的问题提出自己看法与对策。
下面来重点介绍《大数据时代》这本书的主要内容。
《大数据时代》开篇就讲了Google通过人们在搜索引擎上搜索关键字留下的数据提前成功的预测了美国的H1N1的爆发地与传播方向以及可能的潜在患者的事情。Google的预测比*提前将*一个月,相比之下*只能够在流感爆发一两个周之后才可以弄到相关的数据。同时Google的预测与*数据的相关性高达97%,这也就意味着Google预测数据的置信区间为3%,这个数字远远小于传统统计学上的常规置信区间5%!而这个数字就是大数据时代预测结果的相对准确性与事件的可预测性的最好证明!通过这一事以及其他的案例,维克托提出了在大数据时代“样本=总体”的思想。我们都知道当样本无限趋*于总体的时候,通过计算得到的描述性数据将无限的趋*于事件本身的性质。而之前采取的“样本<总体”的做法很大程度上无法做到更进一步的描述事物,因为之前的时代数据的获取与存储处理本身有很大的难度只导致人们采取抽样的方式来测量事物。而互联网终端与计算机的出现使数据的获取、存储与处理难度大大降低,因而相对准确性更高的“样本=总体”的测算方式将成为大数据时代的主流,同时大数据时代本身也是建立在大批量数据的存储与处理的基础之上的。
接下来,维克多又通过了IBM追求高精确性的电脑翻译计划的失败与Google只是将所有出现过的相应的文字语句扫描并储存在词库中,所以无论需要翻译什么,只要有联系Google词库就会出现翻译,虽然有的时候的翻译很无厘头,但是大多数时候还是正确的,所以Google的电脑翻译的计划的成功,表明大数据时代对准确性的追求并不是特别明显,但是相反大数据时代是建立在大数据的基础住上的,所以大数据时代追求的是全方位覆盖的数字测度而不管其准确性到底有多高,因为大量的数据会湮埋少数有问题的数据所带来的影响。同时大量的数据也会无限的逼*事物的原貌。
之后,维克托又预测了一个在大数据时代催生的重要职业——数据科学家,这是一群数学家、统计学与编程家的综合体,这一群人将能够从获取的数据中得到任何他们想要的结果。换言之,只要数据充足我们的一切外在的与内在的我们不想让他人知道的东西都见会在这一群家伙的面前展现得淋漓尽致。所以为了避免个人隐私在大数据时代被这一群人利用,维克托建议将这一群人分为两部分,一部分使用数据为商业部门服务,而另一群人则负责审查这一些人是否合法的获得与应用数据,是否侵犯了个人隐私。
无论如何,大数据时代将会到来,不管我们接受还是不接受!
我觉得《大数据时代》这本书写的很好,很值得一读。因为会给我们很多启发,比如你在相关的社交网站发表的言论或者照片都很有可能被“数据科学家”们利用,从而再将相关数据卖给各大网店。不过,事实就是我们将会成为被预测被引诱的对象。所以说,小心你在网上留下的痕迹。
我喜欢这本书是因为它给我展现了一个新的世界。
《大数据时代》是英国维克托·迈尔-舍恩伯格教授的著作,这本书也被尊为国外大数据研究的先河之作。这本书最大的优点就在于作者利用上百个例子来对大数据的方方面面做了详细解说,让外行也很容易理解。结构上,作者通过大数据时代的思维变革、商业变革和管理变革三个角度依次阐述,条理清晰。
所谓"大数据",按作者的说法,就是"所有数据"。随着计算机运算速度和存储能力的发展,收集数据变得越来越简单,储存数据的成本越来越低。在过去,由于技术限制,人们做统计时只能收集有限的数据做样本,其中要考虑随机样本的选择,努力减小因样本问题出现的误差;统计结果往往不能重复使用,造成数据利用率低。而现在则可以做到"样本=总体"。数据的增多带来不可避免的精确性问题。 "小数据"时代,一个样本的错误就可以造成对总体估计的失败,幸运的是,"大数据"时代对精确性不再那么要求苛刻——也无法要求太严格——数据的数量足以弥补这一缺陷。在对思维变革这一部分的阐述中,最重要也是全书的核心观点就是大数据时代,我们应该从追求"因果关系"的旧思维方式向追求"相关关系"转变。 在我看来,这实际上是通过大数据来透视一种事物的发展趋势,而很多精确学科领域依然需要探寻"因果关系"解决更有针对性的问题,所以,这局限了这一转变只能在特定的领域发生。作者自己也说,"大数据的相关性将人们指向了比探讨因果关系更有前景的领域。"
大数据时代的数据获取方式是多种多样,数据形式也是千变万化,任何文字、行为、万物都可以被数据化后用来分析。对这些数据的利用,不仅要考虑到其初次使用价值,更要放眼它未来可能的用途以提高数据的利用率。当然数据并不是无限使用,时效、环境的变化肯定会对数据提出新的要求,所以数据的折旧也是应当考虑的。这又引出了对数据这一无形资产的估值可能性。对于Facebook, Twitter这样的公司来说,数据就是他们的核心,如何在资产负债表上给他们一个公正的体现正是我们需要考虑的。
大数据时代的价值链由三部分构成,我把它们简化为"生产—分析—使用"三个环节,这对应书中的三种类型公司: 第一种是基于数据本身的公司,第二种是基于技能,第三种则是基于思维。在大数据早期,技能和思维最有价值,但作者认为,最终,大部分的价值还是必须从数据本身来挖掘。这是假定了一个成熟的市场,人人都了解了大数据的用途。
对于普通人来说,大数据时代最关心的还是隐私问题。不知不觉中,个人的一举一动都暴露在*甚至私人企业之下,还面临潜在的泄露风险。对此,作者提出了使用者承担责任的解决办法,而不是过去那种流于形式的使用授权。大数据甚至能预测一个人的犯罪动机,这给监管者带来的难题是,预测一个人要犯罪,惩罚还是不惩罚?在这点上,社会达成"个人仅需对行为而非动机负责"的共识非常重要。
大数据时代的风险控制靠的是"算法师",类似会计师一样的职业,对大数据的准确度或有效性进行鉴定。这能在一定程度上防止数据滥用的发生和数据独裁。当今的法律亦需对大数据监管进行修订补充。
当代大数据发展主要由科技公司推动,相信在不久的将来更多的传统领域会意识到大数据的重要性。但我们也应该保持清醒,大数据并不是万能药,对某些领域或环节,使用大数据是一种简单且实用的选择;但对某些领域,盲目使用大数据只会适得其反。
我主要读了第一部分和第三部分。
第一部分是大数据的思维变革,作者舍恩伯格提出了三个观点,一是"不是随机样本,而是全体数据",二是"不是精确性,而是混杂性",三是"不是因果关系,而是相关关系",作者被誉为"大数据时代的预言家",抛出的观点是掷地有声的,下面我将谈谈我对这三点的理解。
对于一,我们必须承认我们以往做的处理抽样数据得到结果的方法,是省时省力省钱的,而且判断结果是相对高精准的,如人口普查这一案例,如果采用全体数据进行统计分析的话,工作难度是相当大的,最后的结果也不会很满意,这是得不偿失的。但是随着数据处理技术的飞速发展,我们已经具备了处理大量数据的能力,如果在数据分析过程中采用全体数据,就能避免抽样数据可能由于选取偏见带来的非随机性,处理全体数据也必将成为一种趋势。用在国防生管理工作中,就是管理层要对每个个体都给予充分的关心与互动,对于优秀的固然要偏爱,但是对于较差的也要保持"不抛弃不放弃"的态度,让每一个个体都找到自己的定位与价值。
对于二,作者强调通过掌握更多的数据,暂时牺牲精确性,关注更多容易被忽略的细节,来做更多的事,得到更多的结果,也就是说我们要有一定的包容错误的能力。我们在收集数据时,要主动获取更多的数据,少加一些限制性条件,然后应用我们处理大数据的能力,或许会获得意想不到的结果。作者举了一个谷歌翻译系统的例子,通过英语作为中转,进行各语言之间的转换。此处的启发就是用我们最擅长的途径,不拘泥于特定规则,来达到我们的目的,也就是说我们要先认清自己,不去刻意的模仿,找出最适合自己的一套方法。
对于三,作者指出知道"是什么"就够了,没必要知道"为什么",乍一看这个观点觉得有点无脑,但是结合第二点就合理了,降低对精确性及原因结果的要求,通过对相关数据的广泛分析,进而得到更丰富更多元的结果。如购物时,系统的购物推荐,并不是肯定你会购买,仅仅是你感兴趣进而可能会买就足够了。其实作者对"相关关系"的强调,主要是大数据强大的预测能力,而且这种预测性能还是相当精确的。以上只是我用作者的观点佐证他自己的观点,证明其一定的合理性,但是我是不完全认同的,在航天领域,我们对成功率的要求是极高的,尤其是载人航天领域,我们必须做到万无一失,我们对每一个结果都会深究其根,找出原因。对于国防生体能成绩的分析也是如此,结果只是我们的一个评价机制,而最重要的还是产生这一结果的原因及过程。
第三部分是大数据的管理变革,本来以为作者会讲点如何通过大数据来改革管理机制和提高管理效率,没想到作者只是讲了大数据其实就是我们的隐私的暴露,提出了要让数据采集管理公司对数据的使用负起责任的解决途径。个人感觉,一是我们在*时要意识到个人隐私的保护,而是相关法律政策的完善,真正的让大数据服务我们的工作生活,而不是一种变相的威胁。
《大数据时代》,作者是被誉为“大数据时代的预言家”维克托.迈尔-舍恩伯教授和肯尼思.库克耶。此书是在大数据方兴未艾、众说纷纭的时刻,进一步阐述和厘清大数据的基本概念和特点。
人类历史长河中,即使是在现代社会日新月异的发展中,人们还主要依赖抽样数据、局部数据和片面数据,甚至在无法获得实证数据的时候纯粹依赖经验、理论、假设和价值观去发现未知领域的规律。因此,人们对世界的认识往往是表面的、肤浅的、简单的、扭曲的或者是无知的。维克托指出,大数据时代的来临使人类第一次有机会和条件,在非常多的领域和非常深入的层次获得和使用全面数据、完整数据和系统数据,深入探索现实世界的规律,获取过去不可能获取的知识,得到过去无法企及的商机。
本书从思维变革、商业变革及管理变革三部分阐述大数据时代已经来临;列举了众多在公共卫生、商业服务领域大数据变革的例子。比如:在思维变革部分,以UPS与汽车修理预测为例,证明知道“是什么”就够了,没必要知道“为什么”;在大数据时代,我们不必非得知道现象背后的原因,而是要让大数据自己“发声”:UPS国际快递公司从2000年就开始使用预测性分析来检测自己全美60000辆车规模的车队,这样就能及时的进行防御性的修理。之前UPS每两三年就会对车辆的零件进行定时更换,但这种方法不太有效,因为有的零件并没有什么毛病就被换掉了。通过检测车辆的各个部位,UPS如今只需要更换需要更换的零件,从而节省了好几百万美元,这就是通过找出新种类数据之间的相互联系来解决日常需要。这种方式完成可以应用于我们石油石化行业,我们的大量生产装置及设备,在建立日常的关键部位检测机制基础上,形成大量的数据信息,通过对这些数据的科学分析,判断出需要检修或更换的零件,从而有效降低运营成本。
当我们一旦“不再追求精确度,不再追求因果关系,而是承认混杂性,探索相关关系”,“思维转变过来,数据就能巧妙的用来激发新产品和新型服务”。数据正成为巨大的经济资产,成为新世纪的矿产与石油,将带来全新的创业方向、商业模式和投资机会。
*年来,伴随着经济社会快速发展、深度调整,石油石化产业变革加剧,面临的四大革命中其中一项就是“数字革命”。因此我们必须牢牢把握数字革命发展大势,加强数据治理和大数据分析应用,提高企业生产运行与管理水*,拥抱大数据时代的来临。
这么多年来,看了很多东西,如今回过头来发现,好像什么都忘了,真是悲剧,所谓读书破万卷,下笔如有神或许是不对的,还是需要下笔勤快,所以决定从这里开始。
这些年对于技术的发展,我是没有跟上,如今发现即便是对于投资,技术对于我们生活的改变太大,而自己身在这个技术浪潮的前沿,还是需要跟上步伐。——前言
大数据这个概念已经提了很久,我也一直疏忽了对于它的理解。看完《大数据时代》,再结合如果工作上对于大数据的理解,顿时发现数据的重要性,以前在这方面的确没有足够的思想意识。整本书来说,我觉得最关键的三个点是前面几个章节:
1、要总体,不要随机样本:从小对于统计学相关的学*,基本都是从样本出发,理论的基础在于如何随机的足够分散的选取样本,这可是技术活加直觉。而对于大数据来说,要的就是总体,本质上来说,总体样本的确更能准确找到结果。但是对于统计来说,总体的分析增加了数据分析的难度,不仅数据核对不好进行,一旦出现数据污染,准确度就会大打折扣,而且进行数据回溯的时候,也无法准确确认问题,而这一点也是后面相关性上问题;
2、要混乱,而不是精确:这里主要想说明的是希望数据的多样性,尽量将相关数据都收集起来,不管是结构化的还是非结构化的。这样就不可避免的最终结果的不准确性。大数据更多的是从一个总体数据中说明以后概率事件,既然是概率,也就可以理解无法精确。这里有个点的说明,我觉得需要提一下,大数据算法更倾向于“简单”,而不是复杂,这个倒是出乎我的意外。
3、要相关性,而不是因果:从我对于知识获取的过程来说,我是不同意这个观点,从人体对于知识的理解,还是要从因果论出发,没有因果论,就会变成瞎子。而作者的观点上来说,原因可能还是从大数据本身的非准确性,一旦找到合适的算法,找到相关性,向上追述原因本身就很难。但是从举的示例上看,相关性的确认是一个非常大的工程,基本就是使用排举法,一个一个试。
所以,对于大数据来说,最重要的三点是:1、数据——得到更多数据;2、算法——建立更快的算法体系;3、思维——寻找数据间更多的相关性。
对于数据最终的走向,我同意书中所提到的*管理的观点,既然都是以“石油”的标准来看待数据,*统一管理也就是必然的了。而且对于*来说,掌握更多数据也有利于其管理及维护社会的稳定性。而对于社会道德方面的论述,我不想多说什么,时代发展是不会被道德绑架的。
所以最后,想要建立对于大数据的思维,《大数据时代》还是值得一读,里面的很多示例也非常不错。如人际关系这一块,也是出乎我的意料。
无处不在的大数据:各种云计算,谷歌的神通,亚马逊的推送,天涯人肉,微博万能等等,我们掌握了新的工具,也获取了以前从未有过的各种信息。大数据拉*了我们与现实的距离,“地球村”变成了“地球屋”,仿佛所有人所有事物都触手可及,而这些牛逼哄哄的互联网巨头就在客厅展示着世界的每一寸光景。
作者站在理论的至高点上,阐述了大数据对人类的工作、生活、思维带来的革新,大数据时代的三种典型的商业模式,以及大数据时代对于个人隐私保护、公共安全提出的挑战。作者认为大数据时代具有三个显著特点。
一、人们研究与分析某个现象时,将使用全部数据而非抽样数据;
二、在大数据时代,不能一味地追求数据的精确性,而要适应数据的多样性、丰富性、甚至要接受错误的数据。
据数联寻英发布《大数据人才报告》显示,目前全国的大数据人才仅46万,未来3-5年内大数据人才的缺口将高达150万。
据职业社交*台LinkedIn发布的《2016年*互联网最热职位人才报告》显示,研发工程师、产品经理、人力资源、市场营销、运营和数据分析是当下*互联网行业需求最旺盛的六类人才职位。其中研发工程师需求量最大,而数据分析人才最为稀缺。领英报告表明,数据分析人才的供给指数最低,仅为0.05,属于高度稀缺。数据分析人才跳槽速度也最快,*均跳槽速度为19.8个月。
根据*商业联合会数据分析专业委员会统计,未来*基础性数据分析人才缺口将达到1400万,而在BAT企业招聘的职位里,60%以上都在招大数据人才。
大数据主要的三大就业方向:大数据系统研发类人才、大数据应用开发类人才和大数据分析类人才。
在此三大方向中,各自的基础岗位一般为大数据系统研发工程师、大数据应用开发工程师和数据分析师。
北京数据分析*均工资:10630/月,取自15526份样本,较2016年,增长9.4%。
摘要:本文基于作者自身的学*和了解,首先简单分析了大数据时代下的常见网络信息安全问题,然后主要对如何在大数据时代下保护好网络信息的安全提出了部分探讨性建议。
关键词:大数据;网络信息安全;保护
大数据可以被看作是现代信息化技术甚至是整个社会的宏观发展趋势,它能够帮助我们挖掘、发现有价值的信息,指导我们做出科学、合理的决策,在各个行业、各个领域当中,都可以发挥出巨大的作用。但是在大数据时代下,我们还应当更加重视网络信息的安全问题,积极防范各种网络信息安全威胁,以营造更加和谐、健康、安全的大数据环境。
1、大数据时代下的常见网络信息安全问题
简单来说,大数据指的是庞大、巨量的数据集合,以及对数据的收集、分析、挖掘技术能力。大数据的出现和社会信息化的建设、发展具有直接的联系,在信息化下,社会的数据信息产生速度非常之快,产生量也非常的大,这些看似分散、细碎的数据信息,其实非常具有价值,将它们整合在一起,并进行相关的分析、挖掘,便可以提取出我们所需的信息内容。不得不说,大数据的应用对我们整个社会都带来了深刻的变革,促进了社会的进步。不过,大数据也还具有一些突出的网络信息安全问题,需要引起我们的重视和关注。
1.1数据信息盗窃的危险性增加
在大数据时代下,人人都非常看重数据信息的价值,哪怕是一点的数据信息碎片,都可能有其存在的意义,所以部分人便会产生以此牟利的念头,增加了数据信息盗窃的危险性。例如,目前我们对于云存储这样的应用已经不再陌生,其可以被看作是一个大数据的实现*台,我们可以将自己的数据信息传输到云存储*台上,用于异地下载或是共享,但是当中肯定有一些信息是需要保密的,如个人的身份信息、商业文件等。一些不法分子可能会为了获取信息出售获利,而采取不合法的技术手段,来盗窃数据信息,从而造成网络信息安全问题。除了云存储以外,我们自身电脑或存储设备当中的数据信息、社交应用当中的数据信息、向他人传输的数据信息等,也更容易被盗窃[1]。
1.2网络病毒的危险性增加
网络病毒可以对数据信息造成各种各样的危害,如盗窃、破坏、篡改等等。在大数据时代下,网络病毒的攻击破坏能力、传输能力、隐藏能力都大幅度的提高,这或多或少的受到了相关大数据技术的影响。网络病毒变得更强大了之后,显然我们网络信息安全的危险性也就大大的增加。
1.3数据管理的危险性增加
在前面的内容当中已经说到,大数据指的是庞大、巨量的数据集合,而且这个数据集合当中的数据内容始终在不断的增长,速度非常之快,类型非常之多,特别是在非线性增长的特点之下,数据管理的难度便非常之高,稍有不注意就可能出现管理方面的漏洞或缺陷,致使数据信息混乱、无用、丢失,或是容易被盗窃。
2、如何在大数据时代下保护好网络信息的安全
从目前整个社会的大数据应用发展情况来看,为了有效的保护好网络信息的安全,我们应当重点做到以下几点。
2.1提高网络信息安全的防护意识
如今,我们每个人都会使用到网络,一旦使用网络,就会产生数据信息,有些数据信息的产生甚至连我们自己都不知道,如对网页的浏览记录、对商品的查询信息等等,其中有的数据信息可能非常的敏感,需要保密,为此我们就得在使用网络的过程当中,提高自身的网络信息安全意识,如不要随意的在电脑中存储、网络中传输敏感信息,对于一些需要录入个人信息的网站要警惕起来,对于一些非常重要的数据信息,可以加密过后在存储和传输。
2.2完善相关技术
一方面,对于对大数据有需求的企业、单位等,要完善自身的大数据管理技术,对大数据的管理做到规范、有序,以便对大数据展开科学、合理的分析、利用,防止数据信息被盗窃。另一方面,不论是企业、单位还是个人,都应当在使用计算机和网络的过程当中,应用一些必要的技术手段来保护自己,如防火墙技术、入侵检测技术、认证技术、加密技术等等,消除或降低信息泄露的风险。
2.3加强对重点领域敏感数据的监管
庞大、巨量数据的汇集加大了敏感数据暴露的可能性,对大数据的无序使用也增加了要害信息泄露的危险。所以,从社会整体来看,应当明确重点领域数据库的范围,制定完善的重点领域数据库管理和安全操作制度,加强对重点领域数据库的日常监管[2]。
2.4研发针对性的大数据安全技术
传统的信息安全技术不能完全照搬到新兴的大数据领域,云计算、物联网、移动互联网等新技术的快速发展,为大数据的收集、处理和应用提出了新的安全挑战。所以,应加大对大数据安全保障关键技术研发的资金投入,提高大数据安全技术产品的水*和针对性。
2.5提升数据信息的销毁和恢复技术
为了防止数据信息被窃取,将不再需要的数据信息进行销毁是非常直接的一个办法,但是普通的删除操作很难达到彻底销毁数据信息的目的,为此需要对数据信息的销毁技术进行改进和提升,一方面要加快数据销毁速度,避免数据在销毁过程中因为不受保护而被不法分子窃取,另一方面要加强数据销毁的彻底性,将要销毁的数据彻底粉碎,避免再生。此外,还要提升数据恢复技术,在重要信息被篡改或窃取之后可以将其恢复,避免遭受更大的损失,提高数据存储的安全性[3]。
3、结束语
在大数据时代下,保护好网络信息的安全性是非常重要的,必须引起我们高度的重视和关注,除了上面提到的几点保护措施以外,我们还应当健全相关法律,用法律来约束和惩戒不法盗窃、损坏、篡改数据信息的行为,从而营造出更加和谐、健康、安全的大数据环境。
参考文献
[1]王国强.“大数据”时代背景下计算机信息保护技术分析[J].电子技术与软件工程,2017,(20):196-197.
[2]吴兴华.大数据时代我国意识形态安全风险及其防范[J].青岛科技大学学报(社会科学版),2017,(03):97-102.
[3]孙海勇,李青.大数据信息安全风险框架及应对策略研究[J].信息与电脑(理论版),2017,(05):209-210.
1我国卫生信息化发展概述
1.1卫生行业信息化建设的方向性为进一步加快我国卫生信息化整体的建设步伐,推进信息技术在全国医疗卫生领域的广泛应用,改善我国卫生防疫、公众医疗、基层卫生等状况,提高公共卫生健康水*,国家鼓励地方*建设全国联网五级数字卫生信息*台。即:建设覆盖全国“省—市—县(市、区)—乡—村”五级数字卫生体系,并通过租用营运商提供的网络,实现对全国卫生信息以及公众健康信息的收集、处理、查询、传输和共享,完成面向公众基于个人健康档案服务和远程医疗会诊。
1.2加*生信息收集整理的重要性加*生信息的收集整理是改善和提高卫生系统质量的前提条件。尽管及时可靠的卫生信息是改善公共卫生状况的基础,但是,由于各级卫生行政管理机关在数据采集、分析、发布和使用方面的投入不足等原因,常常无法实现及时的跟踪以达到完全链接和反映现实医疗卫生状况,导致决策者无法正确发现问题、了解现实需求、跟踪最新进展、评估所采取措施产生的影响,干扰了行政管理部门在卫生政策制定、项目设计以及资源分配等方面做出正确决策。所以,加*生信息收集整理对改善和提高卫生系统的服务质量就显得尤为重要。
1.3加强信息安全保障和管理的必要性安全管理是一个可持续的安全防护过程。信息安全建设是我国卫生行业信息化建设不可缺少的重要组成部分。医疗卫生信息系统承载着大量事关国家政治安全、经济安全和社会稳定的信息数据,网络与信息安全不仅关系到卫生信息化的健康发展,而且已经成为*保障体系的重要组成部分。因此,开展卫生行业信息化必须重视建立健全信息安全保障和管理体系建设。一是强化安全保密意识,高度重视信息安全,是确保卫生行业信息系统安全运行的前提条件;二是加强法制建设,建立完善规范的制度,是做好卫生行业信息安全保障工作的重要基础;三是建立信息安全组织体系,落实安全管理责任制,是做好卫生行业信息安全保障工作的关键;四是结合实际注重实效,正确处理“五级数字卫生体系”安全,是确保信息安全投资效益的最佳选择。
2卫生信息安全的风险与需求分析
随着网络社会发展程度的不断提高,网络与信息安全事件是信息化发展进程中不可避免的副产品。当今社会已进入互联网时代,信息传播的方式、广度、速度都是过去任何一个时代无法比拟的。随着网络应用的日益普及,黑客攻击成指数级增长,利用互联网传播有害信息的手段层出不穷。网络在给人们带来便利的同时,也带来不可忽视的安全风险。所以,可靠的卫生信息就需要一个安全的数据运行环境,只有这样,才能实现向卫生行政管理部门或社会提供有效的、高质量的、安全的数据保障。
2.1安全风险分析目前卫生系统所面临的风险主要包括应用系统风险和网络风险。应用系统风险主要体现在身份认证、数据的机密性、完整性、授权管理控制等,此类风险可以通过应用系统的.改造提升得到控制。网络风险主要体现在网络结构不够清晰、区域划分不合理、区域边界防护措施缺失、接入网络缺少相应的防护措施、安全管理不到位等,容易造成可用带宽损耗、网络整体布局被获得、网络设备路由错误、网络设备配置错误、网络设备被非授权访问、网络管理通信受到干扰、网络管理通信被中断、传输中的网络管理信息被修改和替换、网络管理中心受到攻击、外部单位接入风险、本地用户接入威胁、恶意代码传播和破坏风险、安全操作风险、安全管理风险等等。系统和网络出现问题,将会造成网络信息丢失和网络瘫痪,无法实现网络功能和满足服务对象的需求。
2.2网络安全需求分析保证网络相关设备安全、稳定、可靠地为业务活动提供优质服务的前提是网络要安全、设备运行要正常。为此,必须要保证网络体系结构安全,采用各种安全措施有效防止卫生网络系统遭到非法入侵、未经授权的存取或破坏可能造成的数据丢失、系统崩溃等事故发生;采用灵活的网络拓扑和冗余与备份,保证网络结构不因单点故障造成网络业务活动的中断;采用可信的网络管理手段,保证结构的完整性。网络系统遭到有意攻击、设备故障、网络管理出现漏洞等是网络安全防范的重点。
2.3边界安全需求分析清晰、规范地界定、标识网络边界,是网络边界设备和安全网关实施防护的有效措施。采用具有多层访问控制功能的防火墙对接入实施控制;使用基于网络的IDS有效侦测来自内部、外部对网络边界的攻击,严格记录网络安全事件,配备网络边界设备脆弱性评估工具,有效监控网络边界设备的配置、运行状态和负载;配置网络穿透性测试工具,定期或不定期对网络边界安全有效性进行检查。边界安全是网络安全的门户,提升网络边界安全设备管理服务功能,是保证安全策略设计、配置、部署等管理工作的有效途径。
2.4网络管理安全需求分析对于卫生网络系统而言,网络与信息的安全时常受到威胁,最常见的就是拒绝服务攻击、网页篡改、恶意程序等。为保证网络与信息的安全,需要构造科学、有效的网络安全管理*台。以业务为中心,面向卫生系统,将不同的网络进行整合,基于应用环境来管理网络及其设备的正常运行。当网络异常时,基于事先制订的策略(主要是应急方案)和网络管理系统,实现主动采取行动(如:终止、切断相关连接;停止部分非关键业务等),达到主动保证卫生系统网络安全和正常运行的目的。
3卫生信息安全的防御体系与网络的维护
3.1卫生信息安全的防御体系卫生信息安全防御体系是一个动态的过程,攻防双方都是与时俱进的。防护的目的在于阻止入侵或者延迟入侵所需要的时间,以便为检测和响应争取主动。一旦防护失效,通过检测和响应,可以及时修复漏洞,杜绝威胁,防止损失扩大,确保业务运行的持续性。从技术发展的角度来考虑,攻击和防御构成了一种动态*衡的体系。一段时间内,安全防御发挥着有效的作用,此时的安全体系就具有一定的*衡性,但这种*衡是相对稳定的,一旦攻击技术有所突破,防御也需要随之更新,安全防御体系就是在这种由此及彼的相互牵制中动态发展的。
3.2网络的维护随着信息系统在卫生行业的应用,网络安全问题日渐凸显。一旦网络出现故障,小到造成单机信息丢失、被窃取、操作系统瘫痪;大到全网网络服务中断,业务被迫停滞,甚至是重要数据丢失等一系列严重后果。在新医改大背景下,对医疗服务质量的要求越来越高,如何构建坚固的网络环境,是每一个医疗单位的责任,同时也是挑战。在网络正常运行的情况下,对网络基础设施的维护主要包括:确保网络传输的正常;掌握卫生系统主干设备的配置及配置参数变更情况,备份各个设备的配置文件。这里的设备主要是指交换机和路由器、服务器等。主要任务是:负责网络布线配线架的管理,确保配线的合理有序;掌握内部网络连接情况,以便发现问题迅速定位;掌握与外部网络的连接配置,监督网络通信情况,发现问题后与有关机构及时联系;实时监控整个卫生行业内部网络的运转和通信流量情况。
3.3信息安全风险控制策略面对复杂的大规模网络环境,无论采取多么完美的安全保护措施,信息系统的安全风险都在所难免。因此,在对信息系统进行安全风险评估的基础上,有针对性的提出其安全风险控制策略,利用相关技术及管理措施降低或化解风险,如物理安全策略、软件安全策略、管理安全策略、数据安全策略等,可以将系统安全风险控制在一个可控的范围之内。
3.4数据的保存与备份计算机系统中最重要的就是数据,数据一旦丢失,导致卫生行业的损失是巨大的。针对各类型的危机事件,应该制定完善的备份方案,防患于未然,做到数据丢失后能及时处理,减少损失带来的巨大后果。网络环境具有复杂性、多变性、脆弱性。它们共同决定着网络安全威胁的存在。在我国,卫生网络与信息逐渐扩大,加强网络安全管理和建立完善信息安全的屏障已成为网络建设中不可或缺的重要组成部分。我们应充分认识网络信息安全的重要性,在网络维护过程中加强网络信息安全,做到事前预防、事中监控、事后弥补,不断完善安全技术与安全策略,提高卫生网络信息的安全性。
【摘要】毫无疑问,大数据时代已经到来,并在社会发展、科学研究、思维模式、个人生活等方面都产生了重要而深远的影响。但是,我们在享受大数据带来的便利的同时,也面临着信息安全堪忧和个人隐私泄露的严重挑战。本文从何谓大数据出发,分析了大数据面临的信息安全与个人隐私问题,并基于此从技术和管理两方面给出了一些大数据时代信息安全与隐私保护的策略,以期为大数据安全领域的发展贡献一己之力量。
【关键词】大数据时代;信息安全;隐私保护
1、引言
大数据又被称为海量数据,它是一个十分宽泛的概念,目前业界尚无形成统一的定义,但是对于大数据的“4V”特性,还是获得业界广泛认可的。所谓大数据的“4V”特性,即指数据体量巨大(Volume)、数据类型繁多(Variety)、数据处理速度快(Velocity)和数据价值密度低(Value)。当前,大数据已渗透到社会生活的方方面面,但大数据又是一把双刃剑,其在带来巨大效益的同时,也为我们的信息安全与个人隐私带来了极大的隐患。
2、大数据面临的信息安全与个人隐私问题
2.1大数据面临的信息安全问题
大数据面临的信息安全问题主要包括以下几类:
(1)物理安全问题。整个信息系统的设备、设施安全、系统所处的场所与环境、系统的可靠运行等,都严重影响着大数据的信息安全。
(2)网络安全问题。大数据的来源与去向几乎都离不开网络系统,而网络系统面临的病毒侵袭、骇客破坏或者系统不能持续可靠的工作(网络服务突然中断)等都可能导致严重的信息安全问题,造成信息被破坏、修改或大规模泄露。
(3)应用安全问题。应用是大数据的价值之所在,应用系统的安全也深刻影响着大数据的信息安全。例如,对于应用广泛的电子商务系统,其支付功能直接涉及用户的财产安全,若支付系统被骇客挟持或被病毒感染,则极有可能给用户造成巨大的财产损失。
(4)数据安全问题。一是大数据的真实性和可信度问题,大数据的收集可能不全面、传输过程中可能存在失真、别有用心的人可能伪造数据或传播不实数据、有些非结构化数据可能不易操作等,都可能使用户的判断出现偏差,甚至造成严重的决策错误;二是大数据时代的数据体量巨大且价值高昂,更容易引起不法分子的觊觎或关于数据的不良竞争等,若不对数据进行有效的主动防护,则可能导致数据被非法访问或盗取。
(5)技术安全问题。云计算等新一代IT技术为推动社会发展提供了新动力,但也催生出区别于传统的信息安全问题。例如,租用公有云的不同用户,其应用都运行于同一云数据中心,这就模糊了传统安全体系的内外之分;对用户而言,就必须同时防范来自数据中心之外、云数据中心的其他用户甚至云服务提供商的攻击,加大了信息安全的保护困难,且一旦出现安全事故,则损失不可估量。
(6)管理安全问题。管理对大数据时代的信息安全至关重要,管理人员安全意识不强、管理制度不健全、管理权责不明晰等都会造成严重的信息安全问题。
2.2大数据面临的个人隐私问题
大数据面临的个人隐私问题主要包括以下几类:
(1)个人隐私问题越来越显著。大数据时代数据的关联性、规模性可能使看似互不相干的数据产生交集,这就为企业或别有用心的人收集用户个人信息提供了方便。通过收集、整合不同*台的个人信息,可完整地勾勒出一个人完整的生活轨迹,并在用户不知情或无法控制的情况下暴露于他人面前。这不但严重地侵犯了公民的个人隐私,还可能严重威胁到人民的生命财产安全等。
(2)企业对个人隐私态度不一。有的企业已开始着手制订涉及个人隐私的管理机制、政策规定和服务条款,而有的企业对个人隐私不够重视,甚至肆意窃取个人信息以换取自身利益。
(3)用户对个人信息控制减弱。在大数据时代,个人信息很容易被收集、挖掘,从不同*台整合出个人信息档案;且由于数字信息容易复制、能长期保存,使得个人信息很容易被广泛、长期的传播,总之用户对个人信息的控制较之传统社交环境明显减弱。
(4)用户个人隐私得不到保障。一是很多网站或APP存在强制性条款,要求用户填写大量个人信息或同意获取用户的地理位置、通话记录等,而用户对自身信息的去向与用途不知情;二是法律机制不健全,缺乏问责与监督机制等,导致个人隐私得不到保障。
3、大数据时代的信息安全与隐私保护策略
在信息安全领域,有一句基于安全事故统计得出的名言:安全问题在于“三分技术,七分管理”。同样的,大数据时代的信息安全与隐私保护,也要从技术和管理两方面着手。
3.1技术层面的保护
在技术层面,除了传统的安全技术,大数据时代的信息安全与隐私保护技术主要包括:
(1)数据失真技术。即在原始数据里加入适量“噪声”数据,让敏感数据不易被识别或者难以被攻击者还原出真实数据,由此保护用户的原始数据。
(2)数据溯源技术。即通过追踪数据的来演、重现数据的传输记录,用以帮助用户缩短辨别信息真伪的时间,确定数据运算以及检验结果是否正确等,其中使用最多的就是多位标记法。
(3)匿名发布技术。即通过匿名发布信息、有选择地发布原始数据、不发布敏感数据等方法,来躲避不法分子的攻击行为,以此来保护大数据信息安全与个人隐私。目前,这一技术还尚未成熟,需要不断地发展与完善,以提高大数据的安全性。
(4)角色挖掘技术。即通过整合、分配用户角色的方式,实现用户相关权限的科学管理,为用户提供个性化服务并监控某些用户行为,进而使大数据信息与个人隐私更安全。
(5)身份认证技术。即通过采集、分析用户的行为以及设备运行的参数等,总结用户的行为特征,并基于此对用户身份进行验证,以此尽量避免骇客盗取个人信息的'行为,进而保护信息安全和个人隐私。
(6)存储完整性审计技术。即确保重要信息(如个人隐私数据)在存入大数据服务器后,如何完整地取出且不消耗大量带宽。该技术也正在研究中,一种可行的方法就是利用群组有效用户的方法对大数据进行完整性审计,以提高重要信息安全与隐私保护的审计效率。
3.2管理层面的保护
在管理层面,实现大数据时代的信息安全与隐私保护,要从以下几方面同时发力:
(1)法律法规。一是完善现有的信息安全法律,二是制定专门的个人隐私保护法。这样不但可以为依法科学、合理地收集大数据提供依据,也能避免个人隐私泄露或数据被用作其他非法目的。
(2)行业自律。建立信息安全与隐私保护机构,引导企业合理利用隐私数据,在业内通过完善自律公约、启用第三方认证机制、加强审计监督等机制来保护大数据信息安全与个人隐私。
(3)个人素质。人们要深刻认识到大数据时代来临带来的变革,提高自己的大数据素养和安全意识,切忌随意将自己的个人身份信息等公布在网上或随意泄露给陌生人,从源头切断不法分子的隐私来源,同时也要学会运用法律手段来维护自己的隐私权。
4、结语
总之,大数据时代的到来极大地推动了整个社会的发展,但与之伴随的信息安全与个人隐私问题也不容小觑,现已引起社会各界的广泛关注。要想实现对大数据信息安全与个人隐私的保护,要从技术、管理两方面入手,不断完善大数据信息安全与隐私保护技术,同时借助法律法规、行业自律以及个人素养,在技术的发展与社会的进步中逐步得以解决。
【参考文献】
[1]邓文宏.大数据时代信息安全与隐私保护研究[J].*新通信,2017(3).
[2]拖洪华.大数据时代安全隐私保护技术探究[J].网络安全技术与应用,2016(5).
[3]林宁,张亮.大数据时代用户信息安全与隐私保护[J].信息技术,2016(3).
[4]戈悦迎.大数据时代信息安全与公民个人隐私保护——访*电子商务协会政策法律委员会副主任阿拉木斯[J].*信息界,2014(2).
书中虽只是阐述了大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型,并未提及会对我们教育教学产生什么影响,但在这样的大环境之中,我们同样可以获得启示,寻求大数据在教育工作中可实现的价值。
1、教师角度:从基于经验到基于数据的教学转型
“经验主义”是指形而上学的思想方法和工作作风,其特点是在观察和处理问题的时候,从狭隘的个人经验出发,不是采用联系、发展、全面的观点,而是采取鼓励、精致、片面的观点。在教学中,我们有时会凭借以往经验认定本节课学生的起点,从而制定教学目标、重难点以及教学过程。这往往忽略了上届学生和这届学生是有差异的,这班学生和另一班学生也是存在差异的,那如何准确把握学生的起点呢?我想可以借助前测数据,它可以为有效教学指明了方向。
如教学“复式统计表”时,前期查找资料的时候就发现早在一年级上册P96的时候学生就见过复式统计表,意让学生初步认识统计表,渗透统计思想。而二三年级的书中练*也多有涉及,就是这种复式统计表没有“表头”,生活中的复式统计表也很多。既然在以前练*时碰到这么多次复式统计表,学生对复式统计表到底认识多少呢?我们对157名学生进行这样的调查:
第1题:像上表这样的统计表以前见过吗?见过约占65%,没见过约占35%,学生在练*中碰到过、生活中也经常看见,但还是约35%的学生回答自己没见过,说明学生*时在看这个复式统计表的时候就浮于表面,所以这节课我们重点应该让学生经历复式统计表的产生过程,加深学生对复式统计表的印象。
第2题:上表中的16表示什么意思?能完整表达出二班身高在130~139厘米的学生有16人,约占41%;表达一半,如二班16人,或130~139厘米16人,约占22%,其他约占37%,真正能正确读懂复式统计表的学生一半不到,需要在课中进行读图方法的指导。而知道这个表叫做复式统计表的学生不到20%。
基于这样的前测数据,我们将原先的教学设计进行修改,制定出符合这样学情的教学目标、教学重难点和教学流程,以实现“以生为本”的课堂。同样练*课和复*课,也可以借助本班学生的错题数据,准备适合这个班学生情况的教学设计。
2、学生角度:建立数据分析观念
未来肯定是“大数据时代”,那我们的学生作为未来的主人,在小学时应该掌握什么样能力呢?我想数据分析观念必不可少,《义务教育数学课程标准》(以下简称《课标》)把过去核心词里的“统计观念”,改成“数据分析观念”,就是希望身为老师的我们知道,数据分析是很重要的,并且希望教学能够构建适当的背景,让学生感受到数据分析是很重要的。那到底要让学生掌握数据分析观念的什么知识呢?
史宁中教授的《大数据与小学数学教育》这篇文章就阐述很清楚,他在文章中提到,结合大数据的主题,回想在“数据分析观念”中提到的三件事情是非常重要的。
第一件事情,感悟数据中蕴含的信息。要让孩子们知道,所有的道理不一定都是老师教的,不一定都是父母说的,也不一定是书本上说的,有一些信息,有一些道理是通过数据知道的。这个叫做数学的“实事求是”。有些东西是要经过思考的,根据什么来思考呢?根据事实思考,然后得出自己的结论。这样,孩子就可能会想问题,就可能会发现问题,提出问题,分析问题,解决问题。
第二件事情,知道数据中的信息可以用不同的办法获取。数据中的信息不像纯数学那样,只能靠一个办法得到。世界上绝对真理是不存在的,很多事情是相对的,相对的意思就是同样的数据,用不同的方法分析会得到不同的结论。因此它取决于这个人的判断准则,取决于他的价值观。什么样的`办法好呢?大家讨论叫做民主,或者是最符合背景的方法就是一个好办法。这个是判断准则,也可以自己定。这个事情得从小开始重视,应该让孩子们知道,有些标准是老师定的,但是有些标准你也可以定。
第三件事情,感悟数据是随机的。可能这次取得的数据是这样的,下一次取得的数据是那样的。虽然是随机的,但是只要你取得相当多的数据之后,就能发现其中的规律性。
以上是读了这本书之后又找了一些相关文章阅读后,一些凌乱、零碎的想法,有些想法还得细细思考如何落实到自己的实际教学中,*期也一直在整理《基于作业中错题数据改进数学练*课的教学研究》的课题成果,通过对班级学生作业中错题数据的统计分析,从而发现其中典型错误、易错题等等,帮助教师确定练*课的重难点,就不会像书里的练*板块那样流水账式地复*,以此更有效地针对班级学情设计练*课教学,提高了练*课的效率;另一方面,也可以利用这些数据,知道各层次学生的错误点,分析原因,从而设计出针对不同层次学生的作业练*,让不同的学生能在作业中得到不同的发展,避免学生一直重复做已经掌握的题。(黄少锋)
舍恩伯格的《大数据时代》,让我重新审视了"大数据"这个在信息时代异军突起的热点词汇,作为信息安全专业的我,对大数据这个词本身有着更多的热忱。
在百度上搜索到的解释是:"大数据",或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。特点:数量、速度、品种、真实性。
而舍恩伯格认为,大数据并不能定义一个确切的概念。他提到"大数据是人们获得新的认知,创造新的价值的源泉;大数据还是改变市场、组织机构,以及*和公民关系的方法。"这是一种更具有人文色彩和社会意义的诠释。
本书中,主要从三个方面论述,即思维变革、商业变革和管理变革。而舍恩伯格更是着重阐明三大观点:
一、更多:不是随机样本,而是全体数据。
二、更杂:不是精确性,而是混杂性。
三、更好:不是因果关系,而是相关关系。
对于观点一,我不敢苟同,毕竟大数据的实现需要一定的技术支持,而显然,现在这种技术还不够成熟,同时一些简单的事情运用大数据反倒是问题更加复杂化,因此这种大叔据的繁杂处理方式更适用于一些特定的情况,比如商业预测,人类dna的研究等。
而对第二种观点,我是十分赞同舍恩伯格所说的"大数据的简单算法比小数据的简单算法有效"。在计算机行业迅速发展中,一种新的简单可行的算法的出现,远没有计算机在运算速度和存储容量的发展快,而大数据算法似乎更能迎合这种大趋势。
观点三中提到的相关关系在大数据中可是重量级的,它能较快找到事物规律和对应的解决措施,当然,也不能完全忽视因果关系,毕竟人们在思维上更能够接受因果关系分析出的结果,而大数据预测的需要人们慢慢的适应才能接受。当我们完成相关关系的分析而又不满足于只知道"是什么"的时候,我们就可以转而研究"为什么"了,毕竟问题的根本在于因果。而舍恩伯格的全体数据和相关关系是大数据时代下的一种捷径。
但是在信息时代,信息安全问题的日趋凸显,数据独裁与隐私保护之间的矛盾更是立于风口浪尖,成为众矢之的,舍恩伯格在本书的最后章节曾试图寻找一种解决方式来摆脱这一种困境,但最终没能做到,但是他提出"大数据并不是一个充斥着算法的和机器的冰冷世界,人类的作用仍无法被完全代替。"这里表明人在数据时代同样的重要,数据是为人类服务的,也就该人类驱使下完成相应的目的。
在这样的大环境下,常引起我更多的思考和担忧。
大数据时代对于我们同是机遇与挑战,一些国家已开始步入大数据时代的行列,并在各个领域开始研究和使用。而对于我国庞大的人口,以及较大的领土面积,都可以在大数据时代为我们提供数据的保障,而能否面临挑战,在大国之间的新一轮角色角逐间崭露头角,我们更需要解决技术等方面的问题,更应在政策上逐步开放各领域的数据,保证数据来源、权限等问题得到解决,不断学*先进的计算机技术,缩小与其他国家的差距。
工业化、信息化,我们都向世界交出了一份让世界不能小觑的答案;大数据时代的数据化我们又将怎样在新的风暴中所向披靡,如果大数据时代是一种必然趋势,那这就是我们这一代人的责任,是我们新的战场!
《大数据时代》读后感
大数据时代读后感范文
大数据时代的读后感
大数据时代数据化读后感
大数据时代读后感1000字
大数据时代读后感500字
大数据时代读后感800字
大数据时代读后感2000字
大数据时代的教育读后感
贵州省情大数据读后感
大数据方案
政务大数据方案
大数据*台方案
大数据备份方案
大数据技术方案
大数据应用方案
大数据优化方案
大数据*台技术方案
大数据系统硬件方案
大数据实*报告
大数据设计方案
大数据工作计划
大数据管理*台方案
小时代读后感
连接时代读后感
大数据项目技术方案
大数据*台总体建设方案
大数据应用实施方案
医疗大数据解决方案
大数据心得体会