阅读下面的文字,完成下列小题。 材料一:2017年3月,由中南民族大学教授王兆鹏与搜韵网站共同打造的《唐宋文学编年系地信息平台》正式上线,仅两天,网络点击量就达220万次。登陆平台,点击诗人名字,便可看见他一生行迹的文字版和路线图,点击路线图中的任一个地点,能看到他在这里的生活轨迹,留下的作品,该平台利用大数据打造了一张“文化版”中国地图。这之前,文学研究几乎没有利用过大数据,该地图第一次通了历史的时空隔阖,将唐宋诗人请出了“格子间”。 这并非王兆鹏第一次将大数据和文学连接在一起。上世纪90年代,他就利用大数据给唐诗宋排名次,结果遭到一片骂,但王兆鹏却还是选择相信数据,他觉得在将来的文史研究中,作品的好坏评价“必须要有数据作支撑。”该地图还引起了海外研究者的关注,哈佛大学相关项目组也发来邮件,希望合作共享数据。 材料二:我们生活在一个任何人都无法摆脱数据的大数据时代。数据越多,人们做出的分析就越多;人们分析得越多,制造的烟幕弹也就越多.因此不能单看数据的表象,要保持清醒的头脑。以美国交通部关于对阿拉斯加航空公司和美国西部航空公司的飞机晚点率统计分析为例: 自1987年起,美国交通部就要求航空公司上报每个月的晚点记录。在最近的报告中,美国西部航空公司是表现最好的一家,晚点率最低。在竞争对手纷纷倒闭的情况下,形势一片大好。但1991年的夏天,美国西部航空公司却宣布破产,这与分析人员统计分析有关。 分析人员统计分析时只关注四个对象: 客机、到达机场、客机数量和晚点频率,而忽视了天气条件、載客率等,又加之在统计平均数时,对某些指标进行过度加权后,两个公司的平均晚点率就完全走向了反面。 (摘编自美国冯启思《对“伪大数据”说不: 走出大数据分析与解读的误区》) [注] 统计学认为,在统计中计算平均数等指标时,为了考虑到每个数量在总量中所具有的重要性不同可以给予不同的权数,这样的做法就叫加权,即对各评价因子在总体评价中的作用进行区别对待,事实上,没有重点的评价就不算是客观的评价。 材料三:近日,《农业农村大数据试点方案》(以下简称《方案》)正式印发。据介绍,《方案》旨在运用大数据概念和技术创新农业监测统计工作的思路和办法,推动大数据在农业生产、经营、服务等环节的应用,形成一批可复制、可推广的成果。试点省份包括: 天津、上海、江苏、安徽、江西、山东、湖南、广东、广西、重庆、四川、贵州、云南、青海、新疆,当前由于农业数据的共享开放不足,导致信息孤岛、数据壁垒、数据碎片化和信息不对称等问题大量存在。农业部市场与经济信息司副司长王小兵认为,充分利用大数据对农业生产要素实行数字化设计、智能化控制、精准化运行、科学化管理,是推进农业现代化的必然选择。 (摘编自《<农业农村大数据试点方案>公布: 打破信息孤岛共享涉农数据》) 7. 下列对材料二相关内容的理解,不正确的一项是( A. 图1数据支持以下结论: 整体上,美国西部航空公司正点到达的表现要胜过阿拉斯加航空公司。 B. 图2 数据支持以下结论: 美国西部航空公司在每个机场的正点到达率均低于阿拉斯加航空公司。 C. 美国西部航空公司最终走向了破产,这与分析人员所关注的评价对象不够全面有着一定的关系。 D. 为了统计的科学性和准确性,我们不能够在加权后进行平均数的统计,否则统计结果会有偏差。 8. 下列对材料的相关内容的概括和分析,正确的两项是( A. 《唐宋文学编年系地信息平台》利用大数据打造了一张“文化版”中国地图,这是国内文学研究领域首次利用大数据的个案。 B. 王兆鹏的研究引起了哈佛大学相关项目组的关注,这说明海内外的文学研究者对于大数据的利用还是有一些共识和期待的。 C. 冯启思认为数据越多,人们的分析就越多,烟幕弹也就会更多,所以不能只关注数据的表象,要敢于对“伪大数据”说不。 D. 从《农业农村大数据试点方案》的试点省份分布来看,说明我国当下利用大数据推进农业发展的侧重点应该放在西部地区。 E. 大数据的使用为社会发展提供了数据支持,使得一些领域出现了前所未有的良好局面,因此利用大数据是行业发展的前提。 9. 根据上述材料,概括说明在信息化的当下我们该怎么对待大数据研究。 【答案】7. D 9. ①依托大数据,对社会各行业进行更科学、有效的研究,合作共享,争取更大的发展。②要保持清醒的头脑,对大数据隐藏的烟幕弹仔细辨别,不能盲目相信“伪大数据”。 【解析】 7. 试题分析:D项,“我们不能够在加权后进行平均数的统计”错,原文的意思是“不能过度加权”。 8. 试题分析:A项,“首次使用”错,上个世界90年代王兆鹏就用数据给唐诗宋词排名。C项,“侧重点应该放在西部地区”于原文无据。D项,“利用大数据是行业发展的前提”过于绝对。文章只是说明“大数据的重要”,并没有说“是行业发展的前提”。 |