数据科学家将成为最性感职业

来源: 我要调查网 发布时间:2015-05-14 浏览:

  如今是数据的时代,数据处理技术也在不断革新,然而真正利用大数据技术解决的问题则并不多。公司运营、政府管理、社会服务等问题的认知和决策仍以来传统的营销、行政数据及抽样调查,这表明大数据处理技术并非万能,它是一种新现象、认知新手段。它不能取代传统的数据分析和决策支持,但能极大地拓展认识世界和智能决策的能力。不论是大数据还是小数据,都是用数据判断实际及未来并进行决策。

  数据科学
  数据科学是研究如何让数据变成信息进而产生知识以支持判断和决策的科学,是信息科学、计算机、统计学,与其他自然科学和社会科学专业的结合。它包括大数据、小数据、有结构数据、半结构数据、无结构数据。它的核心是智能决策,不仅是商业智能,还是数据智能。因此,计算机、信息、统计、自然科学、社会科学的学生,都能成为数据科学家。重要的是,信息技术、统计分析、专业知识三者兼有。
  周有光先生将人类思维和认知的发展归纳为神学、玄学、科学三阶段,这三者是人类对宇宙世界万物的理解而采用的不同思维方式和认知手段。神学寻求的是绝对结论,玄学寻求的是逻辑结论,科学寻求的是可以被实证的结论。神学靠维护被认可的绝对结论(信仰)而生存,受派别分歧和争斗影响而演变发展;玄学靠推论和分析方法的改变而发展;科学则是靠不断在新的证据面前修改和推翻原有结论中发展。神学、玄学、科学可以并存,但在不同的社会阶段谁占主导地位则有所不同。
  神学、玄学、科学有冲突,也互有影响。神学的想象能给科学带来灵感,玄学的推论能帮助科学拓展理论模式和分析方法。世界上还有很多问题是科学无法实证的,而这些人类需要靠神学和玄学的帮助来解释。在现代社会,科学占领主导地位。因而,数据为依据的智能决策发挥的作用越来越大。
  数据科学内容
  由于是新兴的学科,其内容界定众说纷纭。笔者根据个人近年来对大数据理念的研究,以及多年从事知识应用、数据采集分析和决策支持的实践经验,将数据科学包含的内容总结如下。
  数据科学要从原材料开始,数据的基本概念,包括“什么是数据?”、“什么是数据科学?”、“数据分类”、“数据形态 ”、“数据获得手段 ”、“数据获得渠道”、“数据质量 ”、“数据数量”。其次是数据处理,包括“数据清理”、“数据确认”、“数据转换”、“数据组织和存储”、“确值处理”、“互操作性 ”、“数据安全”。再接下来是根据数据的性质和特点选择正确的分析方法,这包括大数据和小数据。具体内容有“什么是大数据?”、“什么是小数据?”、“统计1.0 和统计2.0”、“大数据技术及其重要意义”。最后是数据分析,包括“传统统计分析”、“大数据分析:数据挖掘”、“人工智能”、“智能层次”、“动态可视化分析”等。
  形成一个完整的学科,还需要实际的案例。所以数据科学的应用也是一个重要内容,这包括数据科学家的角色和职责,以及数据科学应用案例--商业应用、医疗卫生信息、政府管理和决策等。
  数据科学的未来
  不久的将来,新一轮的数据处理分析技术可能会替代大数据成为新闻焦点,数据科学仍可以把新出现的技术纳入其中。不论技术如何发展,以科学实证为主导的认知和决策理念会长期继续下去。
  哈佛大学商业综述月刊曾载文预测,数据科学家将是21世纪最性感的职业。在美国,数据科学家的年收入已超过律师和医生。然而许多大公司对目前就职的数据科学家并不太满意,因为他们只是单项专长——计算机专家只懂人工智能,统计专家擅长分析,领域专家注重要解决的问题。三者皆能的数据科学家是最受欢迎,但不非是样样都是专家。因此,对于未来数据科学家的培养,将要从这方面入手。