互联网、云计算、移动计算等新兴技术拓展了人类创造和利用信息的范围和模式。联合国在2012年发布的大数据白皮书《大数据促发展:挑战与机遇》中指出,大数据时代已经到来,大数据的出现将会对社会各个领域产生深刻影响。2013年被称为中国大数据元年,各行各业开始高度关注大数据的研究和应用。在云计算技术、非结构化数据存储技术的助力下,大数据已经成为当前学术界、工业界的热点和焦点。从公司战略到产业生态,从学术研究到生产实践,从城镇管理乃至国家治理,都将发生本质的变换,大数据将成为时代变革的力量。“用数据来说话、用数据来管理、用数据来决策、用数据来创新”的文化氛围与时代特征愈发鲜明。大数据时代新特征要求设计和构建相应的管理决策分析模型与方法,有效地将信息科学和商业应用相结合。因此,掌握大数据核心技术且同时拥有“经管”专业知识的人才储备将成为国家大数据战略布局的重中之重。
1
与大数据概念知名度和企业热情形成对比的是,大数据正面临全球性的人才荒。企业对新型大数据分析和预测技术人才的热情和需求正在超过传统的商业智能和信息管理人才。根据麦肯锡报告,仅仅在美国市场,2018年大数据人才(包括高级数据分析专家)缺口将高达19万。此外美国企业还需要150万能够提出正确问题并运用大数据分析结果的大数据相关管理人才。商业数据分析是现在全美增长最迅速的领域,据NewVantagePartners公司对美国《财富》500强公司调查显示:85%的500强企业已经或正在筹划推出大数据项目,未来几年这些企业在数据分析上的投资将平均上涨36%。《哈佛商业评论》的一篇文章将数据分析称作“21世纪最热门的职业”。人力资源公司Kforce的调研报告预测2014年全球大数据相关的八大职业平均年薪将达到11.75万~14.06万美元。中国是人才大国,但掌握和应用大数据技术的创新人才仍是稀缺资源,培养大数据相关人才成为最为紧迫的问题。在这样的形势下,对外经济贸易大学于2015年7月向教育部申报开设“大数据科学与应用(目录外)”本科专业。
2
“大数据”已经成为全球科技界和企业界关注的热点。数据为王的时代已经到来,企业关注的重点从追求计算机的计算速度转变为大数据处理能力,从以软件编程为主转变为以数据为中心。2012年3月,美国奥巴马政府宣布投资2亿美元启动“大数据研究和发展计划”,这是继1993年美国宣布“信息高速公路”计划后的又一次重大科技发展部署。美国政府认为大数据是“未来的新石油”,将“大数据研究”上升为国家意志,这对未来的科技与经济发展必将带来深远影响。大数据研究的热潮激励基础研究的科研人员开始考虑“数据科学”问题。目前大数据的工程技术研究已走在科学研究的前面。美国政府6个部门启动的大数据研究计划中,国家科学基金会的研究内容提到要“形成一个包括数学、统计基础和计算机算法的独特学科”。图灵奖得主吉姆·格雷描绘了数据密集型科研第四范式的愿景,将大数据科研从第三范式(计算机模拟)中分离出来单独作为一种科研范式,是因为其研究方式不同于基于数学模型的传统研究方式。大数据研究能成为一门科学的前提是,在一个领域发现的数据相互关系和规律具有可推广到其他领域的普适性。提炼“大数据”的共性还需要一段时间的实践积累才会逐步清晰明朗。将大量多元异构、交互性和时效性强并包含大量噪声的数据作为研究对象的专门学科,依然具备了鲜明的学科特征。
3
由于大数据专业主要支撑技术来源于信息技术,所以在专业申报中应将该专业所属学科门类及专业类推荐设在计算机科学与技术学科下,大数据专业与计算机学科下所属专业的关系及区分度可以概括如下几点。
(1)研究对象的侧重点不同。“大数据科学与应用”专业研究的核心对象是“大数据”,既不是硬件、软件理论研究,也不是计算机技术在某个领域的应用研究或者某一特定计算机技术的理论和应用研究,并且“大数据”引发的研究不可能在短时间完成,“大数据”问题研究具备了跨行业、跨领域的普适性。除去该专业所需的计算机学科之外的专业知识,就计算机学科内部而言,该专业所需知识在计算机学科的其他专业都有涉及,但又不被完全包含,所以不便将其归入现有专业之中。
(2)大数据科学素养要求高。该专业对学生在“大数据科学素养”方面有更高的要求,在理论上,强调学生有很好的数理统计基础、扎实的数据结构和算法的基本功,能够很好地理解和掌握各种机器学习和数据挖掘算法;在实践上,强调学生具备海量数据获取、数据组织与存储、数据清洗、数据预处理、数据分析以及数据可视化的工程实践能力,掌握数据处理各个环节的基本技能;在理论与实践结合方面,强调学生掌握处理“大数据”的先进技术和理论,即掌握与云计算相关的大数据处理平台及其生态系统,强调与数据来源紧密相关的新技术的融合与互动,即理解和掌握物联网、移动互联网相关理关理论和技术。
(3)专业具备前所未有的复合性特征。对大数据而言,技术走在科学前面。目前的局面是各个学科(如生物、医疗、金融等)的科学家都以自己为主处理本领域的海量数据,各领域的科学问题还掌握在各学科的科学家手里。本专业的设置希望从一开始就以培养复合型人才为目标,以大数据为核心研究对象,强调学生对专业领域(经济、金融、电子商务)数据的理解能力,深刻体现技术为数据服务的思想。
(4)与统计学专业的区别。本专业与统计学专业的最大区别来自于对IT技术的理解和掌握,强调数据在获取、清洗、存储、处理和展示等各个环节与IT技术的深度融合,而不仅仅是将IT技术作为辅助手段;就数据处理的种类而言,更重视对非结构化和半结构化数据(统计学专业处理的数据一般为结构化数据)的处理。
(5)与信息管理专业的区别。本专业与信息管理专业的区别主要体现在看待数据和信息的角度。信息管理主要强调在理解数据和业务流程的基础上,通过科学的分析和设计方法,实现管理信息系统,强调利用计算机技术介入、改造和升级原有的业务系统。“大数据”相关理论和技术更侧重对数据本身的洞察与理解,相对而言更加独立于原有的业务系统,更专注对海量、复杂、多元数据的深度分析和处理能力,更依赖于大数据处理平台和技术,也更好地支撑了物联网、移动互联网的应用和发展。
4
4.1大数据相关专业发展情况
由于市场对大数据人才的需求日益激烈,国外很多大学开始专门开设数据分析类专业。美国USNews排名Top50院校中的哈佛大学、哥伦比亚大学、斯坦福大学、芝加哥大学、麻省理工学院、卡内基梅隆大学等15所高校均开设了大数据相关专业。另外,由于大数据在2012—2013年开始兴起,人才市场无法迅速培养出大量符合企业期望的人才,美国一些公司采取了更现实的做法:和大学合作,长期培养大数据专业人才以及开展相关研究,比如英特尔就和数据学专业排名靠前的麻省理工学院合作,建立了大数据科学技术中心。目前,国内大数据相关专业主要开设在研究生层次。2014年中国科学院大学开设首个“大数据技术与应用”专业方向,该专业面向科研发展及及产业实践,培养信息技术与行业需求结合的复合型的大数据人才;2014年清华大学成立数据科学研究院,推出多学科交叉培养的大数据硕士项目;中国人民大学也设立了大数据应用与云管理、大数据与应用统计、大数据应用方向以及大数据与云计算研究方向;北京航空航天学院软件学院开设了大数据和云计算研究方向,并已经有毕业生;另外,上海交通大学、浙江大学、天津大学、厦门大学等也在研究生层次建立大数据专业。许多高校同时也在筹建本科的大数据相关专业,西安交通大学、北京交通大学等与IBM公司合作启动了大数据本科专业的建设或者改造现有相关专业。针对当前中国市场急剧扩大的大数据与分析技能需求和人才缺口,IBM投入1亿美元在中国大学推行大数据教育,并推出“IBMU-100”合作计划,在100所高校设立大数据与分析技术中心,在其中30所高校开设本科和硕士课程,在5所大学设立“卓越中心”。
4.2复合型人才就业前景
Glassdoor公司2016年1月发布的“美国最好的工作”排名中,数据科学家位居第一,底薪为11.6万美元。通过分析大数据人才市场需求、与大数据公司研讨以及对业界的调研,我们认为对外经济贸易大学开设大数据专业及就业方向主要有如下三个方面:
(1)贸易金融方向大数据分析师:主要就业岗位在供应链融资公司、P2P信贷征信平台、商业银行等。
(2)网络营销方向大数据分析师:主要就业岗位在互联网广告、O2O营销公司、大型网络媒体等。
(3)物流与电子商务方向大数据分析师。主要就业岗位在电子商务公司、现代物流公司、第三方支付公司等。学生职业生涯成长目标为首席数据官(CDO),如图1所示。
时代发展呼吁建立大数据专业人才培养体系,对外经济贸易大学“大数据科学与技术”专业申报经历了通讯评审、网上公示、专家委员会会审等系列程序。教育部学科发展与专业设置专家委员会评议后建议将专业名称统一规范为“数据科学与大数据技术”。我们认为这样更能体现工学学士学位特征。专业申报只是我们迈出的第一步,建设有对外经济贸易大学特色的大数据专业,培养受社会欢迎的、高质量的大数据人才,我们深感任重而道远。