您当前所在的位置: 首页 -> 工作动态 -> 正文

“人工智能核心技术之自然语言处理最新技术”学习汇报

发布日期:2017-06-20  来源:   点击量:
汇报人: 王婉 滕佳颖

一、培训背景介绍
《中共中央关于制定国民经济和社会发展第十三个五年规划的建议》提出,拓展网络经济空间,推进数据资源开放共享,实施国家大数据战略,超前布局下一代互联网。此间专家认为,这是我国首次提出推行国家大数据战略。
国家信息中心专家委员会主任宁家骏认为,在当前我国经济发展进入新常态的大背景下,对于靠土地、劳动密集型产业等传统产业规划发展的思维正在社会各个层次发生变化,新的世界和社会环境呼唤劳动力自身素质的提升。“我国已进入创新驱动转型的新阶段,需要发挥信息和数据的作用来促进社会和经济的发展。”宁家骏说。
建议提出,拓展网络经济空间,实施“互联网+”行动计划,发展物联网技术和应用,发展分享经济,促进互联网和经济社会融合发展。实施国家大数据战略,推进数据资源开放共享。完善电信普遍服务机制,超前布局下一代互联网。推进产业组织、商业模式、供应链、物流链创新,支持基于互联网的各类创新。
大数据和互联网已成为产业发展的创新要素,国家制定大数据战略和布局下一代互联网,正是着眼于促进我国智能制造产品的升值,必将推动产业发展向中高端迈进。人工智能技术的战略突破和新一代信息技术与制造技术的深度融合,将实现真正意义上的智能制造,将引领和推动新一轮工业革命走向高潮。人工智能机器学习能力和执行任务的复杂程度正以指数级增长,人工智能2.0技术的发展和应用速度将大大超过前几次科技革命。大数据研究范畴之下的自然语言处理无疑人工智能领域目前最受关注的热点学科方向之一。
自然语言处理是指利用计算机对人类使用的语言(如中文、英文)进行自动分析和加工。据权威统计,世界上的数据规模正以2年10倍的速度增长,其中80%是非结构化数据,而文本作为人类最自然而又最普遍的表达方式,又是非结构数据的主要组成部分。在此背景下,语言文本的分析和处理承受着巨大的压力。通过自动化的手段高效准确分析语言,以获取信息已成为人们最大的期待。自然语言处理就是实现这一需求的核心技术,也是几十年来学术界和十多年来工业界研究热点。在搜索引擎、推荐系统、自动问答、智能客户服务、机器人、文本自动摘要、竞争情报分析、舆情分析和热点话题跟踪、社交网络、智能建造、智慧城市等应用领域,广泛需要自然语言处理技术,也是目前人工智能、大数据时代的核心技术之一。掌握自然语言处理技术的人才在就业市场上炙手可热,是各大互联网公司争夺的焦点,由于自然语言处理和其他学科领域的广泛交叉性,掌握该项技术的科研人员往往也能在学术竞争中占据优势。

二、培训目的
此次培训课程讲授的是自然语言处理的基本思想、方法和技术。通过本课程的学习,通过理论学习+动手实操,使学员能够理解自然语言处理基本方法、掌握机器学习中的常见模型与关键技术,通过实践不仅能够掌握该领域重要技术的原理,而且能够深入了解技术的应用过程,为以后在大数据教学工作和具体项目应用中深入解决实际的应用问题打好基础。

三、学习心得
1、明确人才培养方向
根据国家信息中心在2017年发布的《大数据发展报告》中提出,数据分析、技术研发等人员大多供不应求,反映出大数据方面技术类人才更为稀缺,另一方面,迅猛发展的大数据领域吸引着大量的信息化领域的人才进入,导致项目管理类人才数占比远高于招聘需求人数。具体来看,数据分析类岗位需求最为丰富,其求职人数占比虽位列第一,但人才供给仍相对不足。既然大数据方面的人才需求如此短缺,那我们作为人才培养基地应该如何培养具有大数据技术方面的能力的人才呢?以终为始,我们作为以建筑为特色的本科院校,首先需要明晰何为大数据技术?我们能够用大数据技术做什么?尤其是建筑领域。
大数据技术本质上是依托机器学习算法和深度学习算法进行自然语言处理、领域知识库的建设,以及实现推荐系统、智能问答等功能。落实到建筑领域,我们就是要利用机器学习技术来帮助建筑业完成建筑产业转型与升级。在智能建造方面,运用机器学习与深度学习技术来训练模型并运用数据进行模型测试,通过不断得调整参数最终获得一个迭代后优化的模型,然后利用优化后的模型进行数据分析与预测,指导建筑业管理决策。优化后的模型还可以进行拓展应用,比如建筑信息模型知识库的构建,建筑领域智库的问答系统等等。明确了大数据各知识节点之间的关系后,就可以落实培养方案中的大数据课程体系设置。
2、为大数据课程体系提供指导
大数据课程体系的设置实际上是一项系统工程,可以理解为我们要构建建设项目大数据平台并且要利用数据平台进行协同设计、协同施工与协同运维等一系列活动进行数据分析和管理决策所用到的知识节点都应该纳入到大数据课程体系的范畴之内。
专业课程重在培养学生的理论知识和动手实践能力,学生在完成每个学期的理论学习后,至少有两个企业项目实战跟进,让学生在项目中应用各类大数据技术训练大数据思路和实践步骤,做到理论与实践的充分结合。
大数据的课程体系包括专业基础课、专业核心课、大数据架构设计、企业综合实训等四个部分。实训环节要联合大数据技术企业和教育研究领域的学科带头人组成课程实训专家组,研发出系列大数据项目实训课程体系,引入具有丰富实践经验的实训教师,运用当前大数据正在运行的真实项目,实施案例教学,让学生真正掌握大数据的专业技能。
3、为大数据实验室的建设提供思路
大数据实验室的建设目的是作为大数据教学实验及科研平台,包括数据挖掘与大数据分析平台。实验室的设计全面落实“产、学、研、用”一体化的思想和模式,从教学、实践、科研和使用多方面注重专业人才和特色人才的培养。
利用虚拟化教学资源,搭建教学系统和集群平台,将理论学习、实践教学和大数据项目实战融为一体,由难而易、循序渐进,逐步提升学生的学习技能和实践水平,提高“学”的质量和成效。利用大数据分析主流软件框架,搭建与业界主要用户一致的实验与科研环境,
将理论课程中学到的机器学习算法和深度学习运用到实际的数据分析过程中,提升学生的动手操作和项目实践能力。使得学生所学与企业项目人才需求无缝衔接。