背景介绍
自然语言是人类智慧的结晶,自然语言处理是人工智能中最为困难的问题之一,而对自然语言处理的研究也是充满魅力和挑战的。
在业界,搜狐深耕互联网资讯传播,多年来始终保持着对自然语言处理技术应用的不断探索,积累了丰硕的成果。在学界,清华大学作为顶尖学府,其计算机系在自然语言处理这个前瞻领域收获了大量理论及实践的重要成就。
作为先行者,搜狐携手清华计算机系共同发起本届内容识别算法大赛,旨在通过提供业务场景、真实数据、专家指导,选拔和培养有志于自然语言处理领域的算法研究、应用探索的青年才俊,共同探索更多可能、开启无限未来。
竞赛任务
给定若干文章,目标是判断文章的核心实体以及对核心实体的情感态度。每篇文章识别最多三个核心实体,并分别判断文章对上述核心实体的情感倾向(积极、中立、消极三种)。
概念定义
实体:
人、物、地区、机构、团体、企业、行业、某一特定事件等固定存在,且可以作为文章主体的实体词。
核心实体:
文章主要描述、或担任文章主要角色的实体词。
注:参赛对象:全日制在校大学生(本科、硕士、博士均可)。