慧科AI实验室竞技国际自然语言处理与中文计算大会:文本摘要技术夺冠!

2018-07-10信息快讯网

第七届国际自然语言处理与中文计算大会(NLPCC 2018)“单文本摘要”技术评测结果公布,慧科AI实验室(Wisers AI Lab)以其专有的自动摘要技术从来自世界各地学术界与业界共18支队伍中脱颖而出,成功获得第一名。

随着近些年信息的爆发式增长,人们每天能接触到海量的文本信息,如新闻、博客、聊天、报告、论文、微博等。从大量文本信息中提取重要的内容,已成为我们的一个迫切需求,而自动文本摘要则提供了一个高效的解决方案。单文本自动摘要技术通过使用计算机软件及其底层分析算法自动从原始文本中创建一个简明、全面且反映该文章核心思想的摘要,从而辅助人们实现大量信息的快速阅读与检索。甚至更进一步,可以通过在单文本自动分析的基础上分析多文本,实现对同一事件不同报道的多维度、多角度自动文摘。

慧科(Wisers)夺冠的自动文本摘要技术使用人工智能(AI)与自然语言处理(NLP)技术,支持中英文跨语言自动文章摘要,采用无监督式摘要生成技术,不依赖于训练数据,可胜任各类文本的自动摘要。

该技术包含两个重要模块。第一个内容分析模块自动分析文本的话题大意,利用统计学和语言学特征,识别出文本中最精确且全面地涵盖文本讨论主题的重要语句。

第二个摘要编辑模块,通过精心设计,不仅解决了提取式摘要技术通常因简单提取句子并拼接所造成的上下文不连贯问题,同时也克服了生成式摘要技术产出句子可读性差的问题。

慧科夺冠技术的秘诀在于:

•通过内容分析与识别检测并纠正摘要中不清晰的指代表述(例如代词等)和不完整语段(例如编号不完整的列举项等);

•通过文本去噪和句子压缩确保最终生成摘要的简洁度、流利性与可读性;

•集成了基于深度学习和语义嵌入模型的垃圾广告过滤与话题分割技术,以保证最终摘要的信息多样性和清洁度。

慧科AI实验室自动文本摘要技术自2018年1月起已在慧科产品后台广泛应用,支持日常数据管理与运营。

除获得自动文本摘要评测第一名之外,慧科AI实验室的自动话题分类技术也在第七届国际自然语言处理与中文计算大会(NLPCC 2018)“知乎问题自动标注”技术评测的16支参赛队伍中名列前四。该评测任务旨在对任意未先指定的知乎问题从超过2万5千多个可选标签集中自动判断话题分类。慧科的自动话题分类技术采用了基于语义向量模型与深度学习相结合的集成学习技术;并且透过高效定制化工具,可快速支持话题扩展。

国际自然语言处理与中文计算大会(NLPCC)是由中国计算机学会中文信息技术专业委员会(CCF TCCI)组织的专注于自然语言处理和中文计算技术领域的一流国际会议。参加者包括来自世界各地自然语言处理和中文计算领域的专家和学者。今年第七届年会NLPCC 2018将于2018年8月26日至30日在中国呼和浩特举行。

NLPCC评测单元涵盖自然语言处理和中文计算领域中各种经典和新兴的重要课题,受到学术界和业界的广泛欢迎和参与。本届评测任务于2018年1月份公布并开始接受报名,3月份正式启动,4月底提交结果,5月份结束。每个评测任务统一给参赛队提供一份供算法开发的训练数据集,之后由评测任务组织者根据严格设计的测试数据集和性能指标对每个参赛队提交的解决方案进行评估并排名。

慧科AI实验室(Wisers AI Lab)2014年7月成立于香港,专注于以人工智能技术解决中文全媒体资讯自动化分析与大数据情报挖掘,于2016年4月成功获取香港特别行政区政府逾八百五十万港币创新科技基金。团队由毕业于国际知名院校的AI及计算语言学专家组成。所有成员均拥有硕士以上学位,其中35% 的成员拥有博士学位。

慧科AI实验室自主研发的,面向实际应用、开放领域、多元化数据的AI分析技术全面涵盖自动化媒体情报处理与挖掘的各个层面,既包括基于文本分析的实体识别,关系提取,话题分类,情感分析和事件检测追踪等技术,也包括基于图像分析的品牌标识和人脸识别技术。以上技术均可以在慧科AI实验室官网(www.wisers.ai)提供的实时技术演示中获得体验。

慧科讯业有限公司(Wisers Information Limited)是全球领先的全媒体大数据智能商业情报专家,凭借20年累积的数百亿海量媒体数据,先进的人工智能技术,以及科学的分析模型体系,为全球超过2500家客户提供创新的产品服务和解决方案,助力企业及各类机构做出明智决策(www.wisers.com.cn)。

《中华人民共和国监察法(草案)》(摘要)
去年北京考古面积相当于13个足球场,中轴线申遗文本修编完成
国际管理学大师聚集上海,探讨国别区域管理与跨文化管理
中科大建成新型光学量子行走实验系统,可实现普适量子计算
OPEC从7月1日起增产石油,能阻止国际油价继续“涨涨涨”吗?
发改委:2020年底前,全国城市建立生活垃圾处理收费制度
中国专利申请连续七年居世界首位,国际贸易知识产权海外维权高级研修班在沪开班
“小红车”转运降低儿童手术前焦虑,国际麻醉顶级期刊发表上海儿童医学中心人文论文
和辉光电二期项目:以“柔”为王,抢占新一代显示技术先机
第十四届中国国际动漫游戏博览会开幕
去沙滩、冰上打“快乐乒乓”——国际乒联终生名誉主席徐寅生与专家学者畅谈群众乒乓新发展
远红光一照,干细胞就开工!上海科学家利用合成生物学等交叉技术,设计出内源基因转录装置
用世界语言 讲中国故事--- 2018年家庭故事大赛第二季正式启动
“以亩产论英雄” 余杭经济技术开发区抢占“智高点”
老龄化城市面临精神卫生健康特有挑战,香港中文大学-上海市精神卫生中心共建沪港精神卫生合作平台
脐带血治疗缺血性脑卒中有效!语言、运动能力均有改善,生活自理能力提高
用童心童语演绎爱国课本剧,沪上中小学生以戏剧语言感悟初心
湿垃圾资源化处理不能堵在“最后一公里”| 上海垃圾分类全链条调查·处理
财务云、电子发票以及移动支付位列影响中国会计从业人员的十大信息技术前三
文汇深呼吸 | 与“最聪明物种”过招,不止靠技术
希区柯克《惊魂记》中的变态旅馆老板诺曼·贝兹“AI版”在MIT面世!我们需要怎样的AI?
广电总局:偶像养成、才艺竞秀类节目确保导向正确、内容健康向上方可播出
杰克船长的6.5亿美元去哪了?约翰尼·德普深陷打人、欠款、离婚丑闻
努力打造国家人工智能发展高地!市委中心组学习会聚焦这一颠覆性技术
李克强和默克尔出席中德经济技术合作论坛,双方重申将共同维护自由贸易
2035年,上海再添60座污水污泥处理厂
科技成果拍卖了还附送后续技术服务支持,上海首尝科技成果专业拍卖
蚊子的末日可期!澳洲新技术可有效消灭埃及伊蚊
金山:激发乡村各类资源要素活力,探索国际大都市乡村振兴之路
漫谈 | 国际会场上经常提到的“多边贸易体制”,这次我们来科普了!
第六届上海国际芭蕾舞比赛公布复赛入围名单,海外选手占比42.1%
会说中文的亚美尼亚美少女做讲解,欧洲青年惊叹“原来交响乐在中国历史如此悠久!”
“八八战略”闪耀马克思主义真理光芒——座谈会发言摘要
李敬泽在北大中文系毕业典礼上致辞:我想和北大这个身份保持一定的距离
2018年国际数学奥林匹克比赛成绩揭晓:中国队团体第三,美国第一
对标国际标准,亮出海派中医品牌,上海龙华医院成为全球首家通过JCI学术型医学中心认证的中医医院
中国电网技术通联世界 参与国际标准带动“走出去”
我国首次通过计算获得黑洞在暗物质晕中光学阴影
张悦然:如果作家的名字凌驾于文本之上,这是否有点可疑?
以后不认识路,AI不仅指路,还替你问路!Facebook正训练AI问路……
这家借贷平台布局AI金融服务
警惕粗鄙网络语言侵占年轻一代词库 | “网络时代,语文教学如何坚守文化使命”系列报道(上)
©2014-2024 dbsqp.com