数说故事×IDEA荣获语言与智能技术竞赛「视频语义理解赛题」季军-恋你如初恋漫画

9月18日,由中国中文信息学会(CIPS)和中国计算机学会(CCF)共同发起并联合主办的第七届语言与智能高峰论坛召开。论坛上,2022语言与智能技术竞赛赛事组委会为各获奖团队举行了颁奖,数说故事联合粤港澳大湾区数字经济研究院——IDEA数说故事实验室,针对视频语义理解任务,提出了基于多模态学习的视频语义理解解决方案,在视频的基础上融合基础感知内容(字幕识别OCR、语音识别ASR和人脸识别等)以及知识图谱等信息,并创新性地添加知识推理模块,对域外语义标签和视频分类标签有较好的提升效果,最终从500支团队中脱颖而出,荣获语言与智能技术竞赛「视频语义理解赛题」团队季军。

语言与智能技术竞赛由中国中文信息学会和中国计算机学会联合主办,百度、中国中文信息学会评测工作委员会和中国计算机学会自然语言处理专委会承办。自2018年举办以来,凭借面向真实应用场景的任务设计和源自真实场景的数据集,该竞赛已成为全球最权威、最热门的中文NLP赛事之一。

2022届竞赛进一步升级,联合“千言”数据集开源项目,设置了段落检索、知识对话、情感可解释、视频语义理解四大任务,覆盖了跨模态、知识驱动、可信学习等前沿课题,具有较高的学术和产业价值。据统计,本届竞赛共计约2500支团队报名,参赛选手覆盖全球262所高校和208家企业,提交有效结果超过7000份。其中,高校选手占比约52%,来自清华大学、北京大学、复旦大学、中国人民大学、中国科学院大学、伊利诺伊理工大学、悉尼大学等国内外知名高校;企业选手占比约34%,来自中国移动、联通、平安保险、华为、腾讯、网易、小米、小鹏汽车、海康威视、施耐德电气等知名企业,覆盖了金融、互联网、传媒、通信、工程机械、能源、生物等多个行业。

数说故事联合粤港澳大湾区数字经济研究院——IDEA数说故事实验室,能在视频语义理解赛题中名列前三,这代表了我们在预训练模型在计算机视觉(CV)和自然语言处理(NLP)领域的研究成果位居行业前列。

视频语义理解任务,本质是对视频内容进行语义级别的结构化,是大规模深度分析视频内容的基础。本次比赛要求参赛选手融合知识图谱、语言、视觉、语音等多模信息,结合知识计算与推理,为视频生成相应的标签,包含一二级的分类标签和语义标签(实体/概念/事件/实体属性等)。

本次比赛技术难点

■跨模态信息多且混杂,如何充分融合各模态信息进行综合判断;

■ 分类标签复杂,呈二级树状结构,共278个分类标签;

■ 包含大量域外语义标签(接近50%的标签未在文本里面出现过),需要对跨模态的信息进行综合推理才能获得结果。

数说故事×IDEA解决方案

01 基于跨模态Transformer结构构建模型底座

将标题、语音和字幕信息等文本信息先输入到文本预训练模型中,得到表示文本信息的张量;

利用跨模态的注意力机制对文本和视频信息进行融合;

比起单模态能更准确地感知视频语义。

02 针对树状分类标签提出新颖的分类纠错机制

先独立地预测一级分类标签和二级分类标签;

综合预测结果的置信度,执行自底向上的逆推和自顶向下的纠错机制;

在278个分类标签中得到55%以上的准确率。

03 多种途径解决域外语义标签问题

提取出现频次大于20的语义标签(183个)来构成封闭分类集,将开放问题简化为封闭问题,降低了提取难度;

提出新颖的知识推理模块,基于人脸信息,对齐到相关人物的知识图谱,进行域外标签推理,下图为具体标签的提取和推理流程。

数说故事作为国内领先的一站式大数据及AI智能应用提供商,具备千亿级基础数据平台,并基于成熟自助的算法平台与算法专利,以及多年的算法能力积累,搭建了可自助的算法平台,此算法平台大幅度降低训练数据和算法开发的研发成本、维护成本,形成算法和模型的积累,目前已积累37种算法及模型。

2021年,数说故事联合IDEA数字经济研究院CTO Labs正式成立「IDEA数说故事实验室」,共同围绕AI知识图谱、下一代动态海量事理图谱技术等领域展开国际一流的研究和产业化落地,推动技术突破真正地转化为可落地的商业和社会价值。数说故事联合粤港澳大湾区数字经济研究院——IDEA数说故事实验室在围绕AI知识图谱、下一代动态海量事理图谱技术等领域展开国际一流的研究和产业化落地,不仅一次获得业界的认可,在前不久,IDEA数说故事实验室论文获「国际AI顶会IJCAI-ECAI 2022 Survey Track」收录。

数说故事联合粤港澳大湾区数字经济研究院——IDEA数说故事实验室,能够在此次语言与智能技术国际竞赛中出类拔萃,创下佳绩,这是在视频语义理解模型创新技术的一大突破。

未来,数说故事联合粤港澳大湾区数字经济研究院——IDEA数说故事实验室将持续在知识融合、可信学习、跨模态等技术在应用落地中不断提升,提升语言理解与人机交互智能水平,实现创新发展,为推动语言与智能领域技术发展和应用贡献力量。

蹲蹲固玩或者崽崽!同帮闺蜜一起蹲——下面的图都是我和基友的合照哦(菇菇/音乐家是我。虚荣/军帽/花环是她)你可以称呼我为默言,称她为土豆——!我们都是十五岁的新晋高一学牲(我们都是女孩子,但是她有对象啦不滴cp(寡王哭泣)我们会住校,因为在一所学校所以作息也差不多一样哦。双休在,工作日住校对固玩/崽崽没有太多要求,最好别太萌新,另外如果你介意我俩朋友之间的贴贴就不要来了。因为你可能会看到我俩一直在一块都可以加!都可以加!都可以加!请加爆我们!(
2022-10-15
国内快充领域又有新成果了!中国通信标准化协会与电信终端产业协会联合召开了移动终端融合快充成果发布会,发布首批11张快充认证证书,涉及6家企业的4款终端、5款适配器和2款芯片产品,推广融合快充技术,扩大技术应用领域,推动认证结果的采信,建设终端快充产业新生态。可能很多朋友都看不懂是什么,但简单来说,移动终端融合快充就是能够让各家的充电协议统一,不同品牌的手机都可以用对方的快速充电器进行快充。而其中通过认证的就包括OPPO的设备。据悉融合快充协议目前通用最高功率是 40W,但第二阶段会提高到 65W
2022-09-30
#ooc致歉文笔差介意滑走#禁止二改二传抄袭#其他四位在主页陆续更新感谢大家的点赞评论关注啦!!【周棋洛视角】“这个纪念品好特别,薯片小姐一定会喜欢!”“诶?薯片小姐今天怎么不太开心的样子,是洛洛的问题嘛?”“看薯片小姐笑起来心情都变好了呢!”“薯片小姐睡觉怎么还流口水呢?是想到洛洛了还是想到好吃的了?”“薯片小姐说要躺在家里追剧!可恶!一点都不爱我了!”“和薯片小姐一起下厨做了好吃的,嗯,还是我做的比较好嘛!”“她怎么这么喜欢摸我的头…还说我像一只巨大的金毛,我才不是小狗呢!”“薯片小姐刚吃完
2022-09-30
内容关键词: WH70D期货订轧 WH70D执行标准 WH70D钢板化学成分 详细介绍一WH70D简述WH70D是高强度焊接结构钢板,通常被称为高强板。W表示舞钢;H表示公斤级;70表示公斤级数值。二WH70D应用范围应用:工程机械、矿山机械、煤矿机械如液压支架、吊车伸长臂、起重机伸长臂、挖掘机支撑臂等。三WH70D执行标准WH70D钢板执行标准:Q/WTB019-2008(WH70是舞钢特有牌号),本技术条件适用于厚度为8-60MM、屈服强度级别550MPA的钢板,本标准中的钢板共包
2022-09-30
【Valentina Kryp】 Julie Starling [25P 32MB]
2023-02-24
王者荣耀嫦娥cosplay
2021-08-01
点击进入查看全文>
2022-10-12
「pixiv特辑」夏日的冒险。《莱莎的炼金工房》同人特辑
2020-06-07
山水画历来备受青睐,其承载着“以形媚道”、“澄怀观道”的民族文化内涵,是中国文化与民族精神的象征,是山水画家内在修为的外化,是自然与人文、画家与作品的高度统一,其文化深意与笔墨韵味值得当代山水画家深入探究。 当代实力派画家叶大隐老师的画尤为重视视觉张力,同传统的山水画相比,可以说是风格化古为新,色彩艳而不俗,画法虚实相生,笔底情真意切,意境悠远传神。 叶大隐,闲人墨斋主人,当代艺术实力派名家,职业画家,经过大量的创作形成了自己独特的艺术风格。现为香港国画院院长,书画艺术品高 级 评 估师,书画艺术品流通
2022-10-12
标题随便起的,是改编很喜欢的一首歌的歌词,太喜欢《燃烧》了,实在想写点感想,想到什么写什么吧……作为一个普通韩影爱好者(兼刘亚仁迷妹),刘亚仁+李沧东简直是梦幻阵容,因此戛纳首映之前就期待满满,戛纳口
2018-06-21