阿里云机器学习平台PAI最近在ACL 2023 Industry Track上的多篇论文入选,这是一个令人振奋的消息。ACL是人工智能自然语言处理领域的顶级国际会议,聚焦于自然语言处理技术在各个应用场景的学术研究。这次入选意味着阿里云机器学习平台PAI自研的自然语言处理和多模态算法,以及算法框架能力达到了全球业界先进水平,获得了国际学者的认可,展现了中国人工智能技术创新在国际上的竞争力。
其中,一篇名为“基于电商多模态概念知识图谱增强的电商场景图文模型FashionKLIP”的论文引起了广泛关注。这篇论文提出了一种电商知识增强的VLP模型FashionKLIP,旨在解决电商领域数据的特殊性。与通用场景的文本不同,电商场景中的描述或查询通常由多个形容性短语组成,描述了产品的材质或风格等细节信息。而商品图像也有其自身的特点,主要包含一个大的商品图,没有很多背景物体。为了解决这些问题,论文提出了两部分内容:数据驱动的构建策略和训练融入知识的训练策略。前者从大规模电商图文语料库中构建多模态电商概念知识图谱(FashionMMKG),后者学习两种模态的图像-文本对的表示对齐,并通过将文本表示与FashionMMKG中时尚概念的视觉原型表示进行匹配,进一步得到概念对齐。
这项研究的意义在于,它为电商领域的图文检索任务提供了一种新的解决方案,同时也为跨模态数据的表示学习提供了新的思路。这一成果的入选,不仅证明了阿里云机器学习平台PAI在自然语言处理和多模态算法方面的领先地位,也为中国人工智能技术在国际上的竞争力注入了新的动力。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...