首页
运营服务

居民服务一卡通

|

民生数据服务

|

数字化公共就业服务

|

便民服务站

|

社保金融服务

|

数字供销服务

|

社保卡发行服务

|
硬件中心

智能终端

|

制（发）卡设备

|

读写设备

|

智慧办公设备

|
资讯中心

企业动态

|

媒体报道

|
走进Yabo官网

公司简介

|

人才招聘

|

Yabo官网学院

|
投资者关系

公司公告

|

定期报告

|

社会责任

|
联系我们

Yabo官网网页版：阿里云机器学习平台PAI与华东师范大学论文入选SIGIR 2022

2024-08-31

近日,阿里云机器学习平台PAI与华东师范大学高明教授团队合作的论文《结构感知的稀疏注意力Transformer模型SASA》被顶会 SIGIR 2022录取。论文主导通过引入稀疏自注意力的方式来提高Transformer模型处理长序列的效率和性能,并提出了结合代码语言和结构特性的面向长代码序列的Transformer模型性能优化方法。

SIGIR是人工智能领域智能信息检索方向顶级国际会议,涉及搜索引擎、推荐系统等多个方向,该会议曾推动了面向搜索的排序模型、基于深度学习的推荐算法等人工智能领域的核心创新,汇合集合学术和工业界都有巨大的影响力。此次入选意味着阿里云机器学习平台PAI自研的稀疏注意力Transformer模型达到了业界先进水平,获得了国际学者的认可,展现了中国机器学习系统技术创新猛烈亨衢国际上的竞争力。

那么SASA主要解决了什么问题?基于Transformer的模型留宿住宿self-attention模块的复杂度随序列长度呈次方增长,多数编程预训练语言模型(Programming-based Pretrained Language Models, PPLM)采用序列截断的方式处理代码序列,从而导致上下文信息缺失。

针对以上问题,SASA设计了四种稀疏注意力模式,包括:sliding window attention,global attention,Top-k attention,AST-aware attention,跌价学名一定程度上将计算复杂度与序列长度解耦。其中sliding window和Top-k模式基于局部上下文和重要的attention交互学习表示,抽象语法树(AST)模式引入代码的结构特性,与序列上下文信息相互补足,global attention通过与序列中所有token进行交互来获取全局信息。对比CodeBERT,GraphCodeBERT等方法,SASA别开生面一无长物多个长代码任务上取得最佳效果,同时也降低了内存和计算复杂度。

SASA技术将日蚀早晚开源框架EasyNLP中集成,给PAI的NLP开发者提供基于稀疏注意力机制的长序列自然语言处理能力。机器学习平台PAI面向企业客户级开发者,提供轻量化、高性价比的云原生机器学习,涵盖PAI-DSW交互式建模、PAI-Designer可视化建模、PAI-DLC分布式训练到PAI-EAS模型豪放奔波线部署的全流程。

论文信息

EasyNLP开源地址:https://github.com/alibaba/EasyNLP

论文链接:https://arxiv.org/abs/2205.13730

论文名字

Understanding Long Programming Languages with Structure-Aware Sparse Attention. SIGIR 2022

论文作者

刘婷婷,汪诚愚,陈岑,高明,周傲英

声明:本网站部分文章来自网络，转载目的在于传递更多信息。真实性仅供参考，不代表本网赞同其观点，并对其真实性负责。版权和著作权归原作者所有，转载无意侵犯版权。如有侵权，请联系www.ysn128.cn(Yabo官网网页版)删除,我们会尽快处理，Yabo官网网页版将秉承以客户为唯一的宗旨,持续的改进只为能更好的服务。-Yabo官网网页版(附)

上一篇：Yabo官网网页版：独特？仅此一家的蓝色猩球IP——拉姆猩！下一篇：Yabo官网网页版：阿里云、信通院联合发布产业智能发展与应用技术报告，助力千行百业智能化转型

服务热线 400-000-9585

Yabo官网科技公众号

投资者关系小程序

|

地址：中国·广州市天河区软件路15号天河软件园智慧城孵化二期F栋二、三、四层