阿里云获 FewCLUE 双料冠军!
自然语言理解的格局正悄然发生巨变。 日前, 中文语言理解权威评测基准CLUE公布了小样本学习评测榜单FewCLUE的最新结果: 阿里巴巴在大模型和无参数限制模型两项赛事中双双刷新榜单最好纪录,仅次于“人类”,并在极少(一个类别仅十余个)样本条件下,超过了新闻文本分类上的人类识别精确度。 这证明了AI小样本学习在NLP任务上具备超越人类的能力。 众所周知,预训练模型在特定自然语言处理任务上要取得高精度的成本非常高,科研人员进而转向攻关小样本学习技术,希望用较低的成本实现可观的识别精确度。 阿里云机器学习平台PAI和和达摩院共同提出了一种大模型+小样本的联合方案: 在大规模通用预训练基础之上,将亿级知识图谱融入预训练模型,打造了强大的底座KGBert,结合Fuzzy-PET少样本学习,在多个任务上比预训练微调技术提升近25%了准确率,甚至在一个小样本学习任务上的精准度超过了人类。 例如,在智能客服场景下的用户需求识别,仅需人工标注几十条样本,就能让需求识别的准确率达到90%。 目前,这项小样本学习技术已在阿里巴巴的实际场景落地且有很好的业务表现。 阿里云智能客服云小蜜仅用20条样本就可以做到快速冷启动,实现精准问答,准确率超过80%,并在政务、金融、通用线多个业务场景落地。开发者可基于PAI直接调用行业解决方案,也可以二次开发打造自己的模型。 FewCLUE FewCLUE是CLUE最新推出的一项中文小样本学习评测榜单,包括大模型和无参数限制模型双赛道,用来评估预训练模型是否能够通过小样本学习来掌握特定的自然语言处理任务。 基于这项评估,科研人员可以更精准的衡量预训练模型的泛化性和准确率。 |
全部评论
暂无评论
最新文章
-
1大模型数量国内第一!百度智能云国内首家支持Llama3全系列训练推理
-
2华为云推动土耳其数据库技术创新,“土耳其数据库先锋计划”正式启动
-
3鹅厂造了一座「桥」!腾讯云让主机搬家~
-
41299 万元,中兴新云中标财务共享建设项目
-
5新版本新能力,华为云 OceanBase 为何要打造实时分析数据库
-
61473.8万元,浪潮云中标重庆职业技能公共实训中心智联驾驶技术实训项目
-
7基于阿里云通义千问!央视《新闻联播》点赞中国一汽大模型应用!
-
8腾讯云4月8日故障复盘及情况说明
-
9天翼云大模型首次接入天文望远镜!基于通义千问,“星语3.0”发布
-
10IDC发布2023年中国整体超融合市场报告,深信服第一
热点排行
-
1文件存储 NAS 和 对象存储 OSS 的区别
-
2天翼云云电脑 | 让电视一秒变身电脑
-
3阿里工程师太凶残了,竟把服务器泡在“水里”!
-
4腾讯云 | 想在微信群里发起9人以上的语音聊天怎么办?
-
5数据仓库终结者:Dremio
-
62020年云服务器哪家强:阿里云、腾讯云、华为云、UCloud测评报告
-
72020 年 Q1 中国云市场份额:阿里云第一、华为云跃居第二、腾讯云下降为第三
-
8阿里云 web 应用防火墙(WAF)价格:179元/年
-
92020 Q1 中国公有云市场份额 TOP3:阿里云、腾讯云、华为云
-
10郑大一附院系统瘫痪 2 小时,运维人员被判 5 年半:破坏计算机信息系统罪
有话要说