0分!数字人直播挑战上海高考英语作文“翻车”了

好奇的友友们就要问了,之前高考语文作文都能hold住的AI数字人,为啥英语作文就搞不定呢?

基于此,甚至北京外国语大学教授王馥芳都提了更高的期望——希望去挑战一下专八。

学校要举办一个走进历史的活动,有三种活动的方式:第一种是制作短视频;第二种是拜访老战士;第三种是历史舞台剧。

梅德明教授对题目点评道,一定要紧扣“走进历史”的主题,以及形式上是一封信,在字数方面也要控制在150字左右。

不难看出,从作文内容结构上是较为完整的,并且像“Most importantly”、“Moreover”等词汇的应用,也让逻辑变得非常清晰。

并且梅教授还强调,如此点评,不是因为作文是出自数字人之手,而是把它看做是正常考生的答卷来看待的。

因为在上个月挑战题为《本手、妙手、俗手》语文高考作文时,她便已经展露出锋芒。

当时度晓晓平均1秒钟所生成的作文,让北京语文专家打出48分(满分60),并被点评为:

作文紧扣主题、立意明确,结构完整、语言流畅,而且还善于引经据典、使用修辞手法。

简单来说,它是一个能从大规模知识和海量数据中进行融合学习的大模型,并且具备效率高、效果好,以及通用性强等特点。

若是把文心大模型扒开来看,可以明显看到它可以分为三大类,分别是“基础通用大模型”、“任务大模型”和“行业大模型”。

它是一个任务知识增强的大模型,除了可以对无标注数据和知识图谱的学习之外,还可以通过持续学习,对百余种不同形式的任务数据学习。

在原理方面,ERNIE 3.0 Zeus在学习过程中主要使用的统一范式的多任务学习。

除此之外,ERNIE 3.0 Zeus层次化提示(Prompt)学习技术,通过层次化的Text Prompt库将百余种不同的任务统一组织成自然语言的形式,和海量无监督文本以及百度知识图谱联合学习。

而且还引入了层次化的Soft Prompt,如此一来便可以对不同任务之间的共性与特性进行建模。

也正是基于这样的能力,度晓晓便可以先去精准地理解英语作文的题目,然后根据体裁要求,构思和组织材料,完成英语作文的输出。

据了解,ERNIE-M构建了大小为25万的多语言词表,约1.5万亿字符。

第一阶段:从少量的双语语料中学习跨语言理解能力,使模型学到初步的语言对齐关系;

第二阶段:使用回译的思想,通过大量的单语语料学习,增强模型的跨语言理解能力。

这也就是度晓晓能够在完成英语作文的同时,还可以用韩语和法语等多个语言去写作的原因了。

那么在看完度晓晓挑战上海高考英语作文和其背后的能力之后,还有一个问题值得探讨:

首先,在内容生产的方式上,像度晓晓这种数字人的能力加持之下,正在向一种新的趋势发展——AIGC。

这是继UGC(用户生产内容)、PGC(专业生产内容)和OGC(职业生产内容)等内容生产方式之后的“新生代”。

至于这种内容生产方式背后所具备有的意义和价值,从百度研究院在今年年初所发布的科技趋势预测中便可窥见一二:

2022年AIGC借助大模型的跨模态综合技术能力,可以激发创意,提升内容多样性,降作成本,将实现大规模应用。

而早在度晓晓上个月挑战完语文作文之际,便有媒体感慨道:“AIGC元年已至”。

但除此之外,随着数字人背后的能力逐步披露,其所具备的更深层意义和价值也在渐渐浮现。

服务型数字人是百度的优势所在,产品类型丰富,从最早的企业服务场景已经延伸到营销、办公等领域。

这句看似“数字人已落地”的背后,更是在揭示其背后文心大模型的大规模落地。

王海峰当时认为,正因深度学习具备通用性,以及深度学习平台在不断发展,所以它们正在推动AI步入一种新的模式。

到了2020年,“企业版平台”被纳入到了飞桨的全景图之中,并且还发布了预训练模型的开发模式。

而在去年,百度集团副总裁吴甜则是提出企业AI应用三阶段:AI先行者探路、AI工作坊应用、AI工业大生产。

并且针对每一个阶段分别阐述了企业将面临的困难和挑战,以及相应的解决方案。

这一切的目标显然正是百度希望能够让大模型更快、更高效地在产业中铺开来用。

值得一提的是,此前百度“前无古人”地提出的行业大模型,并不是否定其它大模型厂商的分类模式。

这更像是站在传统大模型的基础上,为了让它更好地能被产业用起来,而提出的一种新范式。

而像度晓晓近来两次挑战高考语文和英语作文,可以说只是一种展现大模型已经能够很好地被用起来的一隅。

据了解,文心大模型目前已经在诸如保险、银行、农业、生物医药、工业、搜索,甚至是智能音箱等领域和场景中实现落地应用,在提高垂直业务效率的道路上不断探索前行。

那么接下来,在大模型逐渐与实际场景深入交织融合之下,还会产生怎样的效果,值得拭目以待了。

欢迎关注人工智能、智能汽车的小伙伴们加入我们,与AI从业者交流、切磋,不错过最新行业发展&技术进展。

About the author

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注