百度生成式AI产品文心一言邀请测试,李彦宏详解三大产业机会

3月16日起,首批用户即可通过邀请测试码,在文心一言官网体验产品,后续将陆续开放给更多用户。此外,百度智能云即将面向企业客户开放文心一言API接口调用服务。

蓝鲸TMT频道3月16日讯,今日,百度公布了文心一言的邀请测试方案。百度创始人、董事长兼首席执行官李彦宏及百度首席技术官王海峰出席,并展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。

据了解,3月16日起,首批用户即可通过邀请测试码,在文心一言官网体验产品,后续将陆续开放给更多用户。此外,百度智能云即将面向企业客户开放文心一言API接口调用服务。3月16日起正式开放预约,搜索“百度智能云”进入官网,可申请加入文心一言云服务测试。

从现场展示来看,文心一言某种程度上具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性都逐渐接近人类水平。但李彦宏也多次提及,这类大语言模型还远未到发展完善的阶段,进步空间很大,未来这段时间它一定会飞速发展,日新月异。

在文学创作场景中,文心一言根据对话问题将知名科幻小说《三体》的核心内容进行了总结,并提出了五个续写《三体》的建议角度,体现出对话问答、总结分析、内容创作生成的综合能力。此外,文心一言准确回答了《三体》作者、电视剧角色扮演者等事实性问题。面对“于和伟和张鲁一有哪些共同点”、“于和伟和张鲁一谁更高”这类问题,文心一言也基于推理能力得出了正确答案。

连续三次内容创作生成中,文心一言既能准确理解人类意图,又能清晰地表达,这是基于庞大数据规模而发生的“智能涌现”。文心一言大模型的训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及5500亿事实的知识图谱等。

文心一言还具备了一定的思维能力,能够学会数学推演及逻辑推理等相对复杂任务。面对“鸡兔同笼”这类锻炼人类逻辑思维的经典题,文心一言能理解题意,并有正确的解题思路,进而像学生做题一样,按正确的步骤,一步步算出正确答案。

多模态生成方面,李彦宏现场展示了文心一言生成文本、图片、音频和视频的能力。文心一言甚至能够生成四川话等方言语音;文心一言的视频生成能力则因成本较高,现阶段还未对所有用户开放,未来会逐步接入。

人类进入人工智能时代,IT技术的技术栈发生了根本性变化,从过去三层到“芯片-框架-模型-应用”四层。李彦宏认为,百度AI全栈布局的优势在于,可以在技术栈的四层架构中实现端到端优化,大幅提升效率。尤其是框架层和模型层之间,有很强的协同作用,可以帮助构建更高效的模型,并显著降低成本。

王海峰表示,文心一言,是新一代知识增强大语言模型,是在ERNIE及PLATO系列模型的基础上研发的。它的关键技术包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。前三项是这类大语言模型都会采用的技术,ERNIE和PLATO中也已经有应用和积累,在文心一言中又有了进一步强化和打磨;后三项则是百度已有技术优势的再创新,也是文心一言未来越来越强大的基础。

同时,王海峰透露,相比于其他语言来说,文心一言在中文语言训练方面要更加成熟。在人类反馈的强化学习方面,文心一言会接收到人类反馈,加强奖励模型,再进行策略优化;在知识增强方面,大模型会通过语义学习和数据构造进行知识内化,再通过知识推理和提示构建进行知识外用;在检索增强方面,会基于语义理解和匹配的新一代检索架构;在对话增强方面,通过记忆机制和上下文理解,形成更好的对话规划。

在模型层,文心大模型已经包括36个大模型,涵盖基础大模型、任务大模型、行业大模型的三级体系。目前,文心大模型已大规模应用于搜索、信息流、智能音箱等互联网产品并通过飞桨开源开放平台、百度智能云赋能工业、能源、金融、通信、媒体教育等各行各业。王海峰表示,具有算法、算力和数据综合优势的企业,可以将模型生产的复杂过程封装起来,通过低门槛、高效率的生产平台,为千行百业提供大模型服务。这样,大数据、大算力、大模型能力仅需少数企业操心,千行百业直接应用即可。

李彦宏预测,大语言模型将带来三大产业机会。第一类是新型云计算公司,其主流商业模式从IaaS变为MaaS。文心一言将根本性地改变云计算行业的游戏规则。文心一言将通过百度智能云对外提供服务,帮助企业构建自己的模型和应用。

第二类是进行行业模型精调的公司,这是通用大模型和企业之间的中间层,他们可以基于对行业的洞察,调用通用大模型能力,为行业客户提供解决方案。

第三类是基于大模型底座进行应用开发的公司,即应用服务提供商。李彦宏断言,对于大部分创业者和企业来说,真正的机会是基于通用大语言模型抢先开发重要的应用服务,这可能才是真正的机会。目前,基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景,已经涌现出很多创业明星公司,可能就是未来的新巨头。

据了解,百度近十年累计研发投入超过1000亿元。2022年百度核心研发费用 214.16亿元,占百度核心收入比例达到22.4%。2021年,百度总体研发投入强度为20.03%。2020年,百度研发投入强度达18.22%。自2月份百度官宣“文心一言”以来,已有超过650家企业宣布接入文心一言生态。