在经过了此前的大量预热后,日前百度方面正式推出大语言模型“文心一言”。在此次发布会的现场,百度创始人、董事长兼CEO李彦宏从文学创作、商业文案、数理推算、中文理解,以及多模态生成五个方面展示了文心一言,结果显示,该大语言模型具备多场景综合能力。此外官方还透露,首批用户目前可通过邀请测试码在文心一言官网体验,未来则将会开放给更多用户。
其中例如在文学创作方面,文心一言能够将科幻小说《三体》的核心内容合理总结,并提供了五个续写《三体》的建议角度。此外该大语言模型还能够准确回答《三体》作者与电视剧角色扮演者的事实性问题,例如“《三体》的作者是哪里人”,并能在“于和伟和张鲁谁更高”这类问题中,通过推理能力给出答案。
而在商业文案创作方面,文心一言能够完成编写Slogan、新闻稿,以及给公司起名等创作要求。据了解,文心一言基于万亿级网页数据、5500亿事实知识图谱数据、百亿级语音日均调用数据,以及数十亿搜索数据和图片数据等进行了训练。
此外在数理推算方面,文心一言则能够正确理解“鸡兔同笼”这类逻辑题型、并给出正确解题步骤与答案。在中文理解方面,该模型也能够正确理解“洛阳纸贵”的含义、并运用对应的经济学理论创作藏头诗。而在多模态生成方面,文心一言可以根据限定条件创作海报,或是生成方言语音信息,并且在此次活动现场还展示了文心一言生成文本、图片、音频和视频的能力,但由于视频生成能力因成本较高等原因,目前尚未对所有用户开放,未来将会逐步接入。
对此,百度首席技术官王海峰表示,文心一言是基于ERNIE与PLATO系列模型研发,其中的关键技术则包括监督精调、人类反馈的强化学习、提示、知识增强、检索增强,以及对话增强。其中,前三项为同类大语言模型都会采用,ERNIE与PLATO也已有相应的应用与积累,并在文心一言中有着进一步强化和打磨,而后三项则是百度已有技术优势的再次创新。
【以上内容转自“三易生活网”,不代表本网站观点。如需转载请取得三易生活网许可,如有侵权请联系删除。】
延伸阅读: