继此前在今年11月发布基于Transformer架构的全栈自研、千亿级参数大模型夸克后,日前阿里巴巴智能信息事业群方面宣布,夸克大模型已通过备案,将陆续在通识、健康、创作等领域升级内容产品与智能工具,落地一系列AIGC(生成式人工智能)创新应用。
据了解,夸克大模型在CMMLU大模型性能评测中位列榜首,号称整体能力已经超过GPT-3.5,在写作、考试等部分场景中优于 GPT-4。在国内专业考试测试中,夸克大模型高考成绩接近满分,并以486分通过临床执业医师资格考试,还具备对不良、虚假信息识别、回答和指引的出色能力。
对此夸克方面相关负责人表示,夸克大模型是面向搜索、生产力工具和资产管理助手的应用型大模型,其中在搜索应用中,其将通过图文多模理解、专业知识生成、交互方式创新进一步拓宽应用场景,提升用户体验。
据夸克技术负责人蒋冠军透露,与其他大模型产品相比,夸克大模型的优势之一为在研发过程中发挥了夸克在搜索引擎和数据上的优势。他表示,夸克搜索数据库的网页总量是千亿级别,在这千亿级别的网页里,夸克筛选出几亿个质量特别高的网页做训练,“如果不是做搜索引擎的厂商,要完成这项任务,代价将非常高”。
并且蒋冠军还指出,基于搜索技术能力的积累,也让夸克大模型在解决模型幻觉问题时更有优势。“搜索引擎在处理大规模的网页数据时,本身就需要一套工程体系,去做对齐、去重、分析等工作,这些能力与大模型所需的能力非常匹配”。
据相关数据显示,夸克大模型在科普问答方面的纯模型幻觉率是25%,远低于行业水平。而在通用知识方面,夸克大模型的错误率为15%以下,在医疗健康领域,夸克大模型的错误率可以降到5%以下。
【以上内容转自“三易生活网”,不代表本网站观点。如需转载请取得三易生活网许可,如有侵权请联系删除。】
延伸阅读: