天天精选！度小满开源国内首个千亿参数金融大模型“轩辕”

【资料图】

记者26日从度小满获悉，近日，度小满正式开源国内首个千亿级中文金融大模型——“轩辕”。轩辕大模型是在1760亿参数的BLOOM大模型基础上训练而来，在金融名词理解、金融市场评论、金融数据分析和金融新闻理解等任务上，效果相较于通用大模型大幅提升，表现出明显的金融领域优势。

在金融场景中的任务评测中，轩辕全面超越了市场上的主流开源大模型，赢得了150次回答中63.33%的胜率，充分凸显了其在金融领域的显著优势。在通用能力评测中，轩辕有10.2%的任务表现超越ChatGPT3.5，61.22%的任务表现与之持平，涉及数学计算、场景写作、逻辑推理、文本摘要等13个主要维度。

为了提升轩辕大模型对金融领域问题的理解能力，度小满将自身业务中积累的金融领域的千亿tokens的中文预训练数据集用来训练模型。该数据集涵盖了金融研报、股票、基金、银行、保险等各个方向的专业知识。度小满表示，经过清洗和标注的高质量数据集，不仅在通用性方面与ChatGPT达到持平成为可能，且显著提升了模型在金融垂直领域的性能。

度小满CTO许冬亮表示，轩辕大模型是经度小满业务场景中积累的金融数据训练而来的，对金融相关问题的理解比通用大模型更有优势。我们把大模型能力开放给金融机构，有利于推动大模型在金融行业的应用，降低大模型的应用门槛，提升金融行业智能化水平。

据了解，度小满依托于百度人工智能技术，已经开展了一系列基于大模型的应用。以风险管理为例，度小满已经将大型语言模型LLM应用在互联网文本数据、征信报告的解读上，通过用文本数据构造的预训练模型以及AI算法，能够将征信报告解读出40万维的风险变量，更好的识别小微企业主的信贷风险。今年5月份，这一工程荣获了“吴文俊人工智能科学技术奖”。今年2月份，百度基于文心大模型技术推出的生成式对话产品“文心一言”（英文名：ERNIEBot）开放生态合作，度小满成为首家接入的金融科技公司。