大语言模型在证券行业的应用与测评分析

一、引言

随着大语言模型(LLM)的崛起,其在自然语言理解和复杂任务解决方面的强大能力备受瞩目。从OpenAI的ChatGPT到GPT-4,再到各开源大语言模型如Llama-2、Falcon、ChatGLM3等,这些模型展现了强大的多模态信号处理能力,特别是在金融领域的应用前景广阔。金融大语言模型如Bloomberg GPT和XUANYUAN,已在金融证券领域展现出巨大潜力,成为处理金融问题的强大工具。

二、证券行业大模型研发进展

在证券行业,大模型技术的应用逐渐从零售经纪业务扩展到多个领域。头部券商积极探索大模型技术在智能客服、数字化投行、智能投研、智能协作等细分应用领域的实际应用,中小券商也在积极利用AIGC技术提升自身的内容输出水平。基于大模型技术的语义理解和内容生成能力,行业内已有多家财富管理机构将其应用于生成符合要求的营销文案和推广策略,以提高营销效果和用户转化率。

三、SecPile金融与通用数据集

我们构建了SecPile数据集,用于微调训练和评测。该数据集包含金融和通用两个子集,金融子集由司内沉淀的问答数据和金融行业公开知识数据组成,确保了数据的时效性和准确性。通用子集则涵盖了多领域任务的高质量数据集,为模型在多领域、多场景下的训练和优化提供了丰富的资源。

四、模型训练与调优过程

我们基于ChatGLM3-6B-Base作为基模型,并优化其结构和训练配置,通过小型高质量指令数据集进行微调,验证其在证券领域工作助手的有效性。最终,我们微调训练成了XCGLM证券垂类大语言模型,并通过SecScope评测集评估了该模型在通用能力和金融能力方面的表现。

五、SecScope通用与金融能力评测

通过C-Eval、CMMLU、MMLU和AGIEval四个评测集评估模型的逻辑推理和数学计算能力,同时构建专门的意图识别评测集评估模型对文本意图的理解能力。在金融领域,我们设计了SecScope测试集评估XCGLM在证券领域任务的表现,包括金融能力评估、摘要生成、关键词提取、实体识别和情感分析五部分。

六、总结与展望

本文证明了利用小型高质量指令数据集微调大语言模型的有效性,为构建特定领域工作助手提供了经验。未来,大模型的发展将更加侧重垂直领域应用,结合业务场景发挥相应价值。对于证券行业,大模型赋能券商业务是我们深入研究的方向。随着大模型的能力逐步提升,大模型Agent与RPA机器人的结合是我们持续探索和落地的方向。

文章作者署名(姓名、单位、职务)

邓纲(湘财证券股份有限公司总裁助理、信息技术中心总经理) 李鹏(湘财证券股份有限公司、信息技术中心大数据开发岗) 吴星谕(湘财证券股份有限公司、信息技术中心量化策略与数据分析岗) 王郑毅(湘财证券股份有限公司、信息技术中心大数据开发岗) 刘文贵(湘财证券股份有限公司、信息技术中心需求分析管理岗)

发表评论

评论列表

还没有评论,快来说点什么吧~