分享到:
11月11日下午,2138cn太阳集团古天乐第五期金融科技系列讲座以线上形式举行,讲座邀请了香港人工智能金融科技实验室研究员、香港城市大学博士后王子剑作了题为“自然语言处理在金融中的应用”的学术报告,讲座由2138cn太阳集团古天乐副研究员裴有权主持。
王子剑以自然语言处理在金融领域的具体应用为核心,先是介绍了自然语言处理(NLP)的概念、研究对象以及金融NLP的应用场景,随后从统计学、机器学习和深度学习三个角度,对金融新闻文本和上市公司年报文本两种数据类型,进行了从词到句到文章的递进式分析。针对金融新闻文本,他利用Wind数据库搜集了2013-2021年的金融新闻,进行数据清洗后,通过Jieba分词包选取高频词汇作为研究对象。进一步地,他采用统计方法构建模型对高维数据进行了降维处理,该步骤中包含两个模型,分别是使用PCA方法和线性因子回归模型构建的FarmPredict、假设词频向量服从多项式分布的SESTM,利用这两个模型可以找到金融新闻中的正向和负向情感词。此外,他构建了情绪价值不同的投资组合,发现好新闻对应的投资组合的平均收益率最高,同时还总结了新闻事件对股价影响的时效性。在债券市场上,王子剑利用模型选取的词汇和专家打分的情绪词典构建了发债人违约概率预警系统,通过有监督的机器学习算法对发债人进行了评级排序,从而对违约企业作出提前预警。针对上市公司年报文本,王子剑指出,同样可以利用NLP的语言模型提取信息。他介绍了基于深度学习的NLP模型的发展历程和分类,通过图表展示了不同类型NLP模型的区别和适用的不同任务。他还介绍了基于这些语言模型处理年报文本的流程,展示了基于分析结果的可视化处理。讲座最后,王子剑对讲座的内容进行了总结,提出了未来NLP模型应用的方向,并与参会人员就模型构建、数据来源、数据处理、开源中文NLP项目等问题进行了讨论。
自然语言处理技术的应用不仅能提升金融的效率和准确率,而且在一定程度上,能够让金融行业从业者从繁重的文书处理工作中解脱。本次讲座有助于参会者了解自然语言处理赋能金融的落地实践,掌握金融科技发展最新动态。
王子剑,香港人工智能金融科技实验室研究员、香港城市大学博士后,博士毕业于上海财经大学,美国堪萨斯大学访问学者。主要研究方向涉及金融风险管理、机器学习、自然语言处理,研究成果发表在《中国科学:数学》、《中国管理科学》等学术期刊。2021年加入香港人工智能金融科技实验室,从事金融文本分析、资产定价、中国债券评级模型研发、新闻情感分析、人工智能报告项目等。
图文|王怡萌