系统科学学报

综合新闻

独家 | 创新工场首席科学家周明:NLP 与金融「联

来源:系统科学学报 【在线投稿】 栏目:综合新闻 时间:2022-06-07

近两年大模型出现后,NLP 的能力大幅度提升,开始有人尝试基于 NLP 技术创业,但受疫情影响无法推行,很多科研者还在等待机会。也有将 NLP 当应用的公司,例如客服公司,但并非专门研究NLP。

澜舟科技是国内最早研究轻量化模型的公司之一。在研究「孟子」时,我们以为模型的能力会大幅削弱,但后来发现,如果轻量化模型的算法过关,加上知识的融入、数据的增强,轻量化模型有可能不输给大模型。这是非常了不起的一件事。

周明:针对自然语言的分析、理解、生成等通用任务,孟子的能力不低于大模型。此外,由于跟业务场景的密切结合,包括同华夏的紧密合作,我们知道问题的症结是针对性的,可以加入新数据或知识来提升下游任务的能力。

也因为金融的特殊性,场景过于复杂,需求太多样,到目前为止,还没有 NLP 公司能够在金融领域独霸。

再联想其他能力,NLP 几乎贯穿金融业务的所有环节,所以金融机构都重视 NLP 技术。但如何将NLP能力开发好、部署好,成本极低又能快速便捷地用起来,却是不容易做到的。

AI科技评论:在这次NLP与金融的联合中,「孟子」模型的落地如何体现?

周明:是的,尤其适合中国的用户。

周明:金融领域比较特殊,由于其数据不公开,大模型反倒不那么适用。应用在金融领域的模型最好有出色的适配能力,在拿到数据后能够快速适配,针对其任务特点快速迭代,这样的模型反倒能力强。

雷峰网雷峰网

周明博士是我国研究自然语言处理(NLP)的先驱者之一:

周明:我在2020年年底从微软亚洲研究院离开,到创新工场担任首席科学家,去年6月孵化了澜舟科技。澜舟科技的核心技术是自然语言理解,可以用于实现文本的智能理解、搜索、问答、摘要、翻译以及知识图谱等等。但具体落地,要找一个场景。

而轻量化模型对用户的压力非常小,一般情况下只用少量GPU,甚至有些任务只用CPU也可以,部署成本可以大幅降低,又快又准。即便性能也许比大模型差了一点,但在大部分用户看来是划算的。也是基于这样的市场,我们在成立澜舟科技时就决定做轻量化模型。

刚创立澜舟科技时,我就首先想到金融。那时候我就想,要进入金融领域,不能隔靴瘙痒,而是要有更紧密的合作。我们要了解金融的需求,金融方也要知道我们的技术长板和短板,所以我就开始寻找能够紧密合作的金融伙伴。

AI科技评论:能否简单介绍一下澜舟科技跟华夏基金共同成立金融NLP联合实验室的背景?

AI科技评论:训练「孟子」大概需要多少算力?

图注:2021年7月,「孟子」刷榜,在中文语言理解评测CLUE榜单的多项指标上登顶第一

周明:是的。在这里我要解释一下,金融是一个特殊的领域,不像有的领域可以实现相对标准化的服务,「AI+金融」或「金融+AI」在当前还没有定论。

AI科技评论:在金融这样一个特定场景中,是否更有利于「孟子」这类轻量化训练模型的发展?

我们共同认为,过去科技企业与金融公司的项目合作模式不够密切。项目制是甲方与乙方,对方拟好一个需求,我围绕需求提供技术、按时间交付,但技术的不断迭代需要科技与场景的紧密结合,所以我和陈一昕最终决定采用「联合实验室」的方式,把大家放在一个篮子里,AI 可以随着市场变化快速迭代,业务也可以更了解 AI。

另外,也要站在客户的角度考虑问题。在落地时,小模型的成本是最小的。我认为中国公司不能靠烧钱,像谷歌、微软一样,而是应该拼算法、拼智力、拼业务场景,这也是我们的特色,更可能成为我们的优势。

在提供给用户时,用户并没有感知到模型的大和小、快与慢、能力高或低,而只关心解决任务的能力。所以,在跟大模型的比较上,孟子反倒能胜出。

AI科技评论:项目制是目前?AI/NLP?与其他领域结合的主流合作形式吗?联合实验室是不是相对比较少?

基于「孟子」,我们希望可以在金融领域中做文档智能信息抽取、OCR、舆情分析、暴雷事件分析、报警、风控,也可以做国内外金融信息的抽取汇总和检索、年报的自动生成和和行情预判等等,还有金融行业需要的客服、获客、客户推荐优秀产品、客户跟踪、用户画像等。