🎉 Gate xStocks 交易开启啦,现货、合约、Alpha齐上线!
📝 在Gate广场发帖,晒出你的交易体验或精彩截图,瓜分$1,000大奖池!
🎁 广场优质创作者5名,每人独享$100合约体验券!
🎉 帖文同步分享到X(推特),浏览量前十再得$50奖励!
参与方式:
1️⃣ 关注 @Gate广场_Official
2️⃣ 带 #Gate xStocks 交易体验# ,原创发帖(不少于20字,仅用活动标签)
3️⃣ 若分享到推特,请将链接提交表单:https://www.gate.com/questionnaire/6854
注:表单可多次提交,发布更多帖文可提升获奖机会!
📅 7月3日16:00—7月9日24:00(UTC+8)
详情:https://www.gate.com/announcements/article/45926
每一条体验,都有机会赢取大奖!快在Gate广场show出你的操作吧!
金融业大模型应用:从焦虑到理性 算力成本与人才成关键
人工智能大模型在金融业的应用:从热情高涨到理性回归
ChatGPT问世以来,迅速在金融业引发了焦虑感。这个对技术有信仰的行业唯恐被一个飞奔中的时代洪流甩在身后。这种焦灼氛围,甚至一度蔓延到清净的寺庙。有业内人士表示,她在5月份去大理出差时,在寺庙里都能碰到和她谈论大模型的金融从业者。
不过,这种焦虑正在慢慢归于平常,人们的思路也开始变得清晰和理性。有专家描述了今年金融业对大模型态度的几个阶段:二三月,普遍感到焦虑,担心落后;四五月,纷纷组建团队开展工作;之后几个月,在寻找方向和落地上遇到了困难,开始变得理性;现在,他们关注标杆企业,尝试验证过的场景。
一个新趋势是,不少金融机构已将大模型提升到战略层面。据不完全统计,A股上市公司中,至少有11家银行在最新半年报中明确提出正在探索大模型的应用。从近期动作看,他们也正在从战略层面和顶层设计层面进行更清晰的思考和路径规划。
从热情高涨到理性回归
"比起几个月前,现在能明显感觉金融客户对大模型的理解好了很多。"有资深人士表示,年初ChatGPT刚出来时,大家的热情虽高,但对于大模型究竟是什么、该怎么用,其实了解得非常有限。
这一阶段,一些大型银行率先行动,开始做各种"蹭热度"的宣传。比如今年3月,某银行上线了类ChatGPT的大模型应用。但业界评价不一。当时,有人认为,这个产品的名字强调了ChatGPT里不那么重要的Chat,反而忽略了GPT这个真正重要的部分。
与此同时,随着国内多家科技公司陆续发布大模型,一些头部金融机构的科技部门开始积极与大厂洽谈大模型建设事宜。这些金融机构普遍希望自己建立大模型,需要厂商指导数据集制作、服务器采购和训练方法等。有金融科技公司甚至提出,完成后是否还能向同业输出。
5月份以后,情况逐渐发生变化。受制于算力资源紧缺、成本高昂等因素,很多金融机构开始从单纯希望自建算力和模型,转向更加关注应用价值。"现在每一家金融机构都在关心其他机构用大模型做了什么,实现了怎样的效果。"
具体到不同规模的企业,也分出了两条路径。拥有海量金融数据和应用场景的大型金融机构,可引入领先的基础大模型,自建企业大模型,同时采用微调形式,形成专业领域的任务大模型,快速赋能业务,以弥补大模型建设周期过长的缺点。而中小金融机构可综合考虑投资回报,按需引入各类大模型的云服务或私有化部署,直接满足赋能需求。
不过,由于金融行业对数据合规性、安全性、可信性等要求很高,部分人士认为,这一行业的大模型落地进展,实际略滞后于年初预期。有专家表示,他们最初预测金融行业可能会最先大规模使用大模型,但从最终对接客户的情况来看,金融行业不如法律、招聘等行业进展快。
一些金融机构已经开始想办法,解决大模型落地过程中的各种限制。
在算力方面,业内人士观察到几种解决思路:
第一,直接自建算力,成本较高,但安全性足够。适用于实力雄厚、希望自建行业或企业大模型的大型金融机构。
第二,算力混合部署,在敏感数据不出域的情况下,接受从公有云调用大模型服务接口,同时通过私有化部署处理本地数据。这种方式成本较低,只需投入几十万元购买几张计算卡即可满足需求,适用于资金相对有限、按需应用的中小型金融机构。
不过,即便如此,很多中小机构仍然面临买不到也买不起大模型所需GPU卡的难题。针对这个问题,有消息称,监管部门正在研究是否能以折中方式,牵头搭建面向证券行业的大模型基础设施,集中算力和通用大模型等资源,让行业中的中小金融机构也能使用大模型服务,防止它们在技术上落后。
不仅是算力,随着最近半年多对大模型的落地探索,不少金融机构也逐渐加强了数据治理。
有专家介绍,目前除了在数据治理领域有成熟实践的头部大行,越来越多的中型金融机构也开始构建数据中台和数据治理体系。他认为,构建完善的数据治理体系和数据湖技术平台,将是未来金融机构IT建设的重要主题。
也有银行正通过大模型+MLOps方式解决数据问题。例如某银行采用MLOps模式建立大模型数据闭环体系,实现了整个流程的自动化,以及多源异构数据的统一管理和高效处理,据悉目前已构建和沉淀2.6TB高质量训练数据集。
从外围场景切入
过去半年多,无论是大模型服务商,还是各大金融机构,都在积极寻找应用场景。智慧办公、智能开发、智慧营销、智能客服、智慧投研、智能风控、需求分析等领域都被广泛探索。
正如某金融科技公司高管所说,"金融业务链条上每一个关键职能,都值得用大模型技术重做一次。"该公司最近发布了金融大模型,并与合作机构内测共建面向金融产业的大模型产品,目标是为理财顾问、保险代理、投研、金融营销、保险理赔等金融从业专家打造全链条的AI业务助手。
各家金融机构对大模型都有丰富的构想。有银行称内部已有20多个场景投放应用,另一家银行表示他们在30多个场景中进行了试点,某证券公司则正在探索将大模型和此前推出的虚拟数字人平台打通。
但在真正将大模型落地到业务中时,普遍共识是先内部后外部。毕竟,当前阶段大模型技术并不成熟,比如存在幻觉问题,而金融行业却是一个强监管、高安全、高可信的行业。
有专家认为,短期内不建议直接面向客户使用大模型。金融机构应优先将大模型用于金融文本和金融图像分析理解创作的智力密集型场景,以助手形式实现人机协同,提升业务人员工作效率。
目前,代码助手已在不少金融机构落地。例如某银行构建了基于大模型的智能研发体系,编码助手生成代码量占总代码量的比值达到40%。在保险领域,某保险公司研发了基于大模型的辅助编程插件,直接嵌入内部开发工具。
智慧办公领域也有不少落地案例。有专家介绍,他们基于金融大模型推出的网点问答系统,在某银行上线后已推广到几百个网点,答案采纳率超过85%。目前,这一解决方案又快速复制到其他银行和金融机构。
不过,业内人士判断,这些已广泛落地的场景,实际还不是金融机构的核心应用,大模型距离深入金融行业的业务层面还有一定距离。
有专家预测,到今年底之前,会有一批真正在金融机构核心业务场景中使用大模型的项目建设或招标信息出现。
在此之前,一些顶层设计层面的改变正在进行。有学者判断,未来的整个智能化、数字化系统,都将重新建立在大模型的基础之上。这就要求金融行业在推动大模型落地过程中,重新架构系统。同时,也不能忽视传统小模型的价值,而应该让大模型、小模型协同起来。
这一趋势已在金融行业得到广泛体现。目前金融机构试点大模型,基本采取分层模式。不同于过去一个场景需要搭建一个平台的烟囱化模式,大模型给了金融机构一个从零开始,更科学地进行整体系统规划的机会。
可以看到,目前已有多家头部金融机构基于大模型,搭建了包含基础设施层、模型层、大模型服务层、应用层等多个层级的分层系统框架。
这些框架体系普遍有两大特点:其一,大模型发挥中枢能力,将传统模型作为技能进行调用;其二,大模型层采用多模型策略,内部比较,选出最优效果。
实际上,不只金融机构,在当前格局未定的情况下,一些大模型应用提供商也在采用多模型策略,优选服务效果。有专家透露,他们的底层模型层融合了大量大语言模型,会根据每个大模型返回的回答,组装优选后给到用户。
人才缺口依然庞大
大模型的应用,已经开始对金融行业的人员结构带来一些挑战和变革。
此前有消息称,随着ChatGPT的出现,一家金融科技公司从今年初到5月底已裁掉300多位大数据分析师。而在几年前,这还是一个炙手可热的职业。这一度引发从业者的焦虑,甚至开始提前考虑下一代的择业问题。
来自某银行的专家也分享了大模型对人的替代效应。该行原来每天早上都有实习生将各方面信息归纳汇总,再给到投研部门,但现在这些工作可以通过大模型完成。
不过,一些银行其实并不希望大模型带来减员。例如拥有20万网点员工的某大行就明确表示,他们不希望员工被大模型取代,而是希望大模型带来新机会,提升员工的服务质量和工作效率,同时也释放出部分员工,从事更多高价值的工作。
这其中不乏对人员和结构稳定性的考虑。但另一方面,也是因为很多岗位还存在人才缺口。
有专家表示,大型银行有大量工作需要完成,部分IT需求的工期甚至排到了明年年底。他们希望大模型能帮助员工完成更多工作,提高效率和速度,而不是带来人员缩减。
更重要的是,大模型的快速发展使得短时间内稀缺人才供给难以满足激增的需求。这就好比当初iPhone刚出现时,大家想开发应用,却很难找到iOS程序员一样。
在近期的一场金融科技大会上,某银行高管总结了金融行业目前在将大模型能力用到核心业务流程中会遇到的6大挑战,其中之一就是人才短缺。他提到,他们最近招聘的新员工中,学习AI领域的占比很高,但了解大模型的人才却很少。
有专家对此深有体会,最近他们收到一家银行客户的人才支援请求。这家银行因自建的大模型团队中有人暂时请假,模型训练工作面临人手不足问题,不得不临时寻求外部支持。
"现在这方面的人才确实很少,还需要一定时间来培养。"该专家认为,直接应用大模型的人才需求相对简单,主要需要会提问的人。但如果要自建行业或企业大模型,则需要金融机构拥有一支精干的垂直大模型技术团队。
另一位专家也坦言,AI大模型领域的人才缺口非常大,头部机构目前都在招聘AI专业相关人才,如算法博士等。这是因为,金融客户虽然能从大模型厂商获得技术支持,但他们毕竟是最终使用方和创新主导方,需要一定的人才积累来支撑AI大平台的构建、各项AI应用的规划,以及在建模、调优和精调过程中,与大模型厂商合作进行场景叠加、模型叠加等优化,不断拓展AI模型应用的范围和效果。
一些参与者已经采取行动。有公司联合某银行实验室的人力资源团队,梳理了大模型在企业应用中的人员转型实践,设计出系列培训