Aplicación de modelos grandes en el sector financiero: de la ansiedad a la racionalidad, el costo de la potencia computacional y el talento se convierten en claves.

Aplicación de grandes modelos de inteligencia artificial en la industria financiera: de la gran euforia al retorno racional

Desde el lanzamiento de ChatGPT, ha generado rápidamente una sensación de ansiedad en la industria financiera. Este sector, que tiene fe en la tecnología, teme quedar rezagado por el torrente de una era en rápida evolución. Esta atmósfera de inquietud incluso se ha extendido a templos tranquilos. Según una profesional del sector, durante su viaje de negocios a Dali en mayo, pudo encontrarse en un templo con profesionales de finanzas que hablaban sobre modelos grandes.

Sin embargo, esta ansiedad está lentamente volviendo a la normalidad, y el pensamiento de las personas también está comenzando a volverse claro y racional. Algunos expertos han descrito las varias etapas de la actitud de la industria financiera hacia los grandes modelos este año: en febrero y marzo, había una ansiedad generalizada, preocupados por quedarse atrás; en abril y mayo, muchos comenzaron a formar equipos para trabajar; en los meses siguientes, encontraron dificultades en la búsqueda de dirección y en la implementación, y comenzaron a volverse racionales; ahora, están enfocados en empresas de referencia, tratando de validar escenarios comprobados.

Una nueva tendencia es que muchas instituciones financieras han elevado los grandes modelos a un nivel estratégico. Según estadísticas incompletas, al menos 11 bancos en las empresas que cotizan en A-shares han expresado claramente en sus últimos informes semestrales que están explorando la aplicación de grandes modelos. A partir de las acciones recientes, también están llevando a cabo un pensamiento y una planificación de caminos más claros desde un nivel estratégico y de diseño de alto nivel.

De la pasión elevada a un regreso racional

"En comparación con hace unos meses, ahora se puede sentir claramente que los clientes financieros han mejorado mucho su comprensión sobre los modelos grandes." Un experto señaló que, a principios de año, cuando ChatGPT apenas había salido, aunque había mucho entusiasmo, en realidad la comprensión de lo que eran los modelos grandes y cómo usarlos era muy limitada.

En esta etapa, algunos grandes bancos han tomado la delantera y han comenzado a hacer diversos anuncios de "aprovechamiento de la tendencia". Por ejemplo, en marzo de este año, un banco lanzó una aplicación de modelo grande similar a ChatGPT. Sin embargo, las opiniones en la industria son diversas. En ese momento, algunos pensaron que el nombre de este producto enfatizaba el Chat, que no es tan importante en ChatGPT, y en cambio, pasaba por alto la parte realmente importante que es el GPT.

Al mismo tiempo, a medida que varias empresas tecnológicas nacionales lanzan modelos grandes, algunos departamentos de tecnología de importantes instituciones financieras comienzan a negociar activamente con grandes empresas sobre la construcción de modelos grandes. Estas instituciones financieras generalmente esperan establecer sus propios modelos grandes y requieren la orientación de los proveedores sobre la producción de conjuntos de datos, la adquisición de servidores y los métodos de entrenamiento, entre otros. Algunas empresas de tecnología financiera incluso han planteado si, una vez completado, podrán exportar a otros en la misma industria.

A partir de mayo, la situación empezó a cambiar gradualmente. Debido a la escasez de recursos de computación y a los altos costos, muchas instituciones financieras comenzaron a pasar de desear construir su propia capacidad de computación y modelos a enfocarse más en el valor de la aplicación. "Ahora, cada institución financiera está interesada en lo que otras instituciones han logrado con grandes modelos y qué resultados han conseguido."

Específicamente para empresas de diferentes tamaños, se han delineado dos caminos. Las grandes instituciones financieras que poseen una gran cantidad de datos financieros y escenarios de aplicación pueden introducir modelos de base avanzados, construir sus propios modelos empresariales y, al mismo tiempo, utilizar un enfoque de ajuste fino para crear modelos de tareas en áreas especializadas, lo que permite empoderar rápidamente los negocios para compensar la desventaja del largo ciclo de construcción de modelos grandes. Por otro lado, las instituciones financieras pequeñas y medianas pueden considerar el retorno de inversión y, según sus necesidades, introducir servicios en la nube de varios modelos grandes o implementar su propia infraestructura, satisfaciendo directamente la demanda de empoderamiento.

Sin embargo, debido a que la industria financiera tiene altos requisitos de conformidad, seguridad y confiabilidad de los datos, algunas personas creen que el avance de los grandes modelos en esta industria está, en realidad, ligeramente rezagado en comparación con las expectativas iniciales de principios de año. Algunos expertos indican que inicialmente predijeron que la industria financiera podría ser la primera en adoptar grandes modelos a gran escala, pero en comparación con la situación de la integración final con los clientes, el sector financiero no avanza tan rápido como las industrias de derecho, reclutamiento, entre otras.

Algunas instituciones financieras ya han comenzado a buscar formas de resolver las diversas limitaciones en el proceso de implementación de grandes modelos.

En términos de capacidad de cálculo, los expertos de la industria han observado varias soluciones:

Primero, construir la capacidad de cálculo directamente, el costo es alto, pero la seguridad es suficiente. Es adecuado para instituciones financieras grandes y poderosas que desean construir un modelo grande para la industria o la empresa.

En segundo lugar, la implementación híbrida de potencia de cálculo, acepta la llamada a la interfaz de servicio de grandes modelos desde la nube pública sin que los datos sensibles salgan del dominio, al mismo tiempo que se procesan los datos locales mediante una implementación privatizada. Este enfoque tiene un costo relativamente bajo, ya que solo se necesita invertir decenas de miles de yuanes para comprar algunas tarjetas de cálculo, lo que lo hace adecuado para instituciones financieras medianas y pequeñas con recursos relativamente limitados y aplicaciones a demanda.

Sin embargo, a pesar de eso, muchas instituciones pequeñas y medianas todavía enfrentan el problema de no poder comprar ni permitirse las tarjetas GPU necesarias para los grandes modelos. En respuesta a este problema, se ha informado que las autoridades reguladoras están estudiando si es posible, de manera intermedia, liderar la construcción de una infraestructura de grandes modelos orientada a la industria de valores, concentrando recursos de computación y grandes modelos generales, para que las pequeñas y medianas instituciones financieras del sector también puedan utilizar los servicios de grandes modelos, evitando que se queden atrás tecnológicamente.

No solo es la potencia de cálculo, sino que, con la exploración de la implementación de grandes modelos en los últimos seis meses, muchas instituciones financieras también han comenzado a fortalecer la gobernanza de datos.

Hay expertos que indican que, además de los grandes bancos que tienen prácticas maduras en el campo de la gobernanza de datos, cada vez más instituciones financieras medianas también están comenzando a construir plataformas de datos y sistemas de gobernanza de datos. Ellos creen que construir un sistema de gobernanza de datos completo y una plataforma tecnológica de lago de datos será un tema importante en la construcción de TI de las instituciones financieras en el futuro.

También hay bancos que están resolviendo problemas de datos a través de modelos grandes + MLOps. Por ejemplo, un banco ha adoptado el modelo MLOps para establecer un sistema de cierre de datos de modelos grandes, logrando la automatización de todo el proceso, así como la gestión unificada y el procesamiento eficiente de datos heterogéneos de múltiples fuentes. Se informa que actualmente se han construido y sedimentado 2.6TB de conjuntos de datos de entrenamiento de alta calidad.

Desde el escenario periférico

En los últimos seis meses, tanto los proveedores de servicios de modelos grandes como las principales instituciones financieras han estado buscando activamente escenarios de aplicación. Se han explorado ampliamente áreas como oficinas inteligentes, desarrollo inteligente, marketing inteligente, atención al cliente inteligente, investigación y análisis inteligente, y análisis de demanda.

Como dijo un alto ejecutivo de una empresa de tecnología financiera, "cada función clave en la cadena de negocio financiero merece ser reinventada con tecnología de grandes modelos." La empresa lanzó recientemente un gran modelo financiero y está colaborando con instituciones asociadas para realizar pruebas internas en la construcción de productos de grandes modelos dirigidos a la industria financiera, con el objetivo de crear un asistente de negocios de IA de cadena completa para expertos en finanzas como asesores de inversiones, agentes de seguros, investigación de inversiones, marketing financiero y liquidación de seguros.

Las instituciones financieras tienen ricas ideas sobre los grandes modelos. Un banco afirma que ya ha implementado aplicaciones en más de 20 escenarios internos, otro banco indica que ha realizado pruebas piloto en más de 30 escenarios, mientras que una empresa de valores está explorando la conexión entre el gran modelo y la plataforma de personas digitales virtuales que lanzó anteriormente.

Pero al implementar verdaderamente modelos grandes en los negocios, el consenso general es primero internamente y luego externamente. Después de todo, en esta etapa, la tecnología de modelos grandes no es madura, por ejemplo, existe el problema de las alucinaciones, y la industria financiera es un sector altamente regulado, seguro y confiable.

Hay expertos que consideran que, a corto plazo, no se recomienda el uso directo de grandes modelos orientados al cliente. Las instituciones financieras deberían priorizar el uso de grandes modelos para el análisis y comprensión creativa de textos e imágenes financieras en escenarios que requieren alta concentración intelectual, implementando una colaboración hombre-máquina en forma de asistente, para mejorar la eficiencia del trabajo del personal.

Actualmente, el asistente de código se ha implementado en varias instituciones financieras. Por ejemplo, un banco ha construido un sistema de investigación y desarrollo inteligente basado en grandes modelos, donde la cantidad de código generada por el asistente de codificación representa el 40% del total de código. En el sector de seguros, una compañía de seguros ha desarrollado un complemento de programación asistida basado en grandes modelos, que se integra directamente en las herramientas de desarrollo internas.

En el campo de la oficina inteligente también hay varios casos de implementación. Un experto mencionó que, basado en un gran modelo financiero, lanzaron un sistema de preguntas y respuestas para sucursales, que después de su implementación en un banco ya se ha promovido a cientos de sucursales, con una tasa de adopción de respuestas superior al 85%. Actualmente, esta solución se está replicando rápidamente en otros bancos e instituciones financieras.

Sin embargo, los expertos de la industria juzgan que estos escenarios que ya se han implementado ampliamente, en realidad, aún no son aplicaciones centrales de las instituciones financieras, y los grandes modelos todavía tienen cierta distancia para profundizar en el nivel operativo del sector financiero.

Se espera que antes de fin de año aparezcan proyectos de construcción o información de licitación que utilicen grandes modelos en escenarios de negocio clave en instituciones financieras.

Antes de esto, se están llevando a cabo algunos cambios en el nivel de diseño superior. Algunos académicos han juzgado que todo el sistema de inteligencia y digitalización en el futuro se reestablecerá sobre la base de grandes modelos. Esto requiere que la industria financiera reestructure sus sistemas durante el proceso de implementación de grandes modelos. Al mismo tiempo, no se debe ignorar el valor de los modelos pequeños tradicionales, sino que se debe permitir que los modelos grandes y pequeños colaboren.

Esta tendencia se ha reflejado ampliamente en la industria financiera. Actualmente, las instituciones financieras están pilotando grandes modelos, adoptando básicamente un modelo por capas. A diferencia del modelo de chimenea del pasado, donde se necesitaba construir una plataforma para cada escenario, los grandes modelos brindan a las instituciones financieras la oportunidad de planificar todo el sistema de manera más científica desde cero.

Se puede ver que actualmente varias instituciones financieras líderes han construido un marco de sistema en capas que incluye niveles como la capa de infraestructura, la capa de modelo, la capa de servicio de modelo grande y la capa de aplicación, basado en grandes modelos.

Estos marcos generalmente tienen dos características principales: primero, el gran modelo ejerce una capacidad central, utilizando modelos tradicionales como habilidades; segundo, la capa del gran modelo adopta una estrategia de múltiples modelos, comparando internamente para seleccionar el efecto óptimo.

En realidad, no solo las instituciones financieras, sino que en el contexto actual de incertidumbre, algunos proveedores de aplicaciones de grandes modelos también están adoptando estrategias de múltiples modelos para optimizar la eficacia del servicio. Algunos expertos han revelado que su capa de modelo subyacente fusiona una gran cantidad de modelos de lenguaje grandes y, según las respuestas devueltas por cada gran modelo, ensamblan las mejores opciones para ofrecerlas a los usuarios.

La brecha de talento sigue siendo enorme

La aplicación de grandes modelos ya ha comenzado a plantear algunos desafíos y cambios en la estructura del personal de la industria financiera.

Recientemente se informó que, con la aparición de ChatGPT, una empresa de tecnología financiera ha despedido a más de 300 analistas de datos desde principios de este año hasta finales de mayo. Y hace unos años, esta era una profesión muy demandada. Esto ha generado ansiedad entre los profesionales del sector, e incluso han comenzado a considerar anticipadamente las opciones de carrera para la próxima generación.

Un experto de un banco también compartió el efecto de sustitución que tienen los grandes modelos sobre las personas. Anteriormente, cada mañana había pasantes que recopilaban y resumían información de diferentes ámbitos para luego entregarla al departamento de investigación y análisis, pero ahora este trabajo puede ser realizado por grandes modelos.

Sin embargo, algunos bancos en realidad no desean que los grandes modelos conduzcan a despidos. Por ejemplo, un gran banco que cuenta con 200,000 empleados en sus sucursales ha declarado claramente que no desea que sus empleados sean reemplazados por grandes modelos, sino que espera que estos modelos traigan nuevas oportunidades, mejoren la calidad del servicio y la eficiencia laboral de los empleados, y al mismo tiempo liberen a algunos empleados para que se dediquen a trabajos de mayor valor.

Esto no carece de consideraciones sobre la estabilidad del personal y la estructura. Pero por otro lado, también se debe a que aún hay escasez de talento en muchos puestos.

Expertos han señalado que los grandes bancos tienen mucho trabajo por hacer, y algunos plazos de las demandas de TI incluso se han extendido hasta finales del próximo año. Esperan que los modelos grandes ayuden a los empleados a realizar más tareas, aumentando la eficiencia y la velocidad, en lugar de provocar reducciones de personal.

Lo más importante es que el rápido desarrollo de los grandes modelos hace que, en un corto período de tiempo, la oferta de talentos escasos no pueda satisfacer la creciente demanda. Es como cuando apareció el iPhone por primera vez, todos querían desarrollar aplicaciones, pero era muy difícil encontrar programadores de iOS.

En una reciente conferencia de tecnología financiera, un alto ejecutivo de un banco resumió los 6 grandes desafíos que enfrenta la industria financiera actualmente al integrar las capacidades de modelos grandes en los procesos comerciales centrales, uno de los cuales es la falta de talento. Mencionó que entre los nuevos empleados que han contratado recientemente, la proporción de aquellos que estudian el campo de la IA es muy alta, pero son muy pocos los talentos que comprenden los modelos grandes.

Hay expertos que lo han experimentado profundamente. Recientemente, recibieron una solicitud de apoyo de talento de un cliente bancario. Este banco, debido a que una persona de su equipo de grandes modelos se encuentra de licencia temporal, enfrenta problemas de falta de personal en el trabajo de entrenamiento de modelos y se ve obligado a buscar apoyo externo temporalmente.

"Actualmente, realmente hay muy pocos talentos en este ámbito, y se necesita un cierto tiempo para formarlos." Este experto considera que la demanda de talentos que apliquen directamente grandes modelos es relativamente simple, principalmente se necesitan personas que sepan hacer preguntas. Pero si se quiere construir un gran modelo específico para la industria o la empresa, entonces las instituciones financieras necesitan contar con un equipo técnico vertical competente en grandes modelos.

Otro experto también admitió que hay una gran falta de talento en el campo de los grandes modelos de IA, y las principales instituciones están contratando talento relacionado con la especialidad de IA, como doctores en algoritmos, entre otros. Esto se debe a que, aunque los clientes financieros pueden obtener apoyo técnico de los proveedores de grandes modelos, ellos son, en última instancia, los usuarios finales y los líderes de innovación, y necesitan cierta acumulación de talento para respaldar la construcción de grandes plataformas de IA, la planificación de diversas aplicaciones de IA, así como en los procesos de modelado, ajuste y ajuste fino, colaborar con los proveedores de grandes modelos para realizar optimizaciones como la superposición de escenarios y la superposición de modelos, ampliando continuamente el alcance y la efectividad de las aplicaciones de modelos de IA.

Algunos participantes ya han tomado medidas. Hay empresas que se han asociado con el equipo de recursos humanos de un laboratorio bancario, revisando las prácticas de transformación del personal en la aplicación de grandes modelos en las empresas, y diseñando una serie de capacitaciones.

Ver originales
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Recompensa
  • 4
  • Compartir
Comentar
0/400
DeFiChefvip
· 07-04 10:32
Modelo Dali Frito
Ver originalesResponder0
CryptoComedianvip
· 07-02 20:50
Sonriendo sumar y llorando salir
Ver originalesResponder0
PseudoIntellectualvip
· 07-01 15:12
No seguir las tendencias es lo mejor.
Ver originalesResponder0
OffchainWinnervip
· 07-01 15:07
La tecnología también debe tener paciencia.
Ver originalesResponder0
  • Anclado
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)