banner
Hogar / Blog / Nueva asociación con Microsoft acelera el desarrollo de IA generativa
Blog

Nueva asociación con Microsoft acelera el desarrollo de IA generativa

Jan 28, 2024Jan 28, 2024

Únase a los principales ejecutivos en San Francisco el 11 y 12 de julio para escuchar cómo los líderes están integrando y optimizando las inversiones en IA para el éxito. Aprende más

Una de las tendencias más candentes en inteligencia artificial (IA) este año ha sido la aparición de modelos populares de IA generativa. Con tecnologías que incluyen DALL-E y Stable Diffusion, está surgiendo un número creciente de nuevas empresas y casos de uso.

La IA generativa se basa en una serie de tecnologías fundamentales, incluido el uso de modelos de transformadores. El uso de transformadores para IA generativa y otros casos de uso puede requerir muchos recursos en el lado de la inferencia, donde los sistemas predicen y construyen los resultados de un modelo.

Entre los proveedores que están creando tecnología para ayudar a acelerar la inferencia de IA para modelos de transformadores se encuentra la startup d-Matrix, que recaudó 44 millones de dólares en una ronda de financiación de serie A en abril para ayudar a desarrollar su tecnología de hardware acelerador de IA. La compañía ha desarrollado una tecnología de cómputo digital en memoria (DIMC) que aún no está disponible públicamente, pero ya llamó la atención de Microsoft.

Microsoft y d-Matrix anunciaron hoy que el aprendizaje de refuerzo de Microsoft Project Bonsai será compatible con la tecnología d-Matrix DIMC, que los dos proveedores esperan que proporcione una aceleración significativa para la inferencia de IA.

Transformar 2023

Únase a nosotros en San Francisco los días 11 y 12 de julio, donde los altos ejecutivos compartirán cómo han integrado y optimizado las inversiones en IA para lograr el éxito y evitar errores comunes.

"Project Bonsai es una plataforma que permite nuestra versión de aprendizaje de refuerzo profundo y lo llamamos enseñanza automática", dijo a VentureBeat Kingsuk Maitra, ingeniero principal de IA aplicada en Microsoft. "Hemos capacitado a un compilador para la tecnología de cómputo digital en memoria única en su tipo de d-Matrix y los primeros resultados son muy alentadores".

Project Bonsai ha estado en desarrollo en Microsoft durante los últimos años y actualmente está disponible como versión preliminar.

Maitra dijo que el objetivo del esfuerzo es abstraer las complejidades asociadas con las redes de aprendizaje de refuerzo profundo. Un objetivo inicial del Proyecto Bonsai son los controles industriales, incluido el diseño y la fabricación de chips. Parte de la tecnología es la capacidad de entrenar modelos utilizando un lenguaje de alto nivel desarrollado en Microsoft Project Bonsai llamado Inkling para entrenar agentes de refuerzo profundo para realizar tareas de control.

El aprendizaje de refuerzo profundo no requiere datos etiquetados, explicó Maitra. Más bien, esencialmente aprende con la retroalimentación del entorno, que se puede emular con un simulador. Al final de un ciclo de entrenamiento, el resultado es un agente de aprendizaje por refuerzo (RL) entrenado, al que Microsoft se refiere como "cerebro". Los cerebros, cuando se despliegan, pueden tomar acciones significativas para completar la tarea en cuestión.

"Estamos ejecutando cargas de trabajo activas de la vida real y entrenando al compilador, en relación con esas cargas de trabajo de la vida real, la mayoría de ellas con modelos de lenguaje grande bien conocidos con diferentes cerebros Bonsai", dijo Maitra.

Actualmente, d-Matrix no tiene chips disponibles públicamente, pero el primero, cuyo nombre en código es Corsair, debutará en 2023.

"Estamos construyendo una plataforma informática acelerada para transformadores y nos centramos específicamente en la IA generativa", dijo a VentureBeat Sudeep Bhoja, cofundador y director de tecnología de d-Matrix.

Bhoja explicó que los chips que está desarrollando d-Matrix se pueden construir de una manera muy modular y se pueden empaquetar junto con una CPU o se pueden integrar en una tarjeta PCI que se conecta a un servidor en la nube. La tecnología d-Matrix está diseñada para ayudar a acelerar la inferencia de IA, con su tecnología DIMC que brinda alto rendimiento y baja latencia.

Con Project Bonsai de Microsoft, d-Matrix ahora tiene un compilador que puede construir herramientas de aprendizaje de refuerzo profundo para su silicio. Un objetivo final clave para d-Matrix es ayudar a respaldar el crecimiento continuo y la implementación de modelos generativos de IA.

"Queremos habilitar [modelos de IA generativos] porque requiere mucha potencia de procesamiento, hay restricciones de latencia y está orientado al usuario", dijo Bhoja. "Tienes que poder hacerlo de una manera muy eficiente desde el punto de vista energético para que los centros de datos no tengan que generar más energía...".

La misión de VentureBeat es ser una plaza pública digital para que los responsables de la toma de decisiones técnicas adquieran conocimientos sobre tecnología empresarial transformadora y realicen transacciones. Descubre nuestras sesiones informativas.

La misión de VentureBeat