LLAMA 2: La Revolución de Meta contra ChatGPT

Inicio · Blog IA · Conceptos básicos · LLAMA 2: La Revolución de Meta contra ChatGPT
Hombre pasando por delante de un cartel de inteligencia artificial.

La inteligencia artificial está evolucionando a pasos agigantados. Recientemente, Meta (la compañía detrás de Facebook) presentó LLAMA 2, la segunda versión de su modelo de lenguaje LLAMA. Este lanzamiento supone toda una revolución en el campo de la IA y una competencia directa a ChatGPT de OpenAI. Hablemos de estos puntos:

  • ✨ LLAMA 2 es la nueva versión del modelo de lenguaje de Meta, competencia directa a ChatGPT.
  • 👩‍💻 La comunidad open source buscaba crear un modelo alternativo a ChatGPT.
  • 🔓 Meta libera LLAMA de forma open source para acelerar la innovación.
  • 🚀 LLAMA impulsa nuevos modelos y avances de la comunidad tech.
  • ⬆️ LLAMA 2 es más potente y tiene licencia comercial.
  • 🤝 Microsoft se alía con Meta en este lanzamiento.
  • 🔮 Se espera una explosión de aplicaciones conversacionales basadas en LLAMA.
  • ⚡️ LLAMA acelera la carrera por el dominio de los modelos del lenguaje.
  • 🌎 Democratiza el acceso a la IA generativa conversacional.
  • 💡 Abre grandes posibilidades de innovación en manos de la comunidad.

¿Qué es LLAMA y por qué es importante?

LLAMA es un modelo de lenguaje desarrollado por Meta. Es una IA entrenada con enormes cantidades de texto cuya tarea es aprender a predecir las siguientes palabras en una frase. De esta forma, LLAMA aprende el lenguaje y es capaz de generar texto de forma coherente.

Si bien LLAMA no es un chatbot conversacional como ChatGPT, modelos como LLAMA son la base para desarrollar chatbots avanzados.

Una vez se tiene un modelo que genera lenguaje de forma fluida, se le puede entrenar para que dialogue de forma coherente y siga instrucciones.

La importancia de LLAMA radica en que Meta ha decidido liberarlo de forma open source. Esto permite que cualquier persona o empresa pueda acceder y usar LLAMA de forma gratuita. Además, al estar abierto, la comunidad tech puede contribuir a mejorar el modelo.

El origen: la comunidad open source buscaba su propio ChatGPT

Tras el éxito de ChatGPT de OpenAI a finales de 2022, en la comunidad open source surgía el interrogante: ¿podríamos crear un modelo similar pero de código abierto?

OpenAI había mantenido a ChatGPT como un modelo privado y comercial. Pero la comunidad online se sentía capaz de igualar el hito, después del éxito de Stable Diffusion en agosto de 2022.

Stable Diffusion demostró que modelos avanzados de IA no eran exclusivos de grandes compañías. Sin embargo, se necesitaban recursos y financiación para entrenar un modelo similar en el área del lenguaje.

Meta habilita el acceso open source a LLAMA

En febrero de 2023, Meta presenta LLAMA, un modelo de lenguaje de gran escala competitivo con ChatGPT. Pero en un principio no lo libera de forma abierta, solo acceso controlado a investigadores.

En cuestión de días, el código de LLAMA se filtró en internet. Sea intencionado o no, LLAMA estaba disponible para que la comunidad open source trabajase con él.

Rápidamente surgieron modelos derivados de LLAMA reentrenados como chatbots conversacionales, como Alpaca o Vicuña. La comunidad tech ahora contaba con su propia alternativa open source a ChatGPT.

LLAMA impulsa los modelos de lenguaje de código abierto

Con el código de LLAMA accesible, la comunidad open source comenzó a trabajar para mejorar sus capacidades. En cuestión de semanas implementaron avances que habrían llevado meses a grandes empresas:

  • Integración de visión: para modelos multimodales de texto e imágenes.
  • Reentrenamiento eficiente: técnicas como LoRA reducen drásticamente los recursos computacionales necesarios.
  • Compresión: mediante poda y cuantización se reduce el tamaño del modelo para poder ejecutarlo en GPUs convencionales.
  • Mejoras en el chat: ventanas de contexto más grandes, detección de toxicidad, etc.

Gracias a estos avances, los modelos de código abierto han acortado en meses la distancia con modelos privados como ChatGPT.

LLAMA 2, más potente y con licencia comercial

En julio de 2023, Meta lanza LLAMA 2, una versión mejorada ahora con licencia para uso comercial. Esto resuelve el principal escollo de la versión anterior.

LLAMA 2 es comparable a ChatGPT 3.5 en capacidades, con una ventana de contexto de 4000 tokens. Se han publicado 3 versiones de distinto tamaño, para satisfacer diferentes necesidades de rendimiento y recursos.

Además, Meta ha publicado un modelo derivado ya entrenado como chatbot conversacional. De esta forma la comunidad cuenta con un modelo base y otro listo para integrar en aplicaciones.

Microsoft se alía con Meta en este lanzamiento

Uno de los movimientos más curiosos es que Microsoft se ha aliado con Meta en el lanzamiento de LLAMA 2. Esto resulta sorprendente, ya que Microsoft tenía una alianza previa con OpenAI para usar ChatGPT en sus productos.

Logos de Meta y Microsoft juntos.

Sin embargo, tiene sentido por parte de Microsoft facilitar el desarrollo de modelos open source. De esta forma, indirectamente también se beneficiarán sus productos al integrar mejoras desarrolladas por la comunidad.

Al liberar LLAMA 2, Meta también rompe con la postura más conservadora de OpenAI de restringir el acceso a estos modelos. Quizás ahora OpenAI se replantee compartir más avances en aras de no perder su liderazgo en este campo.

El impacto de LLAMA 2 en el ecosistema de IA

Con LLAMA 2, y su licencia para uso comercial, se espera una explosión de aplicaciones basadas en este tipo de modelos:

  • Nuevos chatbots y asistentes virtuales accesibles para cualquier empresa o desarrollador.
  • Optimizaciones para requerir menos recursos computacionales y ejecutarse en más dispositivos.
  • Modelos especializados mediante reentrenamiento en campos concretos (atención al cliente, soporte técnico, consultas médicas, etc).
  • Integración en apps existentes para ofrecer capacidades conversacionales.

La comunidad open source tiene ahora las herramientas para seguir innovando a un ritmo vertiginoso. Pronto podríamos ver alternativas viables a los grandes modelos privados actuales.

Sin duda, gracias a LLAMA 2 la carrera por la dominancia en el campo de los modelos de lenguaje ha dado un giro fascinante. Queda por ver cómo responden OpenAI y otras empresas ante este movimiento de Meta por democratizar la IA conversacional.

Las capacidades de compresión y generación del lenguaje avanzan a pasos agigantados. El panorama competitivo entre las grandes tecnológicas también se volverá más dinámico gracias a este espaldarazo al movimiento open source.

Los próximos meses serán fascinantes en cuanto a novedades en el campo de la IA generativa. Y LLAMA ha sido la chispa que puede desatar una nueva ola de innovación abierta y colaborativa de la mano de toda la comunidad tech internacional.

DESCUBRE MÁS SOBRE EL TEMA

Deja el primer comentario