LLAMA 2: La Revoluci贸n de Meta contra ChatGPT

InicioBlog IAConceptos b谩sicosLLAMA 2: La Revoluci贸n de Meta contra ChatGPT
Hombre pasando por delante de un cartel de inteligencia artificial.

La inteligencia artificial est谩 evolucionando a pasos agigantados. Recientemente, Meta (la compa帽铆a detr谩s de Facebook) present贸 LLAMA 2, la segunda versi贸n de su modelo de lenguaje LLAMA. Este lanzamiento supone toda una revoluci贸n en el campo de la IA y una competencia directa a ChatGPT de OpenAI. Hablemos de estos puntos:

  • 鉁 LLAMA 2 es la nueva versi贸n del modelo de lenguaje de Meta, competencia directa a ChatGPT.
  • 馃懇鈥嶐煉 La comunidad open source buscaba crear un modelo alternativo a ChatGPT.
  • 馃敁 Meta libera LLAMA de forma open source para acelerar la innovaci贸n.
  • 馃殌 LLAMA impulsa nuevos modelos y avances de la comunidad tech.
  • 猬嗭笍 LLAMA 2 es m谩s potente y tiene licencia comercial.
  • 馃 Microsoft se al铆a con Meta en este lanzamiento.
  • 馃敭 Se espera una explosi贸n de aplicaciones conversacionales basadas en LLAMA.
  • 鈿★笍 LLAMA acelera la carrera por el dominio de los modelos del lenguaje.
  • 馃寧 Democratiza el acceso a la IA generativa conversacional.
  • 馃挕 Abre grandes posibilidades de innovaci贸n en manos de la comunidad.

驴Qu茅 es LLAMA y por qu茅 es importante?

LLAMA es un modelo de lenguaje desarrollado por Meta. Es una IA entrenada con enormes cantidades de texto cuya tarea es aprender a predecir las siguientes palabras en una frase. De esta forma, LLAMA aprende el lenguaje y es capaz de generar texto de forma coherente.

Si bien LLAMA no es un chatbot conversacional como ChatGPT, modelos como LLAMA son la base para desarrollar chatbots avanzados.

Una vez se tiene un modelo que genera lenguaje de forma fluida, se le puede entrenar para que dialogue de forma coherente y siga instrucciones.

La importancia de LLAMA radica en que Meta ha decidido liberarlo de forma open source. Esto permite que cualquier persona o empresa pueda acceder y usar LLAMA de forma gratuita. Adem谩s, al estar abierto, la comunidad tech puede contribuir a mejorar el modelo.

El origen: la comunidad open source buscaba su propio ChatGPT

Tras el 茅xito de ChatGPT de OpenAI a finales de 2022, en la comunidad open source surg铆a el interrogante: 驴podr铆amos crear un modelo similar pero de c贸digo abierto?

OpenAI hab铆a mantenido a ChatGPT como un modelo privado y comercial. Pero la comunidad online se sent铆a capaz de igualar el hito, despu茅s del 茅xito de Stable Diffusion en agosto de 2022.

Stable Diffusion demostr贸 que modelos avanzados de IA no eran exclusivos de grandes compa帽铆as. Sin embargo, se necesitaban recursos y financiaci贸n para entrenar un modelo similar en el 谩rea del lenguaje.

Meta habilita el acceso open source a LLAMA

En febrero de 2023, Meta presenta LLAMA, un modelo de lenguaje de gran escala competitivo con ChatGPT. Pero en un principio no lo libera de forma abierta, solo acceso controlado a investigadores.

En cuesti贸n de d铆as, el c贸digo de LLAMA se filtr贸 en internet. Sea intencionado o no, LLAMA estaba disponible para que la comunidad open source trabajase con 茅l.

R谩pidamente surgieron modelos derivados de LLAMA reentrenados como chatbots conversacionales, como Alpaca o Vicu帽a. La comunidad tech ahora contaba con su propia alternativa open source a ChatGPT.

LLAMA impulsa los modelos de lenguaje de c贸digo abierto

Con el c贸digo de LLAMA accesible, la comunidad open source comenz贸 a trabajar para mejorar sus capacidades. En cuesti贸n de semanas implementaron avances que habr铆an llevado meses a grandes empresas:

  • Integraci贸n de visi贸n: para modelos multimodales de texto e im谩genes.
  • Reentrenamiento eficiente: t茅cnicas como LoRA reducen dr谩sticamente los recursos computacionales necesarios.
  • Compresi贸n: mediante poda y cuantizaci贸n se reduce el tama帽o del modelo para poder ejecutarlo en GPUs convencionales.
  • Mejoras en el chat: ventanas de contexto m谩s grandes, detecci贸n de toxicidad, etc.

Gracias a estos avances, los modelos de c贸digo abierto han acortado en meses la distancia con modelos privados como ChatGPT.

LLAMA 2, m谩s potente y con licencia comercial

En julio de 2023, Meta lanza LLAMA 2, una versi贸n mejorada ahora con licencia para uso comercial. Esto resuelve el principal escollo de la versi贸n anterior.

LLAMA 2 es comparable a ChatGPT 3.5 en capacidades, con una ventana de contexto de 4000 tokens. Se han publicado 3 versiones de distinto tama帽o, para satisfacer diferentes necesidades de rendimiento y recursos.

Adem谩s, Meta ha publicado un modelo derivado ya entrenado como chatbot conversacional. De esta forma la comunidad cuenta con un modelo base y otro listo para integrar en aplicaciones.

Microsoft se al铆a con Meta en este lanzamiento

Uno de los movimientos m谩s curiosos es que Microsoft se ha aliado con Meta en el lanzamiento de LLAMA 2. Esto resulta sorprendente, ya que Microsoft ten铆a una alianza previa con OpenAI para usar ChatGPT en sus productos.

Logos de Meta y Microsoft juntos.

Sin embargo, tiene sentido por parte de Microsoft facilitar el desarrollo de modelos open source. De esta forma, indirectamente tambi茅n se beneficiar谩n sus productos al integrar mejoras desarrolladas por la comunidad.

Al liberar LLAMA 2, Meta tambi茅n rompe con la postura m谩s conservadora de OpenAI de restringir el acceso a estos modelos. Quiz谩s ahora OpenAI se replantee compartir m谩s avances en aras de no perder su liderazgo en este campo.

El impacto de LLAMA 2 en el ecosistema de IA

Con LLAMA 2, y su licencia para uso comercial, se espera una explosi贸n de aplicaciones basadas en este tipo de modelos:

  • Nuevos chatbots y asistentes virtuales accesibles para cualquier empresa o desarrollador.
  • Optimizaciones para requerir menos recursos computacionales y ejecutarse en m谩s dispositivos.
  • Modelos especializados mediante reentrenamiento en campos concretos (atenci贸n al cliente, soporte t茅cnico, consultas m茅dicas, etc).
  • Integraci贸n en apps existentes para ofrecer capacidades conversacionales.

La comunidad open source tiene ahora las herramientas para seguir innovando a un ritmo vertiginoso. Pronto podr铆amos ver alternativas viables a los grandes modelos privados actuales.

Sin duda, gracias a LLAMA 2 la carrera por la dominancia en el campo de los modelos de lenguaje ha dado un giro fascinante. Queda por ver c贸mo responden OpenAI y otras empresas ante este movimiento de Meta por democratizar la IA conversacional.

Las capacidades de compresi贸n y generaci贸n del lenguaje avanzan a pasos agigantados. El panorama competitivo entre las grandes tecnol贸gicas tambi茅n se volver谩 m谩s din谩mico gracias a este espaldarazo al movimiento open source.

Los pr贸ximos meses ser谩n fascinantes en cuanto a novedades en el campo de la IA generativa. Y LLAMA ha sido la chispa que puede desatar una nueva ola de innovaci贸n abierta y colaborativa de la mano de toda la comunidad tech internacional.

DESCUBRE M脕S SOBRE EL TEMA

IAs relacionadas

Capaz de Conversar con humanos, Generar c贸digo

Este art铆culo fue escrito por Miguel 脕ngel G.P. y habla sobre LLAMA y Conceptos b谩sicos. Se public贸 el 8 de agosto de 2023.

+ sobre IA 馃

Deja el primer comentario