La nueva ola de modelos de IA abiertos desafía el dominio de OpenAI

Inicio · Blog IA · Noticias · La nueva ola de modelos de IA abiertos desafía el dominio de OpenAI
Dos robots hablando mientras toman café.

La inteligencia artificial generativa está viviendo un momento fascinante. Con el reciente lanzamiento de modelos de IA de código abierto como LLaMA 2 y ChatGLM, se está gestando una nueva tendencia hacia la apertura y la democratización en este campo.

El reinado de OpenAI y sus aliados

Hasta ahora, OpenAI dominaba claramente el mercado de los grandes modelos de lenguaje con GPT-3 y el reciente GPT-4, considerado el más avanzado. Sus modelos son de código cerrado, y OpenAI decide quién puede acceder a ellos.

Pero incluso sus socios más cercanos, como Microsoft y Meta, ahora están abrazando el movimiento de código abierto, desafiando el dominio de OpenAI con alternativas como LLaMA 2.

La oleada de modelos abiertos

En las últimas semanas, han surgido múltiples anuncios de nuevos modelos de IA de gran tamaño y código abierto:

  • Meta liberó LLaMA 2, en alianza con Microsoft.
  • Alibaba Cloud lanzó modelos abiertos como Qwen-7B.
  • Baidu incorporó 30 modelos open source a su plataforma Wenxin Qianfan.

¿Por qué esta tendencia open source?

Hay varios motivos detrás de este movimiento:

Fomentar la innovación

Al liberar los modelos, más desarrolladores pueden experimentar, crear nuevas aplicaciones y mejorar la tecnología. Es similar a Android vs iOS.

Demostrar capacidades

Abrir el código permite validar la calidad de los modelos. Las empresas quieren mostrar que pueden competir con OpenAI.

Agilidad

La actualización de modelos open source es más rápida. Y los desarrolladores prefieren su flexibilidad.

Crear ecosistemas

Un ecosistema amplio alrededor de LLaMA 2 y otros modelos abiertos ayuda a que se adopten rápidamente.

Modelos de lenguaje grande (LLMs) ordenados por capacidad

Esta tabla muestra un ranking de los principales modelos de inteligencia artificial conversacional ordenados según su capacidad.

Estos modelos de IA se entrenan para poder mantener conversaciones coherentes y fluidas como si fueran humanos. Cuanto más grandes y avanzados son, más inteligentes y capaces de conversar se vuelven.

En la tabla aparecen modelos muy conocidos como GPT-4 de OpenAI o Claude de Anthropic, junto a otros menos populares.

Se muestran varias métricas para evaluar la capacidad de cada modelo:

  • Puntuación Arena Elo: mide qué tan bueno es conversando según la opinión de miles de usuarios reales. Entre más alto, se considera mejor modelo conversacional.
  • Puntuación MT-bench: evalúa qué tan bien responde el modelo preguntas complejas de múltiples turnos.
  • MMLU: mide la precisión del modelo en 57 tareas diferentes de lenguaje.

También indica si el modelo es de código abierto o proprietario, es decir, si su tecnología se comparte libremente o pertenece a una empresa.

La tabla permite comparar las habilidades conversacionales y el desempeño de los modelos de IA más populares, para ver cuáles son los más potentes en este momento. Los modelos open source buscan democratizar la IA al compartirla libremente.

PosiciónModeloPuntuación Arena EloPuntuación MT-benchMMLULicencia
1GPT-412068.9986.4Propietario
2Claude-111667.977Propietario
3Claude-instant-111387.8573.4Propietario
4Claude-211358.0678.5Propietario
5GPT-3.5-turbo11227.9470Propietario
6Vicuna-33B10967.1259.2No comercial
7Vicuna-13B10516.5755.8Comunidad Llama 2
8MPT-30B-chat10466.3950.4CC-BY-NC-SA-4.0
9WizardLM-13B-v1.110406.7650No comercial
10Guanaco-33B10386.5357.6No comercial
11PaLM-Chat-Bison-00110156.4Propietario
12Vicuna-7B10066.1749.8Comunidad Llama 2
13Llama-2-13b-chat9876.6553.6Comunidad Llama 2
14Koala-13B9835.3544.7No comercial
15GPT4All-13B-Snoozy9675.4143x
16Llama-2-7b-chat9616.2745.8Comunidad Llama 2
17MPT-7B-Chat9475.4232CC-BY-NC-SA-4.0
18RWKV-4-Raven-14B9433.9825.6Apache 2.0
19Alpaca-13B9234.5348.1No comercial
20OpenAssistant-Pythia-12B9154.3227Apache 2.0
21ChatGLM-6B9004.536.1No comercial
22FastChat-T5-3B8923.0447.7Apache 2.0
23StableLM-Tuned-Alpha-7B8632.7524.4CC-BY-NC-SA-4.0
24Dolly-V2-12B8423.2825.7MIT
25LLaMA-13B8172.6147No comercial
26WizardLM-30B7.0158.7No comercial
27Vicuna-13B-16k6.8754.1Comunidad Llama 2
28Llama-2-70b-chat6.8663Comunidad Llama 2
29Tulu-30B6.4358.1No comercial
30Guanaco-65B6.4162.1No comercial
31OpenAssistant-LLaMA-30B6.4156No comercial
32WizardLM-13B6.3552.3No comercial
33Vicuna-7B-16k6.2248.5Comunidad Llama 2
34Baize-v2-13B5.7548.9No comercial
35XGen-7B-8K-Inst5.5542.1No comercial
36Nous-Hermes-13B5.5149.3No comercial
37MPT-30B-Instruct5.2247.8CC-BY-SA 3.0
38Falcon-40B-Instruct5.1754.7Apache 2.0
39ChatGLM2-6B4.9645.5Apache-2.0
40H2O-Oasst-OpenLLaMA-13B4.6342.8Apache 2.0

 

La trampa de lo «gratuito»

Si bien los modelos son gratuitos, implementarlos y sacarles provecho no es tan sencillo. Se requiere experiencia en:

  • Deployment de modelos en la nube.
  • Entrenamiento con datos personalizados.
  • Desarrollo de aplicaciones especializadas.

Esto está impulsando un mercado de servicios de consultoría para modelos open source, con gran potencial de negocio.

El futuro ecosistema de IA

Más allá de los modelos, la apertura se expande a otros componentes clave de la IA:

  • Datos: lanzamiento de conjuntos de datos abiertos para entrenamiento.
  • Algoritmos: frameworks de machine learning como TensorFlow o PyTorch.
  • Chips: arquitecturas abiertas como RISC-V acelerando la innovación en hardware.

En definitiva, la democratización de la IA apenas comienza. Queda por ver si la apertura desplazará finalmente a los actores dominantes actuales.

DESCUBRE MÁS SOBRE EL TEMA

Deja el primer comentario