La inteligencia artificial generativa está viviendo un momento fascinante. Con el reciente lanzamiento de modelos de IA de código abierto como LLaMA 2 y ChatGLM, se está gestando una nueva tendencia hacia la apertura y la democratización en este campo.
El reinado de OpenAI y sus aliados
Hasta ahora, OpenAI dominaba claramente el mercado de los grandes modelos de lenguaje con GPT-3 y el reciente GPT-4, considerado el más avanzado. Sus modelos son de código cerrado, y OpenAI decide quién puede acceder a ellos.
Pero incluso sus socios más cercanos, como Microsoft y Meta, ahora están abrazando el movimiento de código abierto, desafiando el dominio de OpenAI con alternativas como LLaMA 2.
La oleada de modelos abiertos
En las últimas semanas, han surgido múltiples anuncios de nuevos modelos de IA de gran tamaño y código abierto:
- Meta liberó LLaMA 2, en alianza con Microsoft.
- Alibaba Cloud lanzó modelos abiertos como Qwen-7B.
- Baidu incorporó 30 modelos open source a su plataforma Wenxin Qianfan.
¿Por qué esta tendencia open source?
Hay varios motivos detrás de este movimiento:
Fomentar la innovación
Al liberar los modelos, más desarrolladores pueden experimentar, crear nuevas aplicaciones y mejorar la tecnología. Es similar a Android vs iOS.
Demostrar capacidades
Abrir el código permite validar la calidad de los modelos. Las empresas quieren mostrar que pueden competir con OpenAI.
Agilidad
La actualización de modelos open source es más rápida. Y los desarrolladores prefieren su flexibilidad.
Crear ecosistemas
Un ecosistema amplio alrededor de LLaMA 2 y otros modelos abiertos ayuda a que se adopten rápidamente.
Modelos de lenguaje grande (LLMs) ordenados por capacidad
Esta tabla muestra un ranking de los principales modelos de inteligencia artificial conversacional ordenados según su capacidad.
Estos modelos de IA se entrenan para poder mantener conversaciones coherentes y fluidas como si fueran humanos. Cuanto más grandes y avanzados son, más inteligentes y capaces de conversar se vuelven.
En la tabla aparecen modelos muy conocidos como GPT-4 de OpenAI o Claude de Anthropic, junto a otros menos populares.
Se muestran varias métricas para evaluar la capacidad de cada modelo:
- Puntuación Arena Elo: mide qué tan bueno es conversando según la opinión de miles de usuarios reales. Entre más alto, se considera mejor modelo conversacional.
- Puntuación MT-bench: evalúa qué tan bien responde el modelo preguntas complejas de múltiples turnos.
- MMLU: mide la precisión del modelo en 57 tareas diferentes de lenguaje.
También indica si el modelo es de código abierto o proprietario, es decir, si su tecnología se comparte libremente o pertenece a una empresa.
La tabla permite comparar las habilidades conversacionales y el desempeño de los modelos de IA más populares, para ver cuáles son los más potentes en este momento. Los modelos open source buscan democratizar la IA al compartirla libremente.
Posición | Modelo | Puntuación Arena Elo | Puntuación MT-bench | MMLU | Licencia |
---|---|---|---|---|---|
1 | GPT-4 | 1206 | 8.99 | 86.4 | Propietario |
2 | Claude-1 | 1166 | 7.9 | 77 | Propietario |
3 | Claude-instant-1 | 1138 | 7.85 | 73.4 | Propietario |
4 | Claude-2 | 1135 | 8.06 | 78.5 | Propietario |
5 | GPT-3.5-turbo | 1122 | 7.94 | 70 | Propietario |
6 | Vicuna-33B | 1096 | 7.12 | 59.2 | No comercial |
7 | Vicuna-13B | 1051 | 6.57 | 55.8 | Comunidad Llama 2 |
8 | MPT-30B-chat | 1046 | 6.39 | 50.4 | CC-BY-NC-SA-4.0 |
9 | WizardLM-13B-v1.1 | 1040 | 6.76 | 50 | No comercial |
10 | Guanaco-33B | 1038 | 6.53 | 57.6 | No comercial |
11 | PaLM-Chat-Bison-001 | 1015 | 6.4 | – | Propietario |
12 | Vicuna-7B | 1006 | 6.17 | 49.8 | Comunidad Llama 2 |
13 | Llama-2-13b-chat | 987 | 6.65 | 53.6 | Comunidad Llama 2 |
14 | Koala-13B | 983 | 5.35 | 44.7 | No comercial |
15 | GPT4All-13B-Snoozy | 967 | 5.41 | 43 | x |
16 | Llama-2-7b-chat | 961 | 6.27 | 45.8 | Comunidad Llama 2 |
17 | MPT-7B-Chat | 947 | 5.42 | 32 | CC-BY-NC-SA-4.0 |
18 | RWKV-4-Raven-14B | 943 | 3.98 | 25.6 | Apache 2.0 |
19 | Alpaca-13B | 923 | 4.53 | 48.1 | No comercial |
20 | OpenAssistant-Pythia-12B | 915 | 4.32 | 27 | Apache 2.0 |
21 | ChatGLM-6B | 900 | 4.5 | 36.1 | No comercial |
22 | FastChat-T5-3B | 892 | 3.04 | 47.7 | Apache 2.0 |
23 | StableLM-Tuned-Alpha-7B | 863 | 2.75 | 24.4 | CC-BY-NC-SA-4.0 |
24 | Dolly-V2-12B | 842 | 3.28 | 25.7 | MIT |
25 | LLaMA-13B | 817 | 2.61 | 47 | No comercial |
26 | WizardLM-30B | – | 7.01 | 58.7 | No comercial |
27 | Vicuna-13B-16k | – | 6.87 | 54.1 | Comunidad Llama 2 |
28 | Llama-2-70b-chat | – | 6.86 | 63 | Comunidad Llama 2 |
29 | Tulu-30B | – | 6.43 | 58.1 | No comercial |
30 | Guanaco-65B | – | 6.41 | 62.1 | No comercial |
31 | OpenAssistant-LLaMA-30B | – | 6.41 | 56 | No comercial |
32 | WizardLM-13B | – | 6.35 | 52.3 | No comercial |
33 | Vicuna-7B-16k | – | 6.22 | 48.5 | Comunidad Llama 2 |
34 | Baize-v2-13B | – | 5.75 | 48.9 | No comercial |
35 | XGen-7B-8K-Inst | – | 5.55 | 42.1 | No comercial |
36 | Nous-Hermes-13B | – | 5.51 | 49.3 | No comercial |
37 | MPT-30B-Instruct | – | 5.22 | 47.8 | CC-BY-SA 3.0 |
38 | Falcon-40B-Instruct | – | 5.17 | 54.7 | Apache 2.0 |
39 | ChatGLM2-6B | – | 4.96 | 45.5 | Apache-2.0 |
40 | H2O-Oasst-OpenLLaMA-13B | – | 4.63 | 42.8 | Apache 2.0 |
La trampa de lo «gratuito»
Si bien los modelos son gratuitos, implementarlos y sacarles provecho no es tan sencillo. Se requiere experiencia en:
- Deployment de modelos en la nube.
- Entrenamiento con datos personalizados.
- Desarrollo de aplicaciones especializadas.
Esto está impulsando un mercado de servicios de consultoría para modelos open source, con gran potencial de negocio.
El futuro ecosistema de IA
Más allá de los modelos, la apertura se expande a otros componentes clave de la IA:
- Datos: lanzamiento de conjuntos de datos abiertos para entrenamiento.
- Algoritmos: frameworks de machine learning como TensorFlow o PyTorch.
- Chips: arquitecturas abiertas como RISC-V acelerando la innovación en hardware.
En definitiva, la democratización de la IA apenas comienza. Queda por ver si la apertura desplazará finalmente a los actores dominantes actuales.