La nueva ola de modelos de IA abiertos desafía el dominio de OpenAI

Inicio · Blog IA · Noticias · La nueva ola de modelos de IA abiertos desafía el dominio de OpenAI

Dos robots hablando mientras toman café.

La inteligencia artificial generativa está viviendo un momento fascinante. Con el reciente lanzamiento de modelos de IA de código abierto como LLaMA 2 y ChatGLM, se está gestando una nueva tendencia hacia la apertura y la democratización en este campo.

El reinado de OpenAI y sus aliados

Hasta ahora, OpenAI dominaba claramente el mercado de los grandes modelos de lenguaje con GPT-3 y el reciente GPT-4, considerado el más avanzado. Sus modelos son de código cerrado, y OpenAI decide quién puede acceder a ellos.

Pero incluso sus socios más cercanos, como Microsoft y Meta, ahora están abrazando el movimiento de código abierto, desafiando el dominio de OpenAI con alternativas como LLaMA 2.

La oleada de modelos abiertos

En las últimas semanas, han surgido múltiples anuncios de nuevos modelos de IA de gran tamaño y código abierto:

Meta liberó LLaMA 2, en alianza con Microsoft.
Alibaba Cloud lanzó modelos abiertos como Qwen-7B.
Baidu incorporó 30 modelos open source a su plataforma Wenxin Qianfan.

¿Por qué esta tendencia open source?

Hay varios motivos detrás de este movimiento:

Fomentar la innovación

Al liberar los modelos, más desarrolladores pueden experimentar, crear nuevas aplicaciones y mejorar la tecnología. Es similar a Android vs iOS.

Demostrar capacidades

Abrir el código permite validar la calidad de los modelos. Las empresas quieren mostrar que pueden competir con OpenAI.

Agilidad

La actualización de modelos open source es más rápida. Y los desarrolladores prefieren su flexibilidad.

Crear ecosistemas

Un ecosistema amplio alrededor de LLaMA 2 y otros modelos abiertos ayuda a que se adopten rápidamente.

Modelos de lenguaje grande (LLMs) ordenados por capacidad

Esta tabla muestra un ranking de los principales modelos de inteligencia artificial conversacional ordenados según su capacidad.

Estos modelos de IA se entrenan para poder mantener conversaciones coherentes y fluidas como si fueran humanos. Cuanto más grandes y avanzados son, más inteligentes y capaces de conversar se vuelven.

En la tabla aparecen modelos muy conocidos como GPT-4 de OpenAI o Claude de Anthropic, junto a otros menos populares.

Se muestran varias métricas para evaluar la capacidad de cada modelo:

Puntuación Arena Elo: mide qué tan bueno es conversando según la opinión de miles de usuarios reales. Entre más alto, se considera mejor modelo conversacional.
Puntuación MT-bench: evalúa qué tan bien responde el modelo preguntas complejas de múltiples turnos.
MMLU: mide la precisión del modelo en 57 tareas diferentes de lenguaje.

También indica si el modelo es de código abierto o proprietario, es decir, si su tecnología se comparte libremente o pertenece a una empresa.

La tabla permite comparar las habilidades conversacionales y el desempeño de los modelos de IA más populares, para ver cuáles son los más potentes en este momento. Los modelos open source buscan democratizar la IA al compartirla libremente.

Posición	Modelo	Puntuación Arena Elo	Puntuación MT-bench	MMLU	Licencia
1	GPT-4	1206	8.99	86.4	Propietario
2	Claude-1	1166	7.9	77	Propietario
3	Claude-instant-1	1138	7.85	73.4	Propietario
4	Claude-2	1135	8.06	78.5	Propietario
5	GPT-3.5-turbo	1122	7.94	70	Propietario
6	Vicuna-33B	1096	7.12	59.2	No comercial
7	Vicuna-13B	1051	6.57	55.8	Comunidad Llama 2
8	MPT-30B-chat	1046	6.39	50.4	CC-BY-NC-SA-4.0
9	WizardLM-13B-v1.1	1040	6.76	50	No comercial
10	Guanaco-33B	1038	6.53	57.6	No comercial
11	PaLM-Chat-Bison-001	1015	6.4	–	Propietario
12	Vicuna-7B	1006	6.17	49.8	Comunidad Llama 2
13	Llama-2-13b-chat	987	6.65	53.6	Comunidad Llama 2
14	Koala-13B	983	5.35	44.7	No comercial
15	GPT4All-13B-Snoozy	967	5.41	43	x
16	Llama-2-7b-chat	961	6.27	45.8	Comunidad Llama 2
17	MPT-7B-Chat	947	5.42	32	CC-BY-NC-SA-4.0
18	RWKV-4-Raven-14B	943	3.98	25.6	Apache 2.0
19	Alpaca-13B	923	4.53	48.1	No comercial
20	OpenAssistant-Pythia-12B	915	4.32	27	Apache 2.0
21	ChatGLM-6B	900	4.5	36.1	No comercial
22	FastChat-T5-3B	892	3.04	47.7	Apache 2.0
23	StableLM-Tuned-Alpha-7B	863	2.75	24.4	CC-BY-NC-SA-4.0
24	Dolly-V2-12B	842	3.28	25.7	MIT
25	LLaMA-13B	817	2.61	47	No comercial
26	WizardLM-30B	–	7.01	58.7	No comercial
27	Vicuna-13B-16k	–	6.87	54.1	Comunidad Llama 2
28	Llama-2-70b-chat	–	6.86	63	Comunidad Llama 2
29	Tulu-30B	–	6.43	58.1	No comercial
30	Guanaco-65B	–	6.41	62.1	No comercial
31	OpenAssistant-LLaMA-30B	–	6.41	56	No comercial
32	WizardLM-13B	–	6.35	52.3	No comercial
33	Vicuna-7B-16k	–	6.22	48.5	Comunidad Llama 2
34	Baize-v2-13B	–	5.75	48.9	No comercial
35	XGen-7B-8K-Inst	–	5.55	42.1	No comercial
36	Nous-Hermes-13B	–	5.51	49.3	No comercial
37	MPT-30B-Instruct	–	5.22	47.8	CC-BY-SA 3.0
38	Falcon-40B-Instruct	–	5.17	54.7	Apache 2.0
39	ChatGLM2-6B	–	4.96	45.5	Apache-2.0
40	H2O-Oasst-OpenLLaMA-13B	–	4.63	42.8	Apache 2.0

La trampa de lo «gratuito»

Si bien los modelos son gratuitos, implementarlos y sacarles provecho no es tan sencillo. Se requiere experiencia en:

Deployment de modelos en la nube.
Entrenamiento con datos personalizados.
Desarrollo de aplicaciones especializadas.

Esto está impulsando un mercado de servicios de consultoría para modelos open source, con gran potencial de negocio.

El futuro ecosistema de IA

Más allá de los modelos, la apertura se expande a otros componentes clave de la IA:

Datos: lanzamiento de conjuntos de datos abiertos para entrenamiento.
Algoritmos: frameworks de machine learning como TensorFlow o PyTorch.
Chips: arquitecturas abiertas como RISC-V acelerando la innovación en hardware.

En definitiva, la democratización de la IA apenas comienza. Queda por ver si la apertura desplazará finalmente a los actores dominantes actuales.

DESCUBRE MÁS SOBRE EL TEMA

Noticias

Open Source

Este artículo fue escrito por Miguel Ángel G.P. y habla sobre Open Source y Noticias. Se publicó el 8 de agosto de 2023.