La nueva ola de modelos de IA abiertos desaf铆a el dominio de OpenAI

InicioBlog IANoticiasLa nueva ola de modelos de IA abiertos desaf铆a el dominio de OpenAI
Dos robots hablando mientras toman caf茅.

La inteligencia artificial generativa est谩 viviendo un momento fascinante. Con el reciente lanzamiento de modelos de IA de c贸digo abierto como LLaMA 2 y ChatGLM, se est谩 gestando una nueva tendencia hacia la apertura y la democratizaci贸n en este campo.

El reinado de OpenAI y sus aliados

Hasta ahora, OpenAI dominaba claramente el mercado de los grandes modelos de lenguaje con GPT-3 y el reciente GPT-4, considerado el m谩s avanzado. Sus modelos son de c贸digo cerrado, y OpenAI decide qui茅n puede acceder a ellos.

Pero incluso sus socios m谩s cercanos, como Microsoft y Meta, ahora est谩n abrazando el movimiento de c贸digo abierto, desafiando el dominio de OpenAI con alternativas como LLaMA 2.

La oleada de modelos abiertos

En las 煤ltimas semanas, han surgido m煤ltiples anuncios de nuevos modelos de IA de gran tama帽o y c贸digo abierto:

  • Meta liber贸 LLaMA 2, en alianza con Microsoft.
  • Alibaba Cloud lanz贸 modelos abiertos como Qwen-7B.
  • Baidu incorpor贸 30 modelos open source a su plataforma Wenxin Qianfan.

驴Por qu茅 esta tendencia open source?

Hay varios motivos detr谩s de este movimiento:

Fomentar la innovaci贸n

Al liberar los modelos, m谩s desarrolladores pueden experimentar, crear nuevas aplicaciones y mejorar la tecnolog铆a. Es similar a Android vs iOS.

Demostrar capacidades

Abrir el c贸digo permite validar la calidad de los modelos. Las empresas quieren mostrar que pueden competir con OpenAI.

Agilidad

La actualizaci贸n de modelos open source es m谩s r谩pida. Y los desarrolladores prefieren su flexibilidad.

Crear ecosistemas

Un ecosistema amplio alrededor de LLaMA 2 y otros modelos abiertos ayuda a que se adopten r谩pidamente.

Modelos de lenguaje grande (LLMs) ordenados por capacidad

Esta tabla muestra un ranking de los principales modelos de inteligencia artificial conversacional ordenados seg煤n su capacidad.

Estos modelos de IA se entrenan para poder mantener conversaciones coherentes y fluidas como si fueran humanos. Cuanto m谩s grandes y avanzados son, m谩s inteligentes y capaces de conversar se vuelven.

En la tabla aparecen modelos muy conocidos como GPT-4 de OpenAI o Claude de Anthropic, junto a otros menos populares.

Se muestran varias m茅tricas para evaluar la capacidad de cada modelo:

  • Puntuaci贸n Arena Elo: mide qu茅 tan bueno es conversando seg煤n la opini贸n de miles de usuarios reales. Entre m谩s alto, se considera mejor modelo conversacional.
  • Puntuaci贸n MT-bench: eval煤a qu茅 tan bien responde el modelo preguntas complejas de m煤ltiples turnos.
  • MMLU: mide la precisi贸n del modelo en 57 tareas diferentes de lenguaje.

Tambi茅n indica si el modelo es de c贸digo abierto o proprietario, es decir, si su tecnolog铆a se comparte libremente o pertenece a una empresa.

La tabla permite comparar las habilidades conversacionales y el desempe帽o de los modelos de IA m谩s populares, para ver cu谩les son los m谩s potentes en este momento. Los modelos open source buscan democratizar la IA al compartirla libremente.

Posici贸nModeloPuntuaci贸n Arena EloPuntuaci贸n MT-benchMMLULicencia
1GPT-412068.9986.4Propietario
2Claude-111667.977Propietario
3Claude-instant-111387.8573.4Propietario
4Claude-211358.0678.5Propietario
5GPT-3.5-turbo11227.9470Propietario
6Vicuna-33B10967.1259.2No comercial
7Vicuna-13B10516.5755.8Comunidad Llama 2
8MPT-30B-chat10466.3950.4CC-BY-NC-SA-4.0
9WizardLM-13B-v1.110406.7650No comercial
10Guanaco-33B10386.5357.6No comercial
11PaLM-Chat-Bison-00110156.4Propietario
12Vicuna-7B10066.1749.8Comunidad Llama 2
13Llama-2-13b-chat9876.6553.6Comunidad Llama 2
14Koala-13B9835.3544.7No comercial
15GPT4All-13B-Snoozy9675.4143x
16Llama-2-7b-chat9616.2745.8Comunidad Llama 2
17MPT-7B-Chat9475.4232CC-BY-NC-SA-4.0
18RWKV-4-Raven-14B9433.9825.6Apache 2.0
19Alpaca-13B9234.5348.1No comercial
20OpenAssistant-Pythia-12B9154.3227Apache 2.0
21ChatGLM-6B9004.536.1No comercial
22FastChat-T5-3B8923.0447.7Apache 2.0
23StableLM-Tuned-Alpha-7B8632.7524.4CC-BY-NC-SA-4.0
24Dolly-V2-12B8423.2825.7MIT
25LLaMA-13B8172.6147No comercial
26WizardLM-30B7.0158.7No comercial
27Vicuna-13B-16k6.8754.1Comunidad Llama 2
28Llama-2-70b-chat6.8663Comunidad Llama 2
29Tulu-30B6.4358.1No comercial
30Guanaco-65B6.4162.1No comercial
31OpenAssistant-LLaMA-30B6.4156No comercial
32WizardLM-13B6.3552.3No comercial
33Vicuna-7B-16k6.2248.5Comunidad Llama 2
34Baize-v2-13B5.7548.9No comercial
35XGen-7B-8K-Inst5.5542.1No comercial
36Nous-Hermes-13B5.5149.3No comercial
37MPT-30B-Instruct5.2247.8CC-BY-SA 3.0
38Falcon-40B-Instruct5.1754.7Apache 2.0
39ChatGLM2-6B4.9645.5Apache-2.0
40H2O-Oasst-OpenLLaMA-13B4.6342.8Apache 2.0

 

La trampa de lo 芦gratuito禄

Si bien los modelos son gratuitos, implementarlos y sacarles provecho no es tan sencillo. Se requiere experiencia en:

  • Deployment de modelos en la nube.
  • Entrenamiento con datos personalizados.
  • Desarrollo de aplicaciones especializadas.

Esto est谩 impulsando un mercado de servicios de consultor铆a para modelos open source, con gran potencial de negocio.

El futuro ecosistema de IA

M谩s all谩 de los modelos, la apertura se expande a otros componentes clave de la IA:

  • Datos: lanzamiento de conjuntos de datos abiertos para entrenamiento.
  • Algoritmos: frameworks de machine learning como TensorFlow o PyTorch.
  • Chips: arquitecturas abiertas como RISC-V acelerando la innovaci贸n en hardware.

En definitiva, la democratizaci贸n de la IA apenas comienza. Queda por ver si la apertura desplazar谩 finalmente a los actores dominantes actuales.

DESCUBRE M脕S SOBRE EL TEMA

Deja el primer comentario