Cómo impedir que tus datos se usen para el entrenamiento de ChatGPT y otros chatbots

Inicio · Blog IA · Guías y tutoriales · Cómo impedir que tus datos se usen para el entrenamiento de ChatGPT y otros chatbots
Usuario ajustando los parámetros de privacidad de ChatGPT.

¿Por qué deberías preocuparte por tus datos? Hoy en día, la privacidad de nuestros datos es un tema más relevante que nunca. ¿Te has preguntado alguna vez qué ocurre con la información que compartes en internet? Grandes compañías utilizan tus datos para entrenar modelos de inteligencia artificial como ChatGPT. Esto significa que tu información podría ser parte de enormes bases de datos que enseñan a estas tecnologías a entender y generar lenguaje. Pero, ¿es esto realmente lo que quieres?

Es fundamental comprender que tus datos no solo se utilizan para mejorar servicios, sino que también pueden ser compartidos con terceros sin tu consentimiento explícito. Esto podría llevar a situaciones incómodas o incluso peligrosas, como el uso indebido de información personal o la creación de perfiles que pueden afectar tus oportunidades laborales o financieras. ¿Suena alarmante? ¡Lo es!

A medida que más personas se preocupan por su privacidad en línea, surge la necesidad de saber cómo proteger nuestros datos. No solo se trata de evitar el espionaje, sino de tener el control sobre quién accede a tu información y para qué fines. La buena noticia es que existen maneras de optar por no compartir tus datos y así mantener tu privacidad intacta.

Cómo saber si tu información está siendo utilizada

Detectar si tus datos están siendo utilizados para entrenar modelos de inteligencia artificial puede parecer complicado, pero hay algunas señales y pasos que puedes seguir para descubrirlo. Primero, revisa las políticas de privacidad de las plataformas que usas. Muchas veces, estas políticas detallan cómo se recopilan, usan y comparten tus datos. Aunque suelen ser largas y técnicas, buscar palabras clave como «entrenamiento de IA» o «compartición de datos con terceros» puede ayudarte a entender mejor cómo se manejan tus datos.

Además, algunas plataformas ofrecen herramientas de transparencia que permiten a los usuarios ver cómo se utiliza su información. Por ejemplo, Google y Facebook tienen secciones donde puedes revisar y controlar la actividad de tus datos. Estas herramientas no solo te muestran qué datos se recopilan, sino también cómo se utilizan para personalizar tu experiencia o entrenar algoritmos.

Otra manera de saber si tu información está siendo utilizada es estar atento a comunicaciones y anuncios personalizados. Si notas que recibes recomendaciones extremadamente precisas o anuncios que parecen saber demasiado sobre ti, es probable que tus datos estén siendo procesados por sistemas de inteligencia artificial. Esto no solo incluye las búsquedas en internet, sino también el contenido que consumes en redes sociales y servicios de streaming.

Por último, no dudes en preguntar directamente a las compañías sobre el uso de tus datos. Muchas veces, enviar un correo electrónico o usar los canales de soporte puede darte respuestas claras y específicas. Saber cómo y por qué se utilizan tus datos es el primer paso para tomar decisiones informadas sobre tu privacidad.

Pasos para optar por no compartir tus datos

Si decides que no quieres que tus datos sean utilizados para entrenar modelos de inteligencia artificial, existen varias acciones que puedes tomar para proteger tu privacidad. Aquí te dejamos algunos pasos prácticos:

  1. Ajusta la configuración de privacidad: La mayoría de las plataformas te permiten ajustar la configuración de privacidad para limitar el acceso a tus datos. Ve a la sección de configuración de privacidad y asegúrate de desactivar cualquier opción que permita el uso de tus datos para entrenamiento de IA o compartición con terceros.
  2. Utiliza herramientas de exclusión: Algunas empresas ofrecen herramientas específicas para optar por no compartir tus datos. Por ejemplo, OpenAI y otras organizaciones permiten a los usuarios enviar solicitudes para excluir su información del entrenamiento de sus modelos. Investiga si las plataformas que usas tienen opciones similares (te dejo una tabla completa más abajo con muchas plataformas y sus herramientas de exclusión) y sigue los pasos necesarios para completar la exclusión.
  3. Elimina tu información: En algunos casos, puedes solicitar la eliminación completa de tus datos de los servidores de una compañía. Esto es especialmente útil si decides dejar de usar un servicio y quieres asegurarte de que tu información no quede almacenada.
  4. Educa a tus amigos y familiares: A menudo, nuestros datos se recopilan indirectamente a través de interacciones con otras personas. Informa a tus amigos y familiares sobre la importancia de la privacidad y anímalos a tomar medidas similares para proteger su información.
  5. Usa servicios y aplicaciones centrados en la privacidad: Considera cambiar a servicios que priorizan la privacidad y la seguridad. Por ejemplo, motores de búsqueda como DuckDuckGo no rastrean tus búsquedas, y aplicaciones de mensajería como Signal ofrecen cifrado de extremo a extremo.

Te dejo una tabla con los pasos a seguir y los enlaces correspondientes de cada plataforma para que puedas empezar a controlar el uso que se da a tus datos. Espero que te sea útil.

EmpresaEnlaceInstrucciones
AdobeAdobe Privacy PageAbre la página de privacidad de Adobe, desplázate hasta la sección de Análisis de contenido y haz clic en el interruptor para desactivarlo. Para cuentas de negocios o escolares, el proceso de exclusión no está disponible a nivel individual; debes contactar a tu administrador.
Amazon: AWSAWS Support PageEl proceso de exclusión es complicado. Necesitas ayuda de un profesional de TI en tu empresa o un representante de AWS. Incluye habilitar la opción para tu organización, crear una política y adjuntar esa política donde sea necesario.
Google: GeminiGoogle Privacy Hub for GeminiAbre Gemini en tu navegador, haz clic en Actividad y selecciona el menú desplegable Desactivar. Aquí puedes simplemente desactivar la Actividad de Apps de Gemini o también optar por eliminar tus datos de conversación.
GrammarlyGrammarly Account SettingsPara cuentas personales, no hay proceso de exclusión. Para cuentas de negocios autogestionadas, abre Configuración de cuenta, haz clic en la pestaña Configuración de datos y desactiva Mejora y Entrenamiento del producto. Las cuentas administradas están automáticamente excluidas del entrenamiento de IA.
HubSpotEmail to HubSpotEnvía un correo electrónico a [email protected] solicitando que los datos asociados a tu cuenta sean excluidos del uso para entrenamiento de IA.
OpenAI: ChatGPTChatGPT SettingsInicia sesión en ChatGPT, selecciona Configuración, Controles de datos y desactiva Historial de chat y Entrenamiento. En las apps móviles, ve a Configuración, Controles de datos y desactiva Historial de chat y Entrenamiento.
PerplexityPerplexity SettingsInicia sesión en tu cuenta, haz clic en tu nombre de cuenta, desplázate a la sección de Cuenta y desactiva el interruptor de Retención de datos de IA.
QuoraQuora Privacy SettingsVisita la página de Configuración, haz clic en Privacidad y desactiva la opción «Permitir que modelos de lenguaje grandes se entrenen con tu contenido».
SlackEmail to SlackEl administrador debe enviar un correo a [email protected] con el asunto «Solicitud de exclusión del modelo global de Slack» e incluir la URL de tu organización.
SquarespaceSquarespace SettingsAbre Configuración dentro de tu cuenta, busca Rastreadores y desactiva los Rastreadores de Inteligencia Artificial.
SubstackSubstack SettingsEn la página de Configuración, desplázate a la sección de Publicación y activa el interruptor para Bloquear entrenamiento de IA.
TumblrTumblr App SettingsEn la app de Tumblr, ve a Configuración de cuenta, selecciona tu blog, haz clic en el icono de engranaje, selecciona Visibilidad y activa la opción «Prevenir el uso compartido con terceros».
WordPressWordPress DashboardVisita el panel de tu sitio web, haz clic en Configuración, General, y luego en Privacidad, selecciona la casilla para Prevenir el uso compartido con terceros.
Evitar que rastreen Tu sitio webArchivo Robots.txtActualiza el archivo robots.txt de tu sitio web para decirle a los bots de IA que no rastreen las páginas. Añade un comando de desactivación; si no sabes de lo que hablo, echa un vistazo al código que hay a continuación.

Cómo evitar que las IAs rastreen tu sitio web

Si tienes tu propio sitio web, puedes actualizar tu archivo robots.txt para decirle a los bots de IA que no raspen las páginas. La mayoría de los sitios de noticias no permiten que sus artículos sean rastreados por bots de IA. El archivo robots.txt de muchas webs no permite bots de OpenAI, Google, Amazon, Facebook, Anthropic o Perplexity, entre otros.

Esta opción de exclusión no es solo para los grandes editores: cualquier sitio web, grande o pequeño, puede modificar su archivo robots para excluir a los rastreadores de IA. Solo necesitas agregar un comando de desautorización; aquí puedes encontrar ejemplos prácticos:

# El conjunto de datos de Common Crawl. Fuente original para GPT y otros.
User-agent: CCBot
Disallow: /

# El ejemplo para img2dataset, aunque el valor predeterminado es *None*
User-agent: img2dataset
Disallow: /

# GPTBot es el rastreador web de OpenAI
User-agent: GPTBot
Disallow: /

# ChatGPT-User toma acciones directas en nombre de los usuarios de ChatGPT
User-agent: ChatGPT-User
Disallow: /

# Bard y Vertex AI son APIs generativas de Google
User-agent: Google-Extended
Disallow: /

# Bloqueos especulativos para Anthropic
User-agent: anthropic-ai
Disallow: /

User-agent: Claude-Web
Disallow: /

# webz.io - venden datos para entrenar modelos de lenguaje.
User-agent: Omgilibot
Disallow: /

User-agent: Omgili
Disallow: /

# El bot de Meta que rastrea páginas web públicas para mejorar los modelos de lenguaje
User-agent: FacebookBot
Disallow: /

# El bot de ByteDance utilizado para recopilar datos para sus modelos de lenguaje, incluyendo Doubao.
User-agent: Bytespider
Disallow: /

# Brandwatch - "IA para descubrir nuevas tendencias"
User-agent: magpie-crawler
Disallow: /

Tomar estos pasos no solo te ayudará a mantener tus datos privados, sino que también enviará un mensaje claro a las compañías sobre la importancia de la privacidad para los usuarios.

DESCUBRE MÁS SOBRE EL TEMA

Deja el primer comentario