Has estado entrenando la IA de Google gratis durante 15 años, y ni siquiera lo sabías.

By: block beats|2026/03/18 18:07:05
0
Compartir
copy
Título original: Llevas 15 años entrenando la IA de Google. No tenías ni idea.
Autor original: Sharbel, cofundador de Unfungible
Traductor original: Lila, BlockBeats
Nota del editor: El CAPTCHA, esos números o imágenes en los que hay que hacer clic cada vez que se inicia sesión en un sitio web, es algo familiar para todos los usuarios de Internet. Pero cuando haces clic una y otra vez en "No soy un robot", puedes pensar que solo estás verificando tu identidad, cuando en realidad estás participando en la producción de datos más grande y secreta del mundo. El sistema reCAPTCHA de Luis von Ahn ha recopilado información dispersa sobre el comportamiento humano, convirtiéndola en una base de datos fundamental que sirve de apoyo a Google y a su filial, la empresa de vehículos autónomos Waymo.
Bajo la fachada de "gratis" y "seguro", Internet ha transformado silenciosamente una nueva forma de relación laboral: dedicas tiempo a demostrar que eres humano, pero en realidad estás contribuyendo al entrenamiento de la IA, y una vez que la IA aprende, este trabajo es completamente reemplazado. Este artículo ha recibido más de 9,5 millones de visualizaciones en Twitter en menos de 20 horas. El siguiente es el contenido original:

Google explota gratuitamente aproximadamente 500.000 horas de trabajo humano cada día. Y las personas que contribuyen a esto solo quieren iniciar sesión en la banca en línea.

reCAPTCHA es la operación de datos invisibles más exitosa en la historia de Internet. En su momento de mayor auge, 200 millones de personas completaban el proceso de verificación cada día. Pero casi nadie se daba cuenta de lo que significaba cada clic entre bastidores.

Waymo, la empresa de coches autónomos de Google, está valorada actualmente en 45.000 millones de dólares. Y la mayor parte de sus datos de entrenamiento básicos los proporcionas tú mismo de forma gratuita al acceder a diversos sitios web.

Aquí está la historia completa:

Origen: Una idea ingeniosa

En el año 2000, los bots de spam estaban causando estragos en Internet. Los foros estaban saturados, las bandejas de entrada desbordadas y los sitios web necesitaban una forma de distinguir entre humanos y máquinas.

El profesor Luis von Ahn, de la Universidad Carnegie Mellon, resolvió este problema. Él inventó el CAPTCHA: un texto distorsionado que solo los humanos podían leer, no los bots.

Pero von Ahn vio algo más que eso. Millones de personas habían dedicado su energía a estos desafíos. ¿Y si esa energía pudiera hacer dos cosas a la vez?

En 2007, introdujo reCAPTCHA. Su genialidad: ya no muestra texto ilegible y confuso, sino dos palabras. Una de las palabras era conocida por el sistema, la otra era una palabra real de un libro escaneado que las computadoras aún no podían reconocer. Y su respuesta ayudó en la digitalización de estos libros.

Estos libros proceden de los archivos de The New York Times y de Google Books, sumando un total de 130 millones.

Creías que simplemente estabas iniciando sesión en un sitio web normal, pero en realidad estabas realizando un proceso de OCR (reconocimiento óptico de caracteres) para la biblioteca digital más grande del mundo.

En 2009, Google adquirió oficialmente reCAPTCHA.

Has estado entrenando la IA de Google gratis durante 15 años, y ni siquiera lo sabías.

Más tarde, Google cambió las reglas del juego.

La era de los "textos retorcidos" terminó alrededor de 2012.

Google se enfrentó a un nuevo desafío: Los coches de Street View habían fotografiado todas las carreteras del mundo, pero las imágenes no eran más que datos en bruto. Para que la IA hiciera su magia, necesitaba comprender lo que veía: señales de tráfico, pasos de peatones, semáforos, escaparates.

Así que Google rediseñó reCAPTCHA v2. En lugar de texto distorsionado, había cuadrículas de fotos. "Haz clic en todas las casillas con semáforos." "Selecciona todos los pasos de peatones." "Identifica los escaparates."

Estas imágenes proceden directamente de Google Street View. Tus clics sirvieron como etiquetas.

Cada selección aportaba información al modelo de visión artificial de Google: estos píxeles forman un semáforo, esa forma es un paso de peatones. No estabas haciendo un examen; estabas creando un conjunto de datos.

Una escala inimaginable

En su momento de mayor auge, se resolvían 200 millones de reCAPTCHAs al día. Cada desafío duraba 10 segundos, lo que supone 2.000 millones de segundos de trabajo humano al día. Eso son 500.000 horas al día.

El coste del etiquetado de datos de pago oscila entre 10 y 50 dólares por hora. Calculado al tipo de cambio más bajo: el valor diario del trabajo extraído libremente alcanzó hasta 5 millones de dólares.

Además, reCAPTCHA no existe solo en una aplicación en particular. Está presente en todos los bancos, en todos los portales gubernamentales, en todos los sitios web de comercio electrónico. No tienes opción: ¿Quieres iniciar sesión en tu cuenta? Primero, ayude a anotar el conjunto de datos. Google nunca te ha pedido tu opinión, te ha pagado un solo centavo de sueldo ni siquiera te ha informado sobre esto.

¿A qué ha conducido todo esto?

Estos datos se utilizan directamente en dos productos:

-Google Maps: La herramienta de navegación más utilizada a nivel mundial. Su capacidad para reconocer señales de tráfico, tiendas y la geografía de la ciudad se debe en parte a los miles de millones de anotaciones humanas realizadas al iniciar sesión en sitios web.

-Waymo: El proyecto de vehículos autónomos de Google. Para una navegación segura, los vehículos autónomos necesitan identificar casi a la perfección miles de patrones visuales.

Los datos de entrenamiento de referencia para ese trabajo de identificación son precisamente los que millones de personas anotaron sin saberlo a través de reCAPTCHA. Waymo realizó más de 4 millones de viajes pagados en 2024, valorados en 45.000 millones de dólares. Su piedra angular fue colocada por esos "usuarios de internet no remunerados" que simplemente querían consultar su correo electrónico.

¿Por qué nadie puede replicar este modelo?

La anotación de datos es extremadamente costosa. Empresas como Scale AI, Appen y Labelbox existen para resolver este problema; contratan a cientos de miles de trabajadores, a veces pagándoles menos de 1 dólar por hora.

Google adoptó un enfoque diferente para este problema: convirtió la anotación en un requisito. No se requiere pago ni consentimiento, sino que sirve como "boleto" para acceder a todos los rincones de internet. El resultado: miles de millones de imágenes etiquetadas, cobertura global, en cualquier condición climática, en todas las ciudades del mundo. Ninguna empresa de anotaciones puede lograr esto. Internet en sí misma es una fábrica, y cada internauta es un empleado indocumentado.

Sigues participando

reCAPTCHA v3, lanzado en 2018, ya ni siquiera muestra los desafíos. Observa cómo mueves el ratón, la velocidad de desplazamiento y el tiempo de permanencia. Tu huella conductual le indica si eres humano. Estos datos de comportamiento también se utilizan como base para los sistemas de inteligencia artificial de Google.

Nunca elegiste unirte activamente, nunca tuviste que marcar una casilla. Sin embargo, en la mayoría de los sitios web que visitas, sigues haciendo esto.

Ironía inquietante

La intención original de Luis von Ahn era brillante: transformar la energía que los humanos ya estaban desperdiciando en energía útil. Sin embargo, lo que Google hizo con esta visión es una historia completamente diferente. Tomaron un mecanismo de seguridad que los usuarios debían utilizar, lo implementaron en toda la web y aprovecharon los resultados para crear un producto comercial valorado en cientos de miles de millones de dólares. Los usuarios no obtuvieron nada a cambio, ni siquiera visibilidad.

La mayor ironía es la siguiente: pasaste años demostrando que eres humano completando tareas de reconocimiento visual que la IA no podía realizar en aquel momento. Pero una vez que la IA aprendió a realizar estas tareas, las anotaciones visuales humanas dejaron de ser necesarias.

Demostraste ser humano, solo para terminar volviéndote reemplazable.

Enlace a la publicación original

Precio de --

--

También te puede gustar

Reglamentación, insiderismo y esencia: La historia detrás de la valoración de 20.000 millones de dólares de Kalshi

El 80% de los usuarios solo consumen información

Cómo comerciar con criptomonedas sin App Store: Comercio de criptomonedas instantáneo en WEEX

Comercia cripto al instante sin descargar una app. Usá WEEX H5 para acceder al comercio al contado y de futuros directamente en tu navegador con ejecución rápida, control de riesgo en tiempo real y una experiencia fluida en móvil, tablet y escritorio. Soporta Bitcoin, Ethereum y más.

Desde OKX hasta Bybit, las plataformas de intercambio están cambiando las ruedas en plena autopista a toda velocidad

En el contexto actual de endurecimiento de la normativa a nivel mundial, si se puede acceder directamente al mercado con un socio que ya cuente con un sistema de cumplimiento normativo, la autorización de la licencia federal, la credibilidad de una empresa que cotiza en bolsa y el acceso a canales de cooperación bancaria, el coste es simplemente...

Breve historia y futuro de los contratos perpetuos

Las plataformas descentralizadas de contratos perpetuos, como Hyperliquid, están sustituyendo a los derivados tradicionales gracias a sus ventajas estructurales, convirtiéndose en plataformas financieras valoradas en billones de dólares que atraen activos de todo el mundo.

Un agente de IA obtiene su documento de identidad y su monedero digital el mismo día | Resumen matutino de Rewire News

La infraestructura de agentes para la economía se está desarrollando más rápido de lo que nadie esperaba

IOSG: Cambio de paradigma en la flexibilidad energética: De los macroactivos a la capa de inteligencia distribuida

Se está pidiendo al sistema energético que realice una tarea para la que no fue diseñado.

Monedas populares

Últimas noticias cripto

Más información