Llevas 15 años entrenando la inteligencia artificial de Google gratis, y ni siquiera sabías

By: blockbeats|2026/03/18 18:04:54
0
Compartir
copy
Título original: Llevas 15 años entrenando IA de Google. No tenías ni idea.
Autor original: Sharbel, cofundadora de Unfungible
Traductor original: Lila, bloque
Nota del editor: CAPTCHA, los números o imágenes en los que debe hacer clic cada vez que inicie sesión en un sitio web, son familiares para cada usuario de Internet. Pero cuando haces clic en “No soy un robot” una y otra vez, puedes pensar que solo estás verificando tu identidad, cuando en realidad estás participando en la producción de datos más grande y secreta del mundo. El reCAPTCHA de Luis von Ahn ha agregado el comportamiento humano disperso en una piedra angular de datos que apoya a Google y su filial, la Empresa autónoma Waymo.
Bajo la fachada de "gratuito" y "seguro", Internet ha reformado silenciosamente una nueva forma de relación laboral: pasas tiempo demostrando que eres humano, pero en realidad estás contribuyendo a la capacitación en IA, y una vez que la IA aprende, esta labor se reemplaza por completo. Este artículo ha recibido más de 9,5 millones de visitas en Twitter en menos de 20 horas. El contenido original es el siguiente:

Aproximadamente 500.000 horas de trabajo humano son explotadas libremente por Google cada día. Y las personas que contribuyen a esto solo quieren iniciar sesión en la banca en línea.

reCAPTCHA es la operación de datos invisibles más exitosa en la historia de Internet. En su apogeo, 200 millones de personas completaron el proceso de verificación cada día. Pero casi nadie se dio cuenta de lo que significaba cada clic detrás de escena.

La Empresa de automóviles autónomos de Google, Waymo, tiene ahora un valor de 45.000 millones de dólares. Y la mayoría de sus datos básicos de capacitación son proporcionados libremente por usted a medida que accede a varios sitios web.

Aquí tienes la historia completa:

Origen: Una idea inteligente

En 2000, bots spam estaban causando estragos en Internet. Los foros estaban inundados, las bandejas de entrada desbordaban y los sitios web necesitaban una forma de distinguir entre humanos y máquinas.

El profesor de la Universidad Carnegie Mellon Luis von Ahn resolvió este problema. Inventó CAPTCHA: texto distorsionado que solo los humanos podían leer, no bots.

Pero von Ahn vio más que eso. Millones de personas habían dedicado su energía a estos desafíos. ¿Y si esa energía pudiera hacer dos cosas a la vez?

En 2007, presentó reCAPTCHA. Su brillantez: en long no muestra texto distorsionado al azar, sino dos palabras. Una palabra era conocida por el sistema, la otra una palabra de libro escaneada real que las computadoras aún no podían reconocer. Y tu respuesta ayudó en la digitalización de estos libros.

Estos libros procedían de los archivos del New York Times y de Google Books, por un total de hasta 130 millones.

Pensaste que solo estabas iniciando sesión en un sitio web regular, pero en realidad estabas realizando OCR (Reconocimiento Óptico de Caracteres) para la biblioteca digital más grande del mundo.

En 2009, Google adquirió oficialmente el reCAPTCHA.

Llevas 15 años entrenando la inteligencia artificial de Google gratis, y ni siquiera sabías

Más tarde, Google cambio el juego

La era del "texto retorcido" terminó alrededor de 2012.

Google se enfrentó a un nuevo desafío: Los coches Street View habían fotografiado todas las carreteras del mundo, pero las imágenes eran solo datos brutos. Para que la IA hiciera su magia, necesitaba comprender lo que veía: señales de tráfico, cruzados, semáforos, escaparates.

Así que Google rediseñó el reCAPTCHA v2. En lugar de texto distorsionado, había grid de fotos. Haz clic en todas las plazas con semáforos. Selecciona cada cruzado. Identifica los escaparates.

Estas imágenes provienen directamente de Google Street View. Tus clics sirvieron como etiquetas.

Cada selección estaba informando el modelo de visión artificial de Google: estos píxeles forman un semáforo, esa forma es un cruzado. No estabas haciendo una prueba; estabas construyendo un conjunto de datos.

Una escala inimaginable

En su apogeo, 200 millones de reCAPTCHA se resolvieron diariamente. Cada desafío tomó 10 segundos, lo que significa 2.000 millones de segundos de trabajo humano por día. 500.000 horas diarias.

El costo del etiquetado de datos pagado es de aproximadamente $10 a $50 por hora. Calculado a la tasa más baja: el valor diario de la mano de obra libremente extraída alcanzó hasta $5 millones.

Además, reCAPTCHA no solo existe en una app en particular. Está presente en todos los bancos, portales gubernamentales, sitios web de comercio electrónico. No tienes elección: ¿Quieres iniciar sesión en tu cuenta? Primero, ayuda a anotar el conjunto de datos. Google nunca te ha pedido tu opinión, ni te ha pagado un centavo de salario, ni siquiera te ha hablado de esto.

¿A qué ha llevado todo esto?

Estos datos se alimentan directamente a dos productos:

-Google Maps: La herramienta de navegación más utilizada a nivel mundial. Su capacidad para reconocer las señales de tráfico, las tiendas y la geografía de la ciudad se crédito parcialmente a los miles de millones de anotaciones humanas realizadas al iniciar sesión en sitio web.

Waymo: Proyecto de autoconducción de Google. Para una navegación segura, los vehículos autónomos deben identificar casi perfectamente miles de patrones visuales.

Los datos de capacitación sobre la verdad terrestre para ese trabajo de identificación son precisamente los que millones de personas anotaron sin saberlo a través de reCAPTCHA. Waymo completó más de 4 millones de viajes pagados en 2024, valorada en 45.000 millones de dólares. Su piedra angular, colocada por aquellos "usuarios de internet no remunerados" que solo querían revisar su email.

¿Por qué nadie puede replicar este modelo?

La anotación de datos es extremadamente costosa. Empresas como Scale AI, Appen y Labelbox existen para resolver este problema; contratan a cientos de miles de trabajadores, a veces pagando menos de $1 por hora.

Google adoptó un enfoque diferente al problema: convirtieron la anotación en un requisito. No se requiere pago, no se necesita consentimiento, sino como un "ticket" para ingresar a cada rincón de internet. El resultado: miles de millones de imágenes etiquetadas, cobertura global, todo el clima, todas las ciudades del mundo. Ninguna Empresa puede lograrlo. Internet en sí es una fábrica, y cada internauta es un empleado indocumentado.

Todavía estás participando

reCAPTCHA v3, lanzado en 2018, en long ni siquiera muestra desafíos. Observa cómo mueves el mouse, la velocidad de desplazamiento, el tiempo de permanencia. Tu huella dactilar de comportamiento le informa si eres humano. Estos datos de comportamiento también se retroalimentan a los sistemas de IA de Google.

Nunca elegiste unirte activamente, nunca tuviste una casilla para marcar. Sin embargo, en este momento, en la mayoría de sitios web que visitas, aún estás haciendo esto.

Ironía inquietante

La intención original de Luis von Ahn era brillante: transformar la energía que los humanos ya estaban desperdiciando en una producción útil. Sin embargo, lo que Google hizo con esta visión es una historia completamente diferente. Tomaron un mecanismo de seguridad que los usuarios tenían que usar, lo implementaron en toda la web y cosecharon el producto para construir un producto comercial por un valor de cientos de miles de millones de dólares. Los usuarios no reciben nada a cambio, ni siquiera conciencia.

La ironía más profunda es que pasaste años probando que eres humano completando tareas de reconocimiento visual que IA no pudo hacer en ese momento. Pero una vez que la IA aprendió a hacer estas tareas, en long no se necesitaban anotaciones visuales humanas.

Demostraste que eres humano, sólo para terminar siendo reemplazable.

Enlace original

Precio de --

--

También te puede interesar

Regulación, insiderismo y esencia: La historia detrás de la valoración de 20 mil millones de dólares de Kalshi

El 80% de los usuarios solo consumen información

Cómo comerciar con criptomonedas sin App Store: Comercio de criptomonedas instantáneo en WEEX

Comercia criptomonedas al instante sin descargar una aplicación. Usa WEEX H5 para acceder al comercio al contado y de futuros directamente en tu navegador con ejecución rápida, control de riesgo en tiempo real y una experiencia fluida en móvil, tablet y escritorio. Soporta Bitcoin, Ethereum y más.

De OKX a Bybit, los intercambios están cambiando los neumáticos en la autopista a alta velocidad

En el contexto actual de endurecimiento de las regulaciones globales, si uno puede entrar directamente al mercado con un socio que ya ha establecido un sistema de cumplimiento, obtener el respaldo de una licencia federal, la credibilidad de una empresa cotizada y el acceso a canales de cooperación bancaria, el costo es simplemente gi...

Una breve historia y el futuro del contrato perpetuo

Los exchanges perpetuos descentralizados, como Hyperliquid, están sustituyendo derivados tradicionales por ventajas estructurales, convirtiéndose en plataformas financieras de un billón de dólares que atraen activos mundiales.

Agente de IA obtiene ID y billetera el mismo día | Noticia matutina de Rewire

La infraestructura del agente para la economía se está formando más rápido de lo que nadie esperaba

IOSG: Cambio de paradigma en la flexibilidad energética: De los macroactivos a la capa de inteligencia distribuida

Se le está pidiendo al sistema energético que realice una tarea para la que no fue diseñado.

Monedas populares

Últimas noticias sobre criptomonedas

Leer más