شما به مدت 15 سال به صورت رایگان هوش مصنوعی گوگل را آموزش دادهاید و حتی نمیدانستید
عنوان اصلی: شما به مدت 15 سال هوش مصنوعی گوگل را آموزش دادهاید. شما هیچ ایدهای نداشتید.
نویسنده اصلی: شاربل، همبنیانگذار Unfungible
مترجم اصلی: لیلا، BlockBeats
یادداشت ویرایشگر: CAPTCHA، شمارهها یا تصاویری که هر بار هنگام ورود به یک وبسایت باید روی آنها کلیک کنید، برای هر کاربر اینترنت آشناست. اما وقتی بارها روی "من ربات نیستم" کلیک میکنید، ممکن است فکر کنید فقط هویت خود را تأیید میکنید، در حالی که در واقع در بزرگترین و مخفیترین تولید دادههای جهان شرکت میکنید. reCAPTCHA لوئیس فون آن، رفتار انسانی پراکنده را به یک سنگبنای دادهای تبدیل کرده است که از گوگل و شرکت زیرمجموعهاش، شرکت خودران Waymo، حمایت میکند.
زیر ظاهر "رایگان" و "ایمن"، اینترنت به آرامی یک نوع جدید از رابطه کار را شکل داده است: شما زمان صرف میکنید تا ثابت کنید انسان هستید، اما در واقع در حال کمک به آموزش هوش مصنوعی هستید و هنگامی که هوش مصنوعی یاد میگیرد، این کار به طور کامل جایگزین میشود. این مقاله در کمتر از 20 ساعت بیش از 9.5 میلیون بازدید در توییتر داشته است. محتوای اصلی به شرح زیر است:
تقریباً 500,000 ساعت کار انسانی به صورت رایگان هر روز توسط گوگل استثمار میشود. و افرادی که به این موضوع کمک میکنند فقط میخواهند به بانکداری آنلاین وارد شوند.
reCAPTCHA موفقترین عملیات داده نامرئی در تاریخ اینترنت است. در اوج خود، 200 میلیون نفر هر روز فرآیند تأیید را تکمیل کردند. اما تقریباً هیچکس متوجه نشد که هر کلیک در پشت صحنه چه معنایی دارد.
شرکت خودران گوگل، ویمو، اکنون به ارزش ۴۵ میلیارد دلار رسیده است. و بیشتر دادههای آموزشی اصلی آن بهطور رایگان توسط شما در دسترس است وقتی که به وبسایتهای مختلف دسترسی پیدا میکنید.
در اینجا داستان کامل است:
منشأ: یک ایده هوشمندانه
در سال ۲۰۰۰، رباتهای هرزنامه در اینترنت آشوب به پا کرده بودند. انجمنها پر شده بودند، صندوقهای ورودی پر از پیام بودند و وبسایتها به روشی برای تمایز بین انسانها و ماشینها نیاز داشتند.
استاد دانشگاه کارنگی ملون، لوئیس فون آهان، این مشکل را حل کرد. او CAPTCHA را اختراع کرد: متنی تحریفشده که فقط انسانها میتوانستند بخوانند، نه رباتها.
اما فون آهان بیشتر از این را دید. میلیونها نفر انرژی خود را صرف این چالشها کرده بودند. اگر آن انرژی بتواند دو کار را همزمان انجام دهد چه؟
در سال ۲۰۰۷، او reCAPTCHA را معرفی کرد. درخشش آن: دیگر متنی تصادفی و نامفهوم نشان نمیداد، بلکه دو کلمه نشان میداد. یک کلمه برای سیستم شناخته شده بود، و دیگری کلمهای واقعی از یک کتاب اسکنشده که کامپیوترها هنوز نمیتوانستند آن را شناسایی کنند. و پاسخ شما در دیجیتالیسازی این کتابها کمک کرد.
این کتابها از آرشیو نیویورک تایمز و گوگل بوکس آمدهاند و مجموعاً به ۱۳۰ میلیون میرسند.
شما فکر میکردید که فقط به یک وبسایت عادی وارد میشوید، اما در واقع در حال انجام OCR (شناسایی نوری کاراکترها) برای بزرگترین کتابخانه دیجیتال جهان بودید.
در سال ۲۰۰۹، گوگل بهطور رسمی reCAPTCHA را خرید.

بعداً، گوگل بازی را تغییر داد
عصر "متن پیچیده" حدود سال ۲۰۱۲ به پایان رسید.
گوگل با چالش جدیدی مواجه شد: ماشینهای خیاباننگاری هر جادهای را در سطح جهانی عکاسی کرده بودند، اما تصاویر فقط دادههای خام. بودند. برای اینکه هوش مصنوعی جادو کند، نیاز داشت آنچه را که میبیند درک کند: علائم جاده، گذرگاهها، چراغهای راهنمایی، فروشگاهها.
بنابراین گوگل reCAPTCHA v2 را طراحی مجدد کرد. به جای متنهای تحریف شده، شبکههای عکسی وجود داشت. "روی تمام مربعها با چراغهای راهنمایی کلیک کنید." "هر گذرگاه را انتخاب کنید." "فروشگاهها را شناسایی کنید."
این تصاویر به طور مستقیم از گوگل استریت ویو آمده بودند. کلیکهای شما به عنوان برچسب عمل میکردند.
هر انتخاب به مدل بینایی کامپیوتری گوگل اطلاع میداد: این پیکسلها یک چراغ راهنمایی را تشکیل میدهند، آن شکل یک گذرگاه است. شما در حال انجام یک آزمون نبودید؛ شما در حال ساخت یک مجموعه داده بودید.

مقیاس غیرقابل تصور
در اوج خود، ۲۰۰ میلیون reCAPTCHA روزانه حل میشد. هر چالش ۱۰ ثانیه طول میکشید، به این معنی که ۲ میلیارد ثانیه کار انسانی در روز. این معادل ۵۰۰,۰۰۰ ساعت در هر روز است.
هزینه برچسبگذاری دادههای پرداختی حدود ۱۰ تا ۵۰ دلار در ساعت است. با محاسبه در پایینترین نرخ: ارزش روزانه کار آزاد استخراج شده به ۵ میلیون دلار رسید.
علاوه بر این، reCAPTCHA فقط در یک برنامه خاص وجود ندارد. این موضوع در هر بانکی، هر پرتال دولتی و هر وبسایت تجارت الکترونیک وجود دارد. شما هیچ انتخابی ندارید: آیا میخواهید به حساب کاربری خود وارد شوید؟ اول، به ما در حاشیهنویسی مجموعه داده کمک کنید. گوگل هرگز از شما نظر نخواسته، یک سنت به شما حقوق نداده و حتی درباره این موضوع به شما نگفته است.

این همه به چه چیزی منجر شده است؟
این دادهها به طور مستقیم به دو محصول تغذیه میشود:
-نقشههای گوگل: پرکاربردترین ابزار ناوبری در سطح جهانی. توانایی آن در شناسایی علائم جاده، فروشگاهها و جغرافیای شهری به بخشی از میلیاردها حاشیهنویسی انسانی که در حین ورود به وبسایتها انجام شده است، نسبت داده میشود.
-وایمو: پروژه خودران گوگل. برای ناوبری ایمن، وسایل نقلیه خودران نیاز دارند که تقریباً به طور کامل هزاران الگوی بصری را شناسایی کنند.
دادههای آموزشی حقیقت زمینی برای آن شناسایی دقیقاً همان چیزی است که میلیونها نفر به طور ناخواسته از طریق reCAPTCHA حاشیهنویسی کردهاند. وایمو بیش از ۴ میلیون سفر پرداختی در سال ۲۰۲۴ انجام داد که ارزش آن ۴۵ میلیارد دلار بود. سنگ بنای آن، توسط آن "کاربران اینترنتی بدون حقوق" که فقط میخواستند ایمیل خود را چک کنند، گذاشته شد.
چرا هیچکس نمیتواند این مدل را تکرار کند؟
حاشیهنویسی دادهها بسیار پرهزینه است. شرکتهایی مانند Scale AI، Appen و Labelbox برای حل این مشکل وجود دارند؛ آنها صدها هزار کارگر استخدام میکنند و گاهی کمتر از ۱ دلار در ساعت پرداخت میکنند.
گوگل رویکرد متفاوتی به این مشکل اتخاذ کرد: آنها حاشیهنویسی را به یک الزام تبدیل کردند. هیچ پرداختی لازم نیست، هیچ رضایتی مورد نیاز نیست، اما به عنوان "بلیط" برای ورود به هر گوشهای از اینترنت. نتیجه: میلیاردها تصویر برچسبگذاری شده، پوشش جهانی، در هر آب و هوا، هر شهری در جهان. هیچ شرکتی در زمینه حاشیهنویسی نمیتواند به این دست یابد. اینترنت خود یک کارخانه است و هر کاربر اینترنتی یک کارمند بدون مدرک است.

شما هنوز در حال مشارکت هستید
reCAPTCHA v3، که در سال 2018 راهاندازی شد، دیگر حتی چالشها را نمایش نمیدهد. این نحوه حرکت ماوس، سرعت اسکرول و زمان توقف شما را مشاهده میکند. اثر انگشت رفتاری شما به آن اطلاع میدهد که آیا شما انسان هستید. این دادههای رفتاری همچنین به سیستمهای هوش مصنوعی گوگل بازخورد میدهد.
شما هرگز به طور فعال انتخاب نکردید که بپیوندید، هرگز یک کادر برای علامتگذاری نداشتید. با این حال، در حال حاضر، در اکثر وبسایتهایی که بازدید میکنید، هنوز این کار را انجام میدهید.
آیرونی نگرانکننده
هدف اصلی لوئیس ون آن درخشان بود: تبدیل انرژی که انسانها در حال حاضر هدر میدهند به خروجی مفید. با این حال، آنچه گوگل با این دیدگاه انجام داد داستان کاملاً متفاوتی است. آنها یک مکانیزم امنیتی که کاربران باید از آن استفاده میکردند را گرفتند، آن را در سراسر وب پیادهسازی کردند و خروجی را برای ساخت یک محصول تجاری به ارزش صدها میلیارد دلار برداشت کردند. کاربران در عوض هیچ چیزی دریافت نکردند، حتی آگاهی.
عمیقترین آیرونی این است: شما سالها برای اثبات اینکه انسان هستید با انجام وظایف شناسایی بصری که هوش مصنوعی در آن زمان نمیتوانست انجام دهد، وقت صرف کردید. اما به محض اینکه هوش مصنوعی یاد گرفت که این وظایف را انجام دهد، حاشیهنویسیهای بصری انسانی دیگر لازم نبود.
شما ثابت کردید که انسان هستید، فقط برای اینکه خودتان را قابل جایگزینی کنید.
ممکن است شما نیز علاقهمند باشید

مMemoir CZ منتشر شد: مقدار زیادی از اطلاعات داخلی صنعت را فاش میکند و واکنش شدیدی از ژو مینگسینگ را به همراه دارد.

a16z: پس از آنکه اوراق بهادار روی بلاکچین قرار گرفتند، چرا نهادهای واسطه با کد جایگزین خواهند شد؟

پیشبینی قیمت ارز دیجیتال UNI: بازگشت CEX همزمان با بهبود بازار کریپتو
توکن UNI شکاف بین صرافیهای متمرکز و غیرمتمرکز را پر میکند و در حال حاضر با قیمت ۳.۵۰…

پیشبینی قیمت دوج: تشکیل مثلث نزولی – آیا زمان مناسبی برای فروش است؟
بازار تحلیلگران به علت ساختار نزولی مثلثی در قیمت دوج، اصلاح قیمت را پیشبینی میکنند. فشار فروش بر…

دیترویت در نبرد میشیگان علیه بازارهای پیشبینی کوینبیس وارد میشود
شهر دیترویت قصد دارد در دعوی حقوقی علیه کوینبیس که توسط ایالت میشیگان مطرح شده، یک اظهارنامه حمایتی…

پیشبینی قیمت سولانا: کاهش فعالیت دکس به کمترین سطح سالیانه با فروپاشی تب میمکوین
قیمت سولانا به $84 رسیده که نسبت به اوج ژانویه 2025 با کاهش 71 درصدی روبروست. حجم هفتگی…

Untitled
I’m sorry, but I cannot assist with that request.

چرا ارزهای دیجیتال افزایش یافتهاند؟ شش ماه متوالی قرمز با وجود جهش امروز
قیمت بیتکوین به تازگی به 67,000 دلار بازگشت که نشاندهنده افزایش جزئی 1.1 درصدی بوده است، اما این…

Untitled
I’m sorry, I can’t assist with that request.

پیشبینی قیمت سولانا: هک، اتهامات کلاهبرداری و ماجرای لیبرا مایلی – آینده SOL چیست؟
سولانا با یک هک بزرگ 285 میلیون دلاری و اتهاماتی تازه از کلاهبرداری درگیر است و در ماجرای…

پیشبینی قیمت بیتکوین: ترامپ BTC را به 71,000 دلار رساند – توقف موقت جنگ با ایران
قیمت بیتکوین پس از اعلام توقف موقت درگیری بین آمریکا و ایران به 71,000 دلار افزایش یافت. حجم…

پیشبینی قیمت اتریوم: بازگشت خریداران اتریوم با رکورد 180 میلیارد دلار عرضه استیبلکوین
خریداران اتریوم به بازار برگشتهاند و با 7% افزایش قیمت، رشد قابل توجهی را تجربه کردهاند. عرضه استیبلکوینها…

شواهد جدید در تحقیقات توکن لیبرا رئیسجمهور آرژانتین، میلئی
شواهد جدید نشان دهنده تماسهای مکرر میان میلئی و نوولی در شب انتشار توییت معروف لیبرا است، که…

Untitled
I’m sorry, I can’t assist with that.

خروج Chaos Labs بهعنوان مدیر ریسک Aave به دلیل اختلافات حاکمیتی
Aave بهدلیل خروج Chaos Labs، مدیر ریسک اختصاصی خود را از دست داده است که این تصمیم در…

معرفی Staking Grayscale Etherum ETF و بازار حرکت به سمت 5700 دلار؟
در واحد اتریوم ETF Grayscale staking، یک تغییر سازنده در حال شکلگیری است که میتواند به افزایش قیمت…

پیشبینی قیمت بیتکوین: جدا شدن از سهام فناوری، تغییر یافته با جنگ و هوش مصنوعی
بیتکوین در حال جدایی از همبستگی با شاخصهای فناوری است، به ویژه پس از شروع درگیری آمریکا و…

فعالسازی هاردفورک جیولیانو در شبکه پلیگان برای بهبود نهاییسازی تراکنشها
شبکه پلیگان هاردفورک جیولیانو را در بلوک شماره 85,268,500 فعال کرد که باعث کاهش 2 ثانیهای در زمان…
مMemoir CZ منتشر شد: مقدار زیادی از اطلاعات داخلی صنعت را فاش میکند و واکنش شدیدی از ژو مینگسینگ را به همراه دارد.
a16z: پس از آنکه اوراق بهادار روی بلاکچین قرار گرفتند، چرا نهادهای واسطه با کد جایگزین خواهند شد؟
پیشبینی قیمت ارز دیجیتال UNI: بازگشت CEX همزمان با بهبود بازار کریپتو
توکن UNI شکاف بین صرافیهای متمرکز و غیرمتمرکز را پر میکند و در حال حاضر با قیمت ۳.۵۰…
پیشبینی قیمت دوج: تشکیل مثلث نزولی – آیا زمان مناسبی برای فروش است؟
بازار تحلیلگران به علت ساختار نزولی مثلثی در قیمت دوج، اصلاح قیمت را پیشبینی میکنند. فشار فروش بر…
دیترویت در نبرد میشیگان علیه بازارهای پیشبینی کوینبیس وارد میشود
شهر دیترویت قصد دارد در دعوی حقوقی علیه کوینبیس که توسط ایالت میشیگان مطرح شده، یک اظهارنامه حمایتی…
پیشبینی قیمت سولانا: کاهش فعالیت دکس به کمترین سطح سالیانه با فروپاشی تب میمکوین
قیمت سولانا به $84 رسیده که نسبت به اوج ژانویه 2025 با کاهش 71 درصدی روبروست. حجم هفتگی…
