08:08 15 / 10 /1404
هر کلیک «من ربات نیستم» چه کمکی به هوش مصنوعی می‌کند

پشت‌پردۀ بزرگترین بهره‌کشی پنهان از کاربران در تاریخ اینترنت

سیستم امنیتی ری‌کپچا که در ظاهر ابزاری ساده برای تفکیک انسان از ربات در وب‌سایت‌ها شناخته می‌شود، در واقع بزرگ‌ترین پروژه بهره‌کشی از نیروی کار پنهان در تاریخ اینترنت است که طی ۱۵ سال گذشته با استفاده از ۸۱۹ میلیون ساعت تعامل کاربران، متون آرشیوی نیویورک تایمز را دیجیتالی کرده، خودروهای خودران ویمو را آموزش داده و پایگاه‌های داده عظیم هوش مصنوعی را با ارزشی معادل ۶.۱ میلیارد دلار توسعه داده است، بدون آنکه کاربران از نقش خود به عنوان مربیان رایگان این الگوریتم‌ها آگاه باشند.

به گزارش خبرگزاری آنا؛ چالش‌های تصویری ساده‌ای که روزانه میلیون‌ها کاربر اینترنت برای ورود به حساب‌های کاربری خود با آن مواجه می‌شوند، فراتر از یک سد امنیتی عمل می‌کنند. زمانی که کاربر برای اثبات هویت خود، تصاویر حاوی خط‌کشی عابر پیاده، چراغ راهنمایی یا شیر آتش‌نشانی را در یک شبکه تصویری انتخاب می‌کند، در حال انجام یک کار دقیق مهندسی داده است. تحقیقات آماری نشان می‌دهد که مجموع زمان‌های ۳۰ ثانیه‌ای که کاربران جهان طی بیش از ۱۵ سال صرف حل این معما‌ها کرده‌اند، به رقم خیره‌کننده ۸۱۹ میلیون ساعت می‌رسد. اگر این حجم عظیم از زمان با میانگین دستمزد جهانی (حدود ۷.۴۵ دلار در ساعت) محاسبه شود، ارزش اقتصادی این کار اجباری دیجیتال بالغ بر ۶.۱ میلیارد دلار خواهد بود. این رقم نشان‌دهنده سودی است که شرکت‌های فناوری از طریق تبدیل یک پروتکل امنیتی به یک ابزار تولید ارزش، به دست آورده‌اند.

مغز انسان، پردازنده‌ای ارزان برای گوگل

ایده اصلی پشت این فناوری، حاصل تفکر لوئیس فون آن، دانشمند علوم کامپیوتر بود. او دریافت که مسدود کردن ربات‌های اسپم، میلیون‌ها ساعت از توان پردازشی مغز انسان را به هدر می‌دهد. فون آن به این نتیجه رسید که مغز انسان توانایی‌های پردازشی خاصی دارد که هنوز کامپیوتر‌ها فاقد آن هستند، مانند تشخیص متون کج و معوج یا درک مفاهیم بصری پیچیده در تصاویر بی‌کیفیت. راهکار او تغییر ماهیت کپچا بود؛ به جای تولید متون تصادفی بی‌معنی، سیستم باید مسائلی را به کاربر ارائه می‌داد که کامپیوتر‌ها در حل آن ناتوان بودند، اما برای انسان بدیهی به نظر می‌رسیدند. بدین ترتیب، هر بار که کاربری یک کپچا را حل می‌کرد، در واقع بخشی از یک پروژه عظیم محاسباتی را پیش می‌برد که هزینه انجام آن با روش‌های سنتی سرسام‌آور بود.

کلیک‌های ساده شما برای اثبات انسانیت، هم‌اکنون ۶ میلیارد دلار ارزش دارد

نجات تاریخ با تایپ کلمات ناخوانا

در سال ۲۰۰۷ میلادی، پروژه دیجیتال‌سازی کتاب‌ها و روزنامه‌های قدیمی با بن‌بست فنی مواجه شده بود. نرم‌افزار‌های تبدیل عکس به متن در برخورد با روزنامه‌هایی مانند نیویورک تایمز که قدمت برخی شماره‌های آن به سال ۱۸۵۱ می‌رسید، دچار خطا می‌شدند. لکه‌های جوهر، کاغذ‌های زرد شده و فونت‌های قدیمی باعث می‌شد کامپیوتر کلمات را اشتباه تشخیص دهد. گوگل با خرید ری‌کپچا، نسخه اول این سیستم را برای حل این مشکل به کار گرفت. سیستم به هر کاربر دو کلمه نمایش می‌داد: کلمه اول کنترلی بود که سیستم جواب آن را می‌دانست و برای احراز هویت استفاده می‌شد. کلمه دوم، برشی واقعی از یک روزنامه قدیمی بود که نرم‌افزار نتوانسته بود آن را بخواند. وقتی کاربر کلمه اول را درست تایپ می‌کرد، سیستم فرض را بر این می‌گذاشت که کلمه دوم که ناخوانا بود را نیز درست تشخیص داده است.

مکانیزم اجماع برای تضمین واقعیت

گوگل برای اطمینان از اینکه کاربران کلمات ناخوانا را درست تایپ می‌کنند و صرفاً دکمه‌ها را فشار نمی‌دهند، از یک سیستم امتیازدهی دقیق استفاده کرد. هر کلمه جدیدی که توسط سیستم تبدیل عکس به متن غیرقابل خواندن تشخیص داده می‌شد، به چندین کاربر مختلف در سراسر جهان نمایش داده می‌شد. حدس اولیه کامپیوتر ارزش نیم امتیاز داشت، اما تشخیص انسان یک امتیاز کامل محسوب می‌شد. تنها زمانی یک کلمه پذیرفته می‌شد که مجموع امتیازاتش به ۲.۵ می‌رسید؛ یعنی حداقل سه انسان مختلف باید آن کلمه را به یک شکل واحد تایپ می‌کردند. با این روش هوشمندانه، آرشیو عظیم بشری که شامل میلیون‌ها صفحه بود، کلمه به کلمه توسط کسانی بازنویسی شد که فکر می‌کردند تنها در حال ورود به ایمیل خود هستند.

آموزش رانندگی به خودرو‌ها با شناسایی چراغ قرمز

بین سال‌های ۲۰۱۴ تا ۲۰۱۷، ربات‌ها هوشمندتر شدند و توانستند متون کج و معوج را بخوانند. هم‌زمان، نیاز‌های گوگل نیز تغییر کرد. این شرکت سرمایه‌گذاری سنگینی روی خودرو‌های خودران، پروژه ویمو و نقشه‌های گوگل انجام داده بود. خودرو‌های خودران برای حرکت ایمن در خیابان‌ها نیاز داشتند تا تفاوت میان یک کودک، یک تیر چراغ برق و یک خط‌کشی عابر پیاده را در کسری از ثانیه تشخیص دهند. برای آموزش این هوش مصنوعی، به میلیارد‌ها تصویر برچسب‌گذاری شده نیاز بود. گوگل نسخه دوم ری‌کپچا را معرفی کرد. این بار کاربران با شبکه‌ای از تصاویر رو‌به‌رو شدند و دستوراتی مانند «تمام تصاویر دارای دوچرخه را انتخاب کنید» دریافت کردند. هر کلیک صحیح کاربر، مستقیماً به الگوریتم‌های بینایی ماشین گوگل می‌آموخت که دوچرخه در زوایای مختلف، نور‌های متفاوت و پشت موانع چگونه به نظر می‌رسد.

کلیک‌های ساده شما برای اثبات انسانیت، هم‌اکنون ۶ میلیارد دلار ارزش دارد

نبرد نابرابر توسعه‌دهندگان مستقل با غول فناوری

تفاوت قدرت میان گوگل و سایر توسعه‌دهندگان هوش مصنوعی در دسترسی به این نیروی کار رایگان نهفته است. برای درک بهتر این موضوع، می‌توان به پروژه مستقل GAI اشاره کرد که هدفش آموزش هوش مصنوعی برای خواندن نسخ خطی زبان ارمنی کلاسیک (گرابار) بود. توسعه‌دهنده این پروژه مجبور شد برای جمع‌آوری داده‌های اولیه، از دوستان و خانواده خود بخواهد تا ۱۵ هزار نمونه متن را به صورت دستی بازنویسی و ترجمه کنند. این فرآیند ماه‌ها زمان برد و تنها به دقت ۸۹ درصد رسید. در مقابل، گوگل با در اختیار داشتن زیرساخت کپچا، به میلیون‌ها کاربر در هر لحظه دسترسی دارد که بدون هیچ دستمزدی، پیچیده‌ترین داده‌ها را با دقت بالا و در حجم میلیاردی برچسب‌گذاری می‌کنند. این انحصار در داده، سدی بزرگ برای رقبای کوچک ایجاد کرده است.

لرزش دست شما سند انسان بودن است

با پیشرفت بیشتر ربات‌های تصویری، گوگل روش خود را به تحلیل رفتاری تغییر داد که در نسخه سوم ری‌کپچا دیده می‌شود. در این نسخه که معمولاً با یک تیک ساده «من ربات نیستم» همراه است، سیستم دیگر نیازی به حل پازل ندارد، بلکه نحوه حرکت ماوس کاربر را بررسی می‌کند. وقتی یک انسان ماوس را حرکت می‌دهد، مسیر حرکت هرگز یک خط صاف ریاضی نیست. دست انسان دارای لرزش‌های خفیف میکروسکوپی است که ناشی از نویز سیستم عصبی و انقباضات عضلانی ناخودآگاه است. علاوه بر این، سرعت حرکت ماوس توسط انسان در نقاط مختلف صفحه تغییر می‌کند. این نقص‌های انسانی دقیقاً همان چیزی است که هوش مصنوعی گوگل به دنبال آن می‌گردد.

گوگل کپچا

شکست ربات‌ها در شبیه‌سازی نقص انسان

ربات‌ها ذاتاً تمایل دارند بهینه‌ترین مسیر را بین دو نقطه طی کنند که معمولاً خطی صاف و بدون لرزش است. حتی ربات‌های پیشرفته‌ای که سعی می‌کنند با الگوریتم‌هایی نظیر WindMouse لرزش‌های انسانی را تقلید کنند، در برابر تحلیلگر‌های گوگل شکست می‌خورند. سیستم گوگل جریان حرکت ماوس را صد‌ها بار در ثانیه نمونه‌برداری می‌کند و متغیر‌هایی مانند مکث‌های قبل از کلیک، سرعت واکنش به بارگذاری صفحه و حتی نحوه اسکرول کردن را می‌سنجد. اگر الگوی حرکت بیش از حد تمیز یا مصنوعی باشد، سیستم به کاربر مشکوک می‌شود. در واقع، گوگل توانسته است بیولوژیکی‌ترین ویژگی‌های حرکتی انسان را به یک امضای دیجیتال برای احراز هویت تبدیل کند. این تحول نشان می‌دهد که چگونه تعاملات روزمره ما، بدون آنکه بدانیم، سوخت اصلی موتور‌های هوش مصنوعی را تأمین می‌کنند.

انتهای پیام/

ارسال نظر