شکار ربات همه چیز درباره Vibes است
کریستوفر بوزی سعی میکند جلوتر از رباتها بماند. او و تیمش بهعنوان شخصی که پشت Bot Sentinel، یک سیستم تشخیص ربات محبوب است، مدلهای یادگیری ماشین خود را از ترس «کهنه شدن» بهروزرسانی میکنند. وظیفه؟ مرتبسازی 3.2 میلیون توییت از حسابهای معلق در دو پوشه: «Bot» یا «Not».
برای شناسایی رباتها، مدلهای Bot Sentinel ابتدا باید از طریق قرار گرفتن در معرض دادهها یاد بگیرند که رفتار مشکلساز چیست. و با ارائه توییتهایی به مدل در دو دسته مجزا – ربات یا غیر ربات – مدل بوزی میتواند خود را کالیبره کند و ظاهراً ماهیت چیزی را که به نظر او توییت را مشکلساز میکند، بیابد.
داده های آموزشی قلب هر مدل یادگیری ماشینی است. در زمینه رو به رشد تشخیص ربات، نحوه تعریف و برچسب گذاری توییت ها توسط شکارچیان ربات، نحوه تفسیر و طبقه بندی سیستم های آنها را تعیین می کند bot- مانند رفتار. به گفته کارشناسان، این می تواند بیشتر یک هنر باشد تا یک علم. Bouzy میگوید: «در پایان روز، زمانی که شما برچسبگذاری را انجام میدهید، این یک حس و حال است. “این فقط به کلمات در توییت مربوط نمی شود، زمینه مهم است.”
او یک ربات است، او یک ربات است، همه یک ربات هستند
قبل از اینکه کسی بتواند ربات ها را شکار کند. ، آنها باید بفهمند ربات چیست – و این پاسخ بسته به اینکه از چه کسی بپرسید تغییر می کند. اینترنت پر از افرادی است که یکدیگر را به دلیل اختلافات سیاسی کوچک به ربات بودن متهم می کنند. به ترول ها ربات می گویند. افرادی که عکس پروفایل ندارند و توییت یا فالوور کمی دارند، ربات نامیده می شوند. حتی در میان شکارچیان ربات های حرفه ای، پاسخ ها متفاوت است.
Bot Sentinel آموزش دیده است تا آنچه را Bouzy “حساب های مشکل دار” می نامد – نه فقط حساب های خودکار – حذف کند. فیلیپو منچزر، استاد انفورماتیک و علوم کامپیوتر دانشگاه ایندیانا می گوید ابزاری که او به توسعه آن کمک می کند، Botometer، ربات ها را به عنوان حساب هایی که حداقل تا حدی توسط نرم افزار کنترل می شوند. کاتلین کارلی، استاد علوم کامپیوتر در موسسه تحقیقات نرم افزاری در دانشگاه کارنگی ملون است که به توسعه دو ابزار تشخیص ربات کمک کرده است: BotHunter و BotBuster. کارلی ربات را بهعنوان «اکانتی که با استفاده از نرمافزار کاملاً خودکار اجرا میشود» تعریف میکند، تعریفی که با حساب توییتر مطابقت دارد. کلاس در یک پست وبلاگ مه 2020 نوشت در مورد دستکاری پلتفرم.
همانطور که تعاریف متفاوت است، نتایجی که این ابزارها تولید می کنند همیشه همسو نمی شوند. برای مثال، حسابی که توسط Botometer بهعنوان یک ربات پرچمگذاری شده است، ممکن است در Bot Sentinel کاملاً شبیه به انسان باشد، و بالعکس.
برخی از اینها بر اساس طراحی است. برخلاف Botometer که هدف آن شناسایی حسابهای خودکار یا نیمه خودکار است، Bot Sentinel حسابهایی را شکار میکند که درگیر ترولینگ سمی هستند. به گفته Bouzy، وقتی این حساب ها را می بینید، آنها را می شناسید. آنها می توانند خودکار یا تحت کنترل انسان باشند و درگیر آزار و اذیت یا اطلاعات نادرست هستند و شرایط خدمات توییتر را نقض می کنند. Bouzy میگوید: «فقط بدترین از بدترینها.
بوتومتر توسط Kaicheng Yang، کاندیدای دکترای انفورماتیک در رصدخانه رسانههای اجتماعی در دانشگاه ایندیانا که ابزار را با منچزر. این ابزار همچنین از یادگیری ماشینی برای طبقهبندی رباتها استفاده میکند، اما وقتی یانگ در حال آموزش مدلهای خود است، لزوماً به دنبال آزار و اذیت یا نقض شرایط خدمات نیست. او فقط به دنبال ربات است. به گفته یانگ، وقتی دادههای آموزشی خود را برچسبگذاری میکند، از خود یک سوال میپرسد: «آیا باور میکنم توییت از طرف یک شخص یا از یک الگوریتم است؟»
چگونه آموزش دهیم. یک الگوریتم
نه تنها در مورد چگونگی تعریف یک ربات اتفاق نظر وجود ندارد، بلکه هیچ معیار یا سیگنال مشخصی وجود ندارد که هر محققی بتواند به درستی پیشبینی کند که آیا یک ربات است یا خیر. شکارچیان ربات معتقدند که قرار دادن یک الگوریتم در معرض هزاران یا میلیون ها حساب ربات به رایانه کمک می کند تا رفتار ربات مانند را تشخیص دهد. اما کارایی عینی هر سیستم تشخیص ربات با این واقعیت که انسان ها هنوز باید در مورد اینکه از چه داده هایی برای ساخت آن استفاده کنند قضاوت کنند، مخدوش می شود.
برای مثال، Botometer را در نظر بگیرید. یانگ میگوید Botometer روی توییتهای حدود 20000 حساب آموزش داده شده است. در حالی که برخی از این حساب ها خود را به عنوان ربات شناسایی می کنند، اکثر آنها به صورت دستی توسط یانگ و تیمی از محققان قبل از اینکه توسط الگوریتم خرد شوند، دسته بندی می شوند. (Menczer میگوید برخی از حسابهای مورد استفاده برای آموزش Botometer از مجموعه دادههای سایر تحقیقات بررسیشده به دست میآیند. ما سعی میکنیم از تمام دادههایی که میتوانیم به دستمان برسیم، تا زمانی که از یک منبع معتبر تهیه شده باشد، استفاده کنیم. می گوید.)