ربات جدید گوگل یاد گرفت که با خراش دادن وب، سفارش بگیرد
در اواخر هفته گذشته، دانشمند تحقیقاتی گوگل فی شیا در مرکز آشپزخانه ای روشن و با پلان باز نشست. و فرمانی را در لپتاپ متصل به یک ربات چرخدار که شبیه یک چراغ کف بزرگ است، تایپ کرد. او نوشت: من گرسنه هستم. ربات فوراً روی میز مجاور نزدیک شد، کیسهای از تراشههای چند دانهای را با یک انبر پلاستیکی بزرگ برداشت و به سمت شیا رفت تا میانوعدهای ارائه دهد.
تأثیرگذارترین آنها. چیزی که در مورد آن نمایش که در آزمایشگاه روباتیک گوگل در Mountain View، کالیفرنیا برگزار شد، این بود که هیچ کدنویس انسانی ربات را طوری برنامه ریزی نکرده بود که بفهمد در پاسخ به فرمان شیا چه کاری انجام دهد. نرم افزار کنترلی آن یاد گرفته بود که چگونه یک عبارت گفتاری را با استفاده از میلیون ها صفحه متن خراشیده شده از وب به دنباله ای از اعمال فیزیکی ترجمه کند.
این بدان معناست که شخص مجبور نیست از آن استفاده کند. عبارتهای از پیش تأیید شده خاص برای صدور دستورات، همانطور که ممکن است با دستیارهای مجازی مانند الکسا یا سیری ضروری باشد. به ربات بگویید “من خشک شده ام” و او باید سعی کند برای شما چیزی برای نوشیدن پیدا کند. به آن بگویید “اوه، من فقط نوشیدنی ام را ریختم” و باید با یک اسفنج برگردد.
کارول هاسمن، دانشمند تحقیقاتی ارشد در گوگل، در طول این کنفرانس گفت: “برای مقابله با تنوع دنیای واقعی، روبات ها باید بتوانند تجارب خود را تطبیق دهند و از آنها بیاموزند.” نسخه ی نمایشی، که شامل این بود که ربات یک اسفنج را برای تمیز کردن یک نشت به سمت آن آورد. برای تعامل با انسانها، ماشینها باید یاد بگیرند که چگونه کلمات را میتوان به روشهای مختلف کنار هم قرار داد تا معانی متفاوتی تولید کنند. هاسمن گفت: «این به ربات بستگی دارد که تمام ظرافت ها و پیچیدگی های زبان را درک کند.
نسخه نمایشی گوگل گامی به سوی هدف دیرینه ایجاد ربات هایی بود که قادر به تعامل با انسان هستند. در محیط های پیچیده در چند سال گذشته، محققان دریافتهاند که استفاده از حجم عظیمی از متنهای گرفتهشده از کتابها یا وب به مدلهای بزرگ یادگیری ماشینی میتواند برنامههایی را با مهارت های زبانی چشمگیر، از جمله OpenAI’s تولید کننده متن GPT-3. با هضم انواع مختلف نوشتن آنلاین، نرم افزار می تواند توانایی خلاصه کردن یا پاسخ دادن به سؤالات مربوط به متن، تولید مقالات منسجم در مورد یک موضوع خاص، یا حتی برگزاری مکالمات قانع کننده را پیدا کند.
Google. و سایر شرکت های بزرگ فناوری از این مدل های زبان بزرگ برای جستجو و تبلیغات. تعدادی از شرکتها این فناوری را از طریق APIهای ابری ارائه میکنند و خدمات جدیدی با استفاده از قابلیتهای زبان هوش مصنوعی برای کارهایی مانند تولید کد یا نوشتن نسخه تبلیغاتی. مهندس گوگل، بلیک لمواین، اخیراً پس از اخطار علنی مبنی بر اینکه یک ربات چت این فناوری به نام LaMDA، ممکن است حساس باشد. معاون Google که همچنان در این شرکت شاغل است در The Economist نوشت که چت کردن با ربات مانند “صحبت کردن با چیزی هوشمندانه” است.
علیرغم این گامها، برنامههای هوش مصنوعی همچنان مستعد گیج شدن یا ابهامهای تکراری هستند. مدلهای زبانی که با متن وب آموزش دیدهاند نیز فاقد درک حقیقت هستند و اغلب سوگیریها یا سوگیریها را بازتولید میکنند. زبان نفرت انگیز که در داده های آموزشی آنها یافت می شود، نشان می دهد که ممکن است مهندسی دقیقی برای هدایت قابل اعتماد یک ربات بدون اینکه ربات در حال کار نباشد، مورد نیاز باشد.
روبات نشان داده شده توسط هاسمن از بهترین ها استفاده می کرد. مدل زبان قدرتمندی که گوگل تاکنون معرفی کرده است، به نام PaLM . قادر به ترفندهای زیادی است، از جمله توضیح به زبان طبیعی، نحوه رسیدن به یک نتیجه خاص در هنگام پاسخ دادن به یک سوال. از همین رویکرد برای ایجاد یک سری مراحل که ربات برای انجام یک کار معین انجام می دهد، استفاده می شود.
***
منبع : https://www.wired.com