انتشار یک دمو از برنامه هوش مصنوعی که حسابی سر و صدا به پا کرد
چتباتها را فراموش کنید؛ آینده در دست عوامل هوش مصنوعی است
استارتآپها و غولهای فناوری در تلاشند تا تمرکزها را از چتباتهایی که از طریق متن به کمک افراد میآیند، به عوامل هوش مصنوعی که میتوانند کارها را پیش ببرند، هدایت کنند. دموی اخیر، شامل یک کدگذار هوش مصنوعی به نام Devin و عواملی است که بازیهای ویدیویی انجام میدهند.
به گزارش wired، این هفته، استارتآپی به نام Cogintion AI، با انتشار یک دمو از یک برنامه هوش مصنوعی حسابی سر و صدا به پا کرد.
این برنامه هوش مصنوعی، Devin نام دارد و کارهایی انجام میدهد که معمولا مهندسان نرمافزاری با درآمد بالا مشغول به انجامشان هستند. چتباتهایی مثل ChatGPT و Gemini اگر چه میتوانند کد تولید کنند، اما دوین پا را فراتر از این مرزها گذاشته و برای حل یک مشکل، برنامهریزی کرد، کد نویسی انجام داد و سپس آن را آزمایش و پیادهسازی کرد.
سازندگان دوین آن را به عنوان "توسعهدهنده نرمافزار هوش مصنوعی" معرفی میکنند. زمانی که از دوین خواسته شد تا نحوه عملکرد مدل زبان متن باز Llama 2 متا را در هنگام دسترسی به شرکتهای مختلف میزبان، تست کند، دوین یک طرح گام به گام برای این پروژه ایجاد کرد. کدهای مورد نیاز برای دسترسی به APIها و اجرای تستهای بنچمارک را تولید کرد و سپس یک وب سایت ایجاد کرد و جمعبندی نتایج را در آن قرار داد.
حیرت مهندسان از عملکرد دوین
همیشه قضاوت درباره دموهای نمایشی سخت است؛ اما Cognition نشان داد که دوین طیف گستردهای از وظایف حیرتانگیزی را انجام میدهد و همین باعث تعجب سرمایهگذاران و مهندسان شبکه اجتماعی X شده و تائیدهای زیادی را دریافت کرده و حتی الهامبخش چند الگوی رفتاری شده است (از جمله برخی پیشبینیها که دوین به زودی منجر به موجی از اخراجهای صنعت فناوری خواهد شد.)
دوین آخرین و به روزترین نمونه از روندی است که مدتی است زیر ذرهبین قرار گرفته (ظهور عوامل هوش مصنوعی که به جای ارائه پاسخ یا توصیهای در مورد مشکل مطرح شده توسط انسان، میتوانند برای حل آن اقدام کنند). چند ماه پیش، یک Auto-GPT که یک برنامه منبعباز است که تلاش میکند تا با انجام اقداماتی در رایانه شخصی و در وبسایت، کارهای مفیدی انجام دهد، مورد آزمایش قرار گرفت. اخیرا برنامه دیگری به نام vimGPT امتحان شد تا مشخص شود که چطور مهارتهای بصری مدلهای جدید هوش مصنوعی میتواند به این عوامل کمک کند تا وبسایتها را با کارآیی بیشتری مرور کنند.
اشتباه و شکست
محققان به شدت تحت تاثیر آزمایشها با این عوامل هوش مصنوعی قرار گرفتند. با این حال در شرایط فعلی و درست مثل مدلهای زبانی که آنها را تقویت میکنند، این عوامل هم مرتکب اشتباهات زیادی میشوند و هنگامی که یک نرمافزار در حال انجام اقداماتی است (نه فقط تولید متن)، یک اشتباه ممکن است به منزله شکست کامل باشد و پیامدهای بالقوه پرهزینه و خطرناکی داشته باشد.
محدود کردن دامنه وظایفی که یک عامل میتواند انجام دهد (مثلا برای مجموعه خاصی از کارهای مهندسی نرمافزار) به نظر شیوهای هوشمندانه برای کاهش میزبان خطاهاست؛ اما هنوز راههای بالقوه زیادی است که ممکن است منجر به شکست شوند.
انجام بازیهای ویدیویی توسط عوامل هوش مصنوعی
البته این فقط استارتآپها نیستند که در حال ساخت عوامل هوش مصنوعی هستند. در اوایل این هفته، مطلبی درباره عاملی به نام SIMA نوشته شد که توسط Google DeepMind توسعه یافته بود. SIMA بازیهای ویدیویی مختلفی را از جمله Goat simulator 3 انجام میدهد.
SIMA از تماشای بازی کردن بازیکنان انسانی یاد گرفت که چطور بیش از 600 کار نسبتا پیچیده مثل قطع کردن یک درخت یا تیراندازی به سمت یک سیارک را انجام دهد. مهمتر از همه، میتواند بسیاری از این اقدامات را در یک بازی ناآشنا با موفقیت انجام دهد. Google DeepMind آن را یک " generalist" مینامد.
گوگل امیدوار است که این نمایندهها در نهایت در خارج از دنیای بازیهای ویدیویی مشغول شوند و شاید به کمک کاربران در استفاده از وبسایتها یا نرمافزارها بیایند. اما بازیهای ویدیویی هم با فراهم کردن محیطهایی پیچیده که میتوان در آنها به آزمایش و خطا پرداخت و پیشرفت کرد، شرایط خوبی را برای توسعه و آزمایش عوامل فراهم میکنند. تیم هارلی، دانشمند محقق Google DeepMind در این باره گفت:« ما به شدت برروی دقیقتر کردن عوامل هوش مصنوعی کار میکنیم و ایدههای مختلفی داریم.»
میتوان در ماههای آینده در انتظار اخبار بیشتری درباره عوامل هوش مصنوعی بود. دمیس هاسابیس، مدیر عامل Google DeepMind در این باره گفته که قصد دارد مدلهای زبان بزرگی را با کارهایی که قبلا شرکتش در زمینه برنامههای آموزشی هوش مصنوعی برای بازیهای ویدیویی انجام داده ترکیب کند تا عوامل توانمندتر و قابل اعتمادتری را توسعه دهد. او در این باره گفت:« این حوزه بزرگی است و در این زمینه سرمایهگذاری زیادی میکنیم و تصور میکنم که دیگران هم مشغول همین کارند. این یک گام بزرگ در جهت تغییر در توانایی این سیستمهاست.»