ابزار هوش مصنوعی جدید DeepMind تنها با یک عکس، ویدیوهای 30 ثانیهای میسازد
این ابزار جدید که Transframer نام دارد، میتواند عکسها را بهطور دقیق بررسی کرده و ویدیوهای 30 ثانیهای از آنها تولید کند.
دانشمندان گوگل در شرکت هوش مصنوعی دیپمایند ( DeepMind ) ابزار جدیدی را معرفی کردهاند که Transframer نام دارد و میتواند پس از تجزیهوتحلیل محتوای تصویر، ویدیو کوتاهی بر اساس آن تولید کند.
ابزار هوش مصنوعی Transframer برای انجام کار خود، فقط به یک عکس نیاز دارد و پس از بررسی محتوای داخل آن، با استفاده از دادههای آموزشی بسیار زیاد خود میتواند محیط اطراف و نحوه نمایش اشیا آن از زوایای مختلف را حدس بزند. همانطور که تیم DeepMind در توییتر توضیح میدهد، مدل هوشمصنوعی آنها در پیشبینی ویدیو و مشاهده ترکیبها عملکرد فوقالعادهای دارد و میتواند از یک تصویر، ویدیوهای 30 ثانیهای تولید کند.
در پست وبلاگ دیپمایند درباره این ابزار توضیح داده شده که Transframer با پیشبینی محیط اطراف تصاویر هدف، ویدیوهای خود را تولید میکند. به عنوان مثال، با حدس زدن صحیح یکی از صندلیهای زیر، میتواند به کاربران نحوه نمایش یک شی واقعی از زاویه دیگر را نشان دهد.
کاربرد ابزار هوش مصنوعی جدید دیپمایند
این چارچوب با توانایی تولید ویدیوی دقیق بر اساس مجموعه بسیار محدودی از دادهها، گام بزرگی در فناوری ویدیو محسوب میشود. قابلیتهای Transframer همچنین نتایج بسیار امیدوارکنندهای را در سایر عملیاتها و معیارهای مرتبط با ویدیو مانند طبقه بندی تصویر ارائه میکند.
علاوه بر این میتواند پیامدهای بالقوه بسیار زیادی برای صنایع مبتنی بر ویدیو، مانند توسعه بازی داشته باشد. محیطهای فعلی توسعه بازی بر تکنیکهای اصلی رندرینگ مانند سایهزنی، نقشهبرداری بافت، عمق میدان و ردیابی پرتو تکیه دارند. فناوریهایی مانند Transframer این پتانسیل را دارند که با استفاده از هوش مصنوعی و یادگیری ماشینی برای ساخت محیط، مسیر توسعه کاملا جدیدی را به توسعهدهندگان ارائه کنند و در عین حال، زمان، منابع و تلاش لازم برای ایجاد آنها را کاهش دهند.
تیم هوش مصنوعی گوگل در طول چند سال گذشته پیشرفتهای چشمگیری داشته است. ماه گذشته آزمایشگاه هوش مصنوعی DeepMind از ابزاری به نام AlphaFold رونمایی کرد که با موفقیت، ساختار تقریبا تمام پروتئینهای شناخته شده جهان را پیشبینی میکند.