در حال حاضر هوش مصنوعی در شناسایی اشیاء عملکرد بسیار خوبی دارد: وقتی میلیونها تصویر به آن نشان دهید، میتواند با دقت عجیبی به شما بگوید کدام یک عابر پیادهای را در حال رد شدن از خیابان نشان میدهد. فعلا هوش مصنوعی در تولید تصاویر زنده از عابران پیاده ناتوان است؛ اما اگر بتواند این کار را انجام دهد، تکههایی از واقعیت را میسازد و تصاویر ساختگی، عابران پیاده را در تنظیمات مختلف نمایش میدهند؛ بهطوری که یک خودروی بدون راننده بتواند بدون طی مسیر جاده از آنها برای آموزش خود استفاده کند
. اما مشکل، ساخت یک محصول کاملا جدید است که نیازمند قدرت تصور باشد و همین هوش مصنوعی را پیچیده کرده است. راه حل در ابتدا در
یان گودفیلو ارائه شد سپس یکی از دانشجوهای دکترای دانشگاه مونترآل در یک بحث آکادمیک در سال ۲۰۱۴ به آن دست یافت. این روش که به شبکهی تعمیمیافتهی مبارز
(GAN) معروف است، دو شبکهی عصبی را بهعنوان ورودی میگیرد. این دو شبکه مدلهای ریاضی سادهای از مغز انسان هستند که بر مدرنترین نوع یادگیری ماشین تأکید میکنند. سپس این دو شبکه در یک بازی دیجیتال موش و گربه مقابل هم قرار میگیرند
.هر دو شبکه روی یک مجموعهی یکسان دادهای آموزش داده شدهاند. یکی از شبکهها که سازنده نامیده میشود، تغییراتی در تصاویر دیدهشده اعمال میکند. این تصویر میتواند تصویر یک عابر پیاده یا یک بازوی اضافه باشد. دومین شبکه که تفکیککننده است، بررسی میکند که تصویر دیدهشده مشابه تصویری است که آموزش دیده یا یک نسخهی تقلبی توسط سازنده است، مثلا بررسی میکند که آیا شخص با سه بازو مشابه نمونهی واقعی است؟
به مرور زمان، سازنده میتواند به اندازهای در تولید تصاویر موفق شود که تفکیککننده قادر به تشخیص تصاویر تقلبی نباشد. سازنده برای تشخیص و سپس ساخت تصاویر شبه واقعی از عابران پیاده، آموزش میبیند
.فناوری به یکی از نویدبخشترین پیشرفتهای هوش مصنوعی در دههی گذشته دست یافتهکه قادر است به ماشینها در تولید نتایج گمراهکننده حتی برای انسانها کمک کند
.GANها از سخنرانی شبه واقعی و پردازش تصویر تقلبی شبه عکس استفاده میکنند. در یک مثال پرتنش، پژوهشگران از سازندهی تراشه
Nvidia به آمادهسازی یک
GAN با تصاویری از اشخاص معروف پرداختند تا صدها تصویر معتبر از افرادی که وجود نداشتند تولید کنند. یک گروه پژوهشی دیگر نقاشیهای تقلبی مشابه آثار
ون گوگ تولید کرد
. GAN-ها در مرحلهی بعدی میتوانند تصاویر را به شیوههای مختلف تصور کنند؛ مثلا یک جادهی آفتابی را به یک جادهی برفی تبدیل کنند یا اسب را به گورخر تبدیل کنند
.نتیجهها همیشه بینقص نیستند
: GAN-ها میتوانند دو دسته برای دوچرخه در نظر بگیرند یا مثلا ابرو را در محل اشتباهی از صورت قرار دهند
. اما به این دلیل که تصاویر و صداها اغلب واقعی هستند، به عقیدهی بعضی کارشناسان
GAN-ها میتوانند به درک و تأکید بر ساختار جهانی که میبینند و میشنوند بپردازند؛ و این یعنی
AI همراه با درک تصور، میتواند به توانایی مستقل درک مشاهدات در دنیای اطراف خود هم برسد
..