در تابستانی که گذشت گوگل با نرم افزار مغز مجازی خود یک نقطه تحول جدید در حوزه هوش مصنوعی ایجاد کرد. نرمافزاری که میتواند با تماشا کردن ویدیوهای یوتوب، گربهها، چهره آدمها و سایر چیزها را تشخیص دهد. این تکنولوژی که بر اساس طرز کار سلولهای مغز طرحریزی شده، حالا به کار افتاده تا محصولات گوگل را هوشمندتر از قبل کند و تشخیص گفتار اولین سرویس گوگل است که از آن بهره میبرد.
نرمافزار خودآموز گوگل بر اساس گروههای مجازی از سلولهای به هم پیوسته مغز مصنوعی کار میکند، آنها با یکدیگر تماس بر قرار کرده و در این ضمن بر یکدیگر تأثیر میگذارند. وقتی این شبکه عصبی در معرض دادهها قرار میگیرد، ارتباط بین عصبهای مختلف تغییر میکند و این باعث میشود که کل شبکه قابلیت نشان دادن واکنشهای معین به دادههای دریافتی از یک نوع خاص را از خود بروز دهد و به قول معروف، چیز یاد بگیرد.
شبکههای عصبی مجازی سالها است که در زمینه ماشینهای دارای قدرت یادگیری به کار میروند، مثلاً نرمافزار شطرنجباز یا نرمافزارهای تشخیص چهره. و حالا مهندسین گوگل راهی را پیدا کردهاند تا قدرت رایانشی را پشت این رویکرد تکنولوژیک قرار دهند و با بردن آن به ورای مرزها قبلی، شبکههای عصبی دارای قدرت یادگیری "بدون کمک انسان" را بسازند و نتیجه کارشان آنقدر قوی شده که میتواند به صورت تجاری هم مورد استفاده قرار بگیرد.
شبکههای عصبی شاغل در گوگل به جای پرسیدن از انسان، میتوانند برای خودشان تصمیم بگیرند که برای شناسایی اشیا، به چه دادههایی توجه نشان داده و کدام الگوها، رنگها و اَشکال را بررسی کنند.
گوگل اکنون از این شبکههای عصبی مجازی برای تشخیص بهتر گفتار استفاده میکند و علت نیز در اهمیت روز افزون دستیارهای صوتی بر روی تلفنهای هوشمند است که به زمینهای مهم برای رقابت کمپانیها تبدیل شدهاند. وینسنت وانهوک از مدیران بخش تشخیص گفتار در گوگل میگوید: «ما در زمینه تشخیص کلماتی که اشتباه هستند، بین 20 تا 25 درصد پیشرفت کردهایم، این یعنی تعداد بیشتر از افراد تجربهای بدون اشکال را خواهند داشت.» شبکه عصبی فعلاً فقط برای زبان انگلیسی با تلفظ امریکایی کار میکند ولی وانهوک میگوید که پیشرفتهای مشابه، بعد از عرضه این تکنولوژی برای سایر زبانها، میسر خواهد بود.
با کمک تکنولوژی جدید، سایر محصولات گوگل نیز به مرور پیشرفت خواهند کرد. برای مثال ابزار جستجوی تصاویر قادر خواهد شد که عکسها را بدون استناد به متن مربوط به آنها، شناسایی کند. همینطور اتومبیلهای بدون راننده گوگل و پروژه گوگل گلس نیز از این تکنولوژی هوش مصنوعی برای درک بهتر دنیای پیرامون خود بهره خواهند برد.
تکنولوژی جدید گوگل زمانی به تیتر خبرها تبدیل شد که مهندسین این کمپانی نتایج آزمایش شناسایی اشیا و جاندارن بر روی 10 میلیون عکس گرفته شده از ویدیوهای یوتوب را ارائه کردند؛ آزمایشی که طی 10 روز کاری مداوم و با استفاده از 1000 کامپیوتر با 16 هزار پردازنده به دست آمده بودند.
جف دین، یکی از مهندسینی که آن تجربه را هدایت میکرد، میگوید: «اکثر محققین مدلهای خودشان را روی یک دستگاه اجرا میکنند ولی ما میخواستیم تجربه را روی شبکههای وسیع عصبی انجام دهیم. اگر شما هم اندازه مدل و هم حجم دادههای اجرا شده در آن را افزایش دهید، قادر به ایجاد برتریهای آشکار و قابلیتهای پیچیدهتر خواهید شد.»
شبکههای عصبی به دست آمده از آن فرآیند، منعطفتر هستند. آقای دین میگوید: «به طور نمونه این مدلها میتوانند متنهای بسیار بزرگتری را دریافت کنند.» او یک مثال از تشخیص گفتار میدهد. برای مثال، سیستم گوگل یاد گرفته که اگر کسی گفت «من میخوام یه سرخآلو بخورم» ولی کلمه "سرخآلو" را بد تلفظ کرد، خودش بر اساس تجربههای قبلی که از شنیدن جملهها به دست آمده، تردید خود را بر طرف کند زیرا سرخآلو یک میوه است و از لحاظ متنی با سیب یا پرتقال یکی به شمار میرود.
آقای دین میگوید که گروهش در حال تست کردن مدلهایی است که تصویر و متن را هم میفهمند: «شما بهش کلمه گراز ماهی را میدهید و آن هم به شما تصاویری از آن میدهد. یا اگر تصویر گراز ماهی را نشانش دهید، برای شما کلمه گراز ماهی را مینویسد.»
کار گوگل میتواند ما را یک گام به رسیدن به یکی از اهداف هوش مصنوعی نزدیک کند؛ یعنی ساختن نرمافزاری که بتواند با هوش حیوانات یا حتی انسانها برابر کند. یوشائو بنجیو که از اساتید دانشگاه مونترئال است و روی تکنیکهای هوش مصنوعی کار میکند، میگوید: «این است مسیر درستی که به ساخت هوش مصنوعی در مقیاس عام منتج میشود. اگر نتوانید انبوه اطلاعات در حجم وسیع را ارائه کنید راهی برای ساخت شبکه هوش مصنوعی وجود ندارد. ما فهمیدهایم که شبکههای خودآموز عصبی که [توسط گوگل] استفاده میشوند از روشهایی درست مشابه یافتن اشیا واقعی توسط مغز انسان، بهره میبرند.»
آقای دین با محافظهکاری سعی میکند در حرفهایش به نزدیک بودن عملکرد شبکه مصنوعی به مغز انسان اشارهای نکند ولی نمیتواند جلوی خودش را بگیرد و میگوید که اگر مسیر درست را طی کنند، شبکه گوگل سرانجام میتواند مغز انسان را شکست دهد.
او میگوید: «در برخی زمینههای بصری عملکرد شبکه مصنوعی بهتر از مغز انسان است» و برای مثال به برچسب زدن پلاک خانهها در تصاویر استریت ویو نقشههای گوگل اشاره میکند: «شروع کردهایم به استفاده از شبکههای عصبی برای تشخیص اینکه یک عدد در عکسها، پلاک خانه است یا چیز دیگر» و مشخص شده که نتایج بهتر از نتایج انسانی هستند.
این یک پیروزی کوچک است و با آنکه هنوز هوش مصنوعی از هوش انسانی عقب است ولی این طلیعه آنها را به آینده کارشان امیدوار کرده.