اَبا اِباد

الگوریتم‌های یادگیرنده

الگوریتم‌های یادگیرنده

الگوریتم‌ها به سرعت در حال پیشی گرفتن از انسان‌ها هستند. این واقعیت غیرقابل انکار دنیایی‌ست که ما در آن زندگی می‌کنیم. در حالیکه نسل‌های اولیه‌ی این الگوریتم‌های یادگیرنده، برای یادگیری به ما انسان‌ها نیاز داشته‌اند، الگوریتم‌های جدیدتر دیگر حتی برای یادگیری هم نیازی به انسان نخواهند داشت و خودشان از جهان و از خودشان خواهند آموخت.

دیپ‌ بلو (deep blue) اولین کامپیوتر جهان بود که در سال ۱۹۹۶، موفق شد در مقابل قهرمان بزرگ شطرنج جهان یعنی گری کاسپاروف، از ۶ بازی، تنها یک بازی را ببرد. او در دو بازی به تساوی رسید و در سه بازی به این استاد بزرگ شطرنج روسیه باخت. اما فرآیند یادگیری این کامپیوتر بیشتر از یازده سال طول کشید. این کامیپوتر باید با شطرنج‌بازان حرفه‌ای در سطوح مختلف بازی می‌کرد تا تک تک حرکات آن‌ها در موقعیت‌های مختلف را یاد بگیرد. آنوقت در وضعیت‌های مختلف بازی شطرنج، به آموخته‌های خودش نگاه می‌کرد و تصمیمی مشابه شطرنج‌بازان حرفه‌ای می‌گرفت. پس معلمان دیپ بلو همان انسان‌ها بودند. اما باید یادمان باشد که از زمانی که دیپ بلو آن بازی را از گری کاسپاروف برد، چندین تغییر پارادایم در دنیای الگوریتم‌ها رخ داده است.

این تغییرات بزرگ در دنیای کامپیوتر، صرفا تغییر اسم برای طراحی الگوریتم‌های کارآمدتر نبوده، بلکه واقعا نوع یادگیری الگوریتم‌ها دستخوش تغییر شده است. تفسیرها و پیش‌بینی‌های اکثر آینده پژوهان، مبتنی بر عملکرد همان الگوریتم‌های یادگیرنده‌ی نسل‌های اول باقی مانده است. اما الگوریتم‌های کنونی با الگوریتم‌های نخستین زمین تا آسمان متفاوت هستند.

اجازه دهید با یک مثال این موضوع‌ را بررسی کنیم. در سال ۲۰۱۶، یکی از نوه‌های همان کامپیوتر دیپ بلو، به نام استاک فیش ۸ (Stockfish 8) قهرمان بلامنازع شطرنج جهان بود. این کامپیوتر به قرن‌ها دانش و تجربه‌ی بشری در شطرنج دسترسی داشت. همچنین این کامپیوتر چند دهه بعد از دیپ بلو متولد شده بود و بنابراین به اطلاعات پدران کامپیوتری‌اش هم دسترسی داشت. این کامپیوتر آنقدر قدرتمند بود که می‌توانست حدود هفتاد میلیون حرکت در ثانیه را تحلیل کند. بسیار قدرتمندتر از هر شطرنج‌باز انسانی. اما چه کسی می‌توانست او را شکست دهد؟

اما یک الگوریتم جدید متعلق به گوگل که متعلق به پاردایم بعدی الگوریتم‌های یادگیرنده بود موفق شد خیلی راحت او را شکست دهد. الگوریتم آلفا زیرو (Alphazero) گوگل، حریف جدید این کامپیوتر بود. آلفا زیرو فقط هشتاد هزار حرکت در ثانیه را تحلیل می‌کرد، بسیار کمتر از استاک فیش و دیپ بلو. اما از صد مسابقه‌ی شطرنج بین آلفا زیرو و استاک فیش، آلفا زیرو ۲۸ مسابقه را برد و در ۷۲ مسابقه به تساوی رسید و در هیچ مسابقه‌ای نباخت. با اینکه آلفا زیرو محاسبات بسیار کمتری انجام می‌داد، اما خیلی راحت بر استاک فیش غلبه کرد. آلفا زیرو، شطرنج را از کسی یاد نگرفته بود. آلفا زیرو صرفا با استفاده از الگوریتم‌های یادگیری ماشین (Machine Learning) و مسابقه دادن در مقابل خودش، شطرنج را یاد گرفته بود. آن هم نه در چند قرن یا چند دهه یا چند سال، آلفا زیرو شطرنج را تنها با ۴ ساعت بازی کردن مقابل خودش یاد گرفته بود. حرکات او هیچ شباهتی با حرکات بزرگترین نابغه‌های شطرنج جهان نداشت و بهترین الگوریتم پارادایم قبلی، نمی‌توانست حرکات او را پیش‌بینی کند و براحتی در مقابل او شکست می‌خورد. رفته رفته ما به روزی نزدیک می‌شویم که ما باید از الگوریتم‌ها یاد بگیریم نه آن‌ها از ما و این تغییر پارادایم بزرگی‌ست که پیش روی ماست.

– ابا اباد

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *