الگوریتمها به سرعت در حال پیشی گرفتن از انسانها هستند. این واقعیت غیرقابل انکار دنیاییست که ما در آن زندگی میکنیم. در حالیکه نسلهای اولیهی این الگوریتمهای یادگیرنده، برای یادگیری به ما انسانها نیاز داشتهاند، الگوریتمهای جدیدتر دیگر حتی برای یادگیری هم نیازی به انسان نخواهند داشت و خودشان از جهان و از خودشان خواهند آموخت.
دیپ بلو (deep blue) اولین کامپیوتر جهان بود که در سال ۱۹۹۶، موفق شد در مقابل قهرمان بزرگ شطرنج جهان یعنی گری کاسپاروف، از ۶ بازی، تنها یک بازی را ببرد. او در دو بازی به تساوی رسید و در سه بازی به این استاد بزرگ شطرنج روسیه باخت. اما فرآیند یادگیری این کامپیوتر بیشتر از یازده سال طول کشید. این کامیپوتر باید با شطرنجبازان حرفهای در سطوح مختلف بازی میکرد تا تک تک حرکات آنها در موقعیتهای مختلف را یاد بگیرد. آنوقت در وضعیتهای مختلف بازی شطرنج، به آموختههای خودش نگاه میکرد و تصمیمی مشابه شطرنجبازان حرفهای میگرفت. پس معلمان دیپ بلو همان انسانها بودند. اما باید یادمان باشد که از زمانی که دیپ بلو آن بازی را از گری کاسپاروف برد، چندین تغییر پارادایم در دنیای الگوریتمها رخ داده است.
این تغییرات بزرگ در دنیای کامپیوتر، صرفا تغییر اسم برای طراحی الگوریتمهای کارآمدتر نبوده، بلکه واقعا نوع یادگیری الگوریتمها دستخوش تغییر شده است. تفسیرها و پیشبینیهای اکثر آینده پژوهان، مبتنی بر عملکرد همان الگوریتمهای یادگیرندهی نسلهای اول باقی مانده است. اما الگوریتمهای کنونی با الگوریتمهای نخستین زمین تا آسمان متفاوت هستند.
اجازه دهید با یک مثال این موضوع را بررسی کنیم. در سال ۲۰۱۶، یکی از نوههای همان کامپیوتر دیپ بلو، به نام استاک فیش ۸ (Stockfish 8) قهرمان بلامنازع شطرنج جهان بود. این کامپیوتر به قرنها دانش و تجربهی بشری در شطرنج دسترسی داشت. همچنین این کامپیوتر چند دهه بعد از دیپ بلو متولد شده بود و بنابراین به اطلاعات پدران کامپیوتریاش هم دسترسی داشت. این کامپیوتر آنقدر قدرتمند بود که میتوانست حدود هفتاد میلیون حرکت در ثانیه را تحلیل کند. بسیار قدرتمندتر از هر شطرنجباز انسانی. اما چه کسی میتوانست او را شکست دهد؟
اما یک الگوریتم جدید متعلق به گوگل که متعلق به پاردایم بعدی الگوریتمهای یادگیرنده بود موفق شد خیلی راحت او را شکست دهد. الگوریتم آلفا زیرو (Alphazero) گوگل، حریف جدید این کامپیوتر بود. آلفا زیرو فقط هشتاد هزار حرکت در ثانیه را تحلیل میکرد، بسیار کمتر از استاک فیش و دیپ بلو. اما از صد مسابقهی شطرنج بین آلفا زیرو و استاک فیش، آلفا زیرو ۲۸ مسابقه را برد و در ۷۲ مسابقه به تساوی رسید و در هیچ مسابقهای نباخت. با اینکه آلفا زیرو محاسبات بسیار کمتری انجام میداد، اما خیلی راحت بر استاک فیش غلبه کرد. آلفا زیرو، شطرنج را از کسی یاد نگرفته بود. آلفا زیرو صرفا با استفاده از الگوریتمهای یادگیری ماشین (Machine Learning) و مسابقه دادن در مقابل خودش، شطرنج را یاد گرفته بود. آن هم نه در چند قرن یا چند دهه یا چند سال، آلفا زیرو شطرنج را تنها با ۴ ساعت بازی کردن مقابل خودش یاد گرفته بود. حرکات او هیچ شباهتی با حرکات بزرگترین نابغههای شطرنج جهان نداشت و بهترین الگوریتم پارادایم قبلی، نمیتوانست حرکات او را پیشبینی کند و براحتی در مقابل او شکست میخورد. رفته رفته ما به روزی نزدیک میشویم که ما باید از الگوریتمها یاد بگیریم نه آنها از ما و این تغییر پارادایم بزرگیست که پیش روی ماست.
– ابا اباد