یادگیری ماشینی چیست؟

یادگیری ماشینی شاخه‌ای از هوش مصنوعی (AI) و علوم کامپیوتر است که بر استفاده از داده‌ها و الگوریتم‌ها برای تقلید از روشی که انسان‌ها یاد می‌گیرند تمرکز دارد و به تدریج دقت آن را بهبود می‌بخشد. طی چند دهه گذشته، پیشرفت‌های تکنولوژیکی در زمینه ذخیره‌سازی و قدرت پردازش، برخی از محصولات نوآورانه مبتنی بر یادگیری ماشینی، مانند موتور توصیه‌ای نتفلیکس و خودروهای خودران را فراهم کرده است.

یادگیری ماشینی جزء مهمی از حوزه رو به رشد علم داده (Data Science) است. توسط روش های آماری و الگوریتم های طبقه بندی که در پروژه های داده کاوی آموزش داده می شود، پیش بینی و “کشف بینش” امکانپذیر می شود. این بینش‌ها متعاقباً تصمیم‌گیری را در برنامه‌ها و کسب‌وکارها هدایت می‌کنند. با گسترش داده های بزرگ (Big Data)، تقاضای بازار برای متخصصان تحلیل داده افزایش می یابد.

یادگیری ماشینی در مقابل یادگیری عمیق در مقابل شبکه های عصبی

اغلب، یادگیری عمیق و یادگیری ماشینی به جای یکدیگر مورد استفاده قرار می گیرند. درصورتیکه تفاوت ظریفی بین این دو مفهوم وجود دارد. یادگیری ماشینی (Machine Learning)، یادگیری عمیق (Deep Learning) و شبکه های عصبی (Neural Networks) همگی زیر شاخه های هوش مصنوعی هستند. با این حال، شبکه های عصبی در واقع زیر شاخه ای از یادگیری ماشینی هستند و یادگیری عمیق زیر شاخه ای از شبکه های عصبی است.

تفاوت یادگیری عمیق و یادگیری ماشینی در نحوه یادگیری هر الگوریتم است. یادگیری ماشینی عمیق می‌تواند از مجموعه داده‌های برچسب‌گذاری‌شده، که به عنوان یادگیری نظارت‌شده نیز شناخته می‌شود، برای اطلاع‌رسانی الگوریتم خود استفاده کند، اما لزوماً به یک مجموعه داده برچسب‌دار نیاز ندارد. یادگیری عمیق می‌تواند داده‌های بدون ساختار را به شکل خام (مثلا متن یا تصاویر) وارد کند و سپس به طور خودکار مجموعه‌ای از ویژگی‌هایی را تعیین کند که دسته‌های مختلف داده‌ها را از یکدیگر متمایز می‌کند. این امر برخی از مداخلات انسانی مورد نیاز را حذف کرده و امکان استفاده از مجموعه داده های بزرگتر را فراهم می کند.

یادگیری ماشینی کلاسیک یا “غیر عمیق” بیشتر به مداخله انسان برای یادگیری وابسته است. در این روش، افراد متخصص مجموعه ای از ویژگی ها را برای درک تفاوت بین داده های ورودی تعیین می کنند که معمولاً برای یادگیری به داده های ساختاریافته بیشتری نیاز دارند.

شبکه‌های عصبی یا شبکه‌های عصبی مصنوعی از لایه‌های گرهی تشکیل شده‌اند که شامل یک لایه ورودی، یک یا چند لایه پنهان و یک لایه خروجی است. هر گره به گره دیگری متصل می شود و دارای وزن و آستانه است. اگر خروجی هر گره بالاتر از مقدار آستانه مشخص شده باشد، آن گره فعال می شود و داده ها را به لایه بعدی شبکه ارسال می کند. در غیر این صورت، هیچ داده ای توسط آن گره به لایه بعدی منتقل نمی شود. کلمه ی”عمیق” در عبارت “یادگیری عمیق” فقط به تعداد لایه های شبکه عصبی اشاره دارد. شبکه عصبی که از بیش از سه لایه تشکیل شده می تواند یک الگوریتم یادگیری عمیق یا یک شبکه عصبی عمیق در نظر گرفته شود. شبکه عصبی که فقط سه لایه دارد، فقط یک شبکه عصبی اولیه است.

“یادگیری عمیق” و “شبکه‌های عصبی” باعث تسریع پیشرفت در زمینه‌هایی مانند بینایی رایانه، پردازش زبان طبیعی و تشخیص گفتار می‌شوند.

روش های یادگیری ماشینی

مدل های یادگیری ماشینی به سه دسته اصلی تقسیم می شوند:

یادگیری ماشینی نظارت شده: با استفاده از مجموعه داده های برچسب گذاری شده برای آموزش به الگوریتم ها جهت طبقه بندی داده ها یا پیش بینی دقیق نتایج تعریف می شود. یادگیری تحت نظارت به سازمان ها کمک می کند تا انواع مشکلات دنیای واقعی را حل کنند، مانند طبقه بندی هرزنامه ها در پوشه ای جداگانه از صندوق ورودی. برخی از روش‌های مورد استفاده در یادگیری نظارت شده عبارتند از: شبکه‌های عصبی، رگرسیون خطی، رگرسیون لجستیک، الگوریتم جنگل تصادفی و ماشین بردار پشتیبان.
یادگیری ماشینی بدون نظارت: از الگوریتم های یادگیری ماشینی برای تجزیه و تحلیل و خوشه بندی مجموعه داده های بدون برچسب استفاده می کند. این الگوریتم ها الگوهای پنهان یا گروه بندی داده ها را بدون نیاز به دخالت انسان کشف می کنند. توانایی این روش در کشف شباهت‌ها و تفاوت‌ها در اطلاعات، آن را برای تجزیه و تحلیل داده‌های اکتشافی، استراتژی‌های فروش متقابل، تقسیم‌بندی مشتری، و تشخیص تصویر و الگو، ایده‌آل می‌کند. سایر الگوریتم‌های مورد استفاده در یادگیری بدون نظارت شامل شبکه‌های عصبی، خوشه‌بندی k-means و روش‌های خوشه‌بندی احتمالی است.
یادگیری نیمه نظارتی: هنگام آموزش، از یک مجموعه داده برچسب‌دار کوچک‌ برای هدایت طبقه‌بندی و استخراج ویژگی از یک مجموعه داده بزرگ‌ و بدون برچسب استفاده می‌کند. یادگیری نیمه نظارت شده می تواند مشکلِ نداشتن داده های برچسب گذاری شده کافی برای الگوریتم یادگیری نظارت شده را حل کند. همچنین اگر برچسب گذاری داده های کافی بسیار پرهزینه باشد، مفید است.

یادگیری ماشینی تقویت شده

یادگیری ماشینی تقویت شده یک مدل یادگیری ماشینی است که شبیه به یادگیری نظارت شده است، اما الگوریتم با استفاده از داده های نمونه آموزش داده نمی شود. این مدل با استفاده از آزمون و خطا یاد می گیرد. بدین صورت که دنباله ای از نتایج موفقیت آمیز برای ایجاد بهترین توصیه یا خط مشی برای یک مشکل خاص تقویت می شود.

الگوریتم های رایج یادگیری ماشینی

تعدادی از الگوریتم های یادگیری ماشین که معمولا استفاده می شود عبارتند از:

شبکه های عصبی: شبکه های عصبی نحوه عملکرد مغز انسان را با تعداد زیادی گره پردازشی مرتبط شبیه سازی می کنند. شبکه های عصبی در تشخیص الگوها خوب هستند و نقش مهمی در کاربردهایی از جمله ترجمه زبان طبیعی، تشخیص تصویر، تشخیص گفتار و ایجاد تصویر دارند.

رگرسیون خطی: این الگوریتم برای پیش بینی مقادیر عددی بر اساس رابطه خطی بین مقادیر مختلف استفاده می شود. به عنوان مثال، این تکنیک می تواند برای پیش بینی قیمت خانه بر اساس داده های تاریخی برای منطقه مورد استفاده قرار گیرد.

رگرسیون لجستیک: این الگوریتم یادگیری نظارت شده برای متغیرهای پاسخ طبقه‌ای، مانند پاسخ‌های «بله/خیر» به سؤالات، پیش‌بینی می‌کند. می توان از آن برای برنامه هایی مانند طبقه بندی هرزنامه و کنترل کیفیت در خط تولید استفاده کرد.

خوشه بندی: با استفاده از یادگیری بدون نظارت، الگوریتم های خوشه بندی می توانند الگوهای موجود در داده ها را شناسایی کنند تا بتوان آنها را گروه بندی کرد. رایانه ها می توانند با شناسایی تفاوت های بین اقلام داده ای که انسان ها نادیده گرفته اند، به متخصصان داده کمک کنند.

درخت تصمیم: درخت تصمیم را می توان هم برای پیش بینی مقادیر عددی (رگرسیون) و هم برای طبقه بندی داده ها به دسته ها استفاده کرد. درختان تصمیم از یک دنباله انشعاب از تصمیمات مرتبط استفاده می کنند که می تواند با یک نمودار درختی نمایش داده شود. یکی از مزایای درخت تصمیم این است که بر خلاف جعبه سیاه شبکه عصبی، اعتبارسنجی و ممیزی آسان است.

جنگل‌ تصادفی: در جنگل تصادفی، الگوریتم یادگیری ماشین یک مقدار یا دسته را با ترکیب نتایج تعدادی درخت تصمیم پیش‌بینی می‌کند.

موارد استفاده از یادگیری ماشین در دنیای واقعی

در اینجا چند نمونه از یادگیری ماشینی وجود دارد که ممکن است هر روز با آنها روبرو شوید:

تشخیص گفتار: با نام‌های تشخیص گفتار رایانه‌ای یا گفتار به متن نیز شناخته می‌شود و قابلیتی است که از پردازش زبان طبیعی برای ترجمه گفتار انسان به قالب نوشتاری استفاده می‌کند. بسیاری از دستگاه‌های تلفن همراه برای انجام جستجوی صوتی از تشخیص گفتار در سیستم‌های خود استفاده می‌کنند.

خدمات مشتری: چت ربات‌های آنلاین حین مذاکره با مشتری جایگزین عوامل انسانی می‌شوند و نحوه تفکر ما را در مورد تعامل با مشتری در بین وب‌سایت‌ها و پلتفرم‌های رسانه‌های اجتماعی تغییر می‌دهند. ربات‌های گفتگو به سؤالات متداول در مورد موضوعاتی مانند حمل و نقل پاسخ می‌دهند، یا توصیه‌های شخصی، فروش متقابل محصولات یا اندازه‌های پیشنهادی را برای کاربران ارائه می‌دهند.

بینایی رایانه: این فناوری هوش مصنوعی رایانه‌ها را قادر می‌سازد تا اطلاعات معنی‌داری را از تصاویر دیجیتال، ویدیوها و سایر ورودی‌های بصری به دست آورند و سپس اقدام مناسب را انجام دهند. بینایی کامپیوتر با پشتیبانی از شبکه‌های عصبی کانولوشنال، کاربردهایی در برچسب‌گذاری عکس در رسانه‌های اجتماعی، تصویربرداری رادیولوژی در مراقبت‌های بهداشتی و خودروهای خودران در صنعت خودرو دارد.

موتورهای توصیه: با استفاده از داده‌های رفتار مصرف گذشته، الگوریتم‌های هوش مصنوعی می‌توانند به کشف روندهای داده‌ای که می‌توانند برای توسعه استراتژی‌های فروش متقابل مورد استفاده قرار گیرند، کمک کنند. این رویکرد توسط خرده فروشان آنلاین برای ارائه توصیه های مربوط به محصول به مشتریان در طول فرآیند پرداخت استفاده می شود.

معاملات خودکار سهام: پلتفرم‌های معاملاتی با فرکانس بالا مبتنی بر هوش مصنوعی که برای بهینه‌سازی سبد سهام طراحی شده‌اند، هزاران یا حتی میلیون‌ها معامله را در روز بدون دخالت انسان انجام می‌دهند.

تشخیص تقلب: بانک ها و سایر موسسات مالی می توانند از یادگیری ماشینی برای شناسایی تراکنش های مشکوک استفاده کنند. یادگیری تحت نظارت می تواند یک مدل را با استفاده از اطلاعات مربوط به تراکنش های جعلی شناخته شده آموزش دهد. تشخیص ناهنجاری می‌تواند تراکنش‌هایی را شناسایی کند که غیر معمول به نظر می‌رسند و مستحق بررسی بیشتر هستند.

چالش های یادگیری ماشینی

همانطور که فناوری یادگیری ماشین توسعه یافته، مطمئناً زندگی ما را آسان‌تر کرده است. با این حال، پیاده‌سازی یادگیری ماشینی در مشاغل، نگرانی‌های اخلاقی زیادی را در مورد فناوری‌های هوش مصنوعی نیز ایجاد کرده است. برخی از این موارد عبارتند از:

تکینگی فناوری:

تکینگی فناوری فرضیه‌ای است که پیش‌بینی می‌کند که شتاب در فناوری در نهایت باعث می‌شود که هوش مصنوعی از هوش بشر پیشی بگیرد و منجر به تغییرات شگرف یا حتی پایان تمدن بشری بشود. چون توانایی‌های چنین هوشی ممکن است قابل درک نباشد، اتفاقاتی که بعد از تکینگی فناوری می‌افتند ممکن است پیش‌بینی‌ناپذیر باشند.

در حالی که این موضوع توجه عمومی زیادی را به خود جلب می کند، بسیاری از محققان نگران این ایده نیستند که هوش مصنوعی در آینده نزدیک از هوش انسانی پیشی بگیرد. تکینگی تکنولوژیک نیز به عنوان هوش مصنوعی قوی یا ابر هوش نامیده می شود. فیلسوف نیک بوستروم، ابرهوشی را اینگونه تعریف می‌کند: «هر عقلی که عملاً در هر زمینه‌ای، از جمله خلاقیت علمی، خرد عمومی، و مهارت‌های اجتماعی، از بهترین مغزهای انسان بسیار بهتر عمل می‌کند». علیرغم این واقعیت که ابرهوشی در جامعه قریب الوقوع نیست، ایده آن سوالات جالبی را ایجاد می کند زیرا ما استفاده از سیستم های خودران مانند اتومبیل های خودران را در نظر می گیریم. این غیر واقعی است که فکر کنیم یک ماشین بدون راننده هرگز تصادف نمی کند، اما چه کسی در این شرایط مسئول است؟ آیا هنوز باید وسایل نقلیه خودران توسعه دهیم یا این فناوری را به وسایل نقلیه نیمه خودران که به مردم کمک می کنند با خیال راحت رانندگی کنند محدود می کنیم؟ این ها انواع بحث های اخلاقی هستند که با توسعه فناوری جدید و خلاقانه هوش مصنوعی در حال وقوع هستند.

تاثیر هوش مصنوعی بر مشاغل

در حالی که بسیاری از تصورات عمومی از هوش مصنوعی در مورد از دست دادن شغل متمرکز است، این نگرانی احتمالاً باید دوباره اصلاح شود. با هر فناوری جدید و مخرب، می بینیم که تقاضای بازار برای نقش های شغلی خاص تغییر می کند. به عنوان مثال، وقتی به صنعت خودرو نگاه می کنیم، بسیاری از تولیدکنندگان، مانند جنرال موتورز، روی تولید خودروهای الکتریکی تمرکز می کنند تا با ابتکارات سبز هماهنگ شوند. صنعت انرژی از بین نمی رود، اما منبع انرژی در حال تغییر از مصرف سوخت به برق است.

به همین ترتیب، هوش مصنوعی تقاضا برای مشاغل را به مناطق دیگر منتقل می کند. باید افرادی وجود داشته باشند که به مدیریت سیستم های هوش مصنوعی کمک کنند. هنوز هم باید افرادی وجود داشته باشند که مشکلات پیچیده تری را در صنایعی که به احتمال زیاد تحت تأثیر تغییرات تقاضای شغلی قرار می گیرند، مانند خدمات مشتری، حل کنند. بزرگترین چالش هوش مصنوعی و تأثیر آن بر بازار کار، کمک به افراد برای انتقال به نقش‌های جدید مورد تقاضا خواهد بود.

حریم خصوصی

داده هایی که افراد به اجبار در اختیار سازمان ها، ادارات، وب سایت ها و … قرار می دهند، همواره موجب نگرانی آنها است. این اطلاعات چگونه جمع آوری می شوند؟ توسط چه افرادی و با چه اهدافی مورد پردازش قرار می گیرند؟ آیا اطلاعات در اختیار افراد دیگری هم قرار می گیرد؟ ذخیره سازی این اطلاعات در چه مکانی و با چه سطحی از امنیت انجام شده است؟

با توجه به دغدغه های مذکور، سرمایه‌گذاری در امنیت به یک اولویت فزاینده برای کسب‌وکارها تبدیل شده است، زیرا آنها به دنبال حذف هرگونه آسیب‌پذیری و فرصت‌هایی برای نظارت، هک و حملات سایبری هستند.

تعصب و تبعیض

گزارش مواردی از تعصب و تبعیض در تعدادی از سیستم های یادگیری ماشینی، سوالات اخلاقی زیادی را در مورد استفاده از هوش مصنوعی ایجاد کرده است. البته این موضوع بصورت کاملا مغرضانه توسط فرآیندهای انسانی بوجود می آید. به عنوان مثال آمازون در تلاش خود برای خودکارسازی و ساده‌سازی یک فرآیند، ناخواسته بین نامزدهای شغلی بر اساس جنسیت برای نقش‌های فنی تبعیض قائل شد و این شرکت در نهایت مجبور شد پروژه را کنار بگذارد. تعصب و تبعیض به عملکرد منابع انسانی نیز محدود نمی شود. آنها را می توان در تعدادی از برنامه های کاربردی از نرم افزار تشخیص چهره گرفته تا الگوریتم های رسانه های اجتماعی یافت.

مسئوليت

از آنجایی که قانون قابل توجهی برای تنظیم شیوه های هوش مصنوعی وجود ندارد، هیچ مکانیسم اجرایی واقعی برای اطمینان از اجرای هوش مصنوعی اخلاقی وجود ندارد. انگیزه‌های فعلی برای پایندی شرکت ها به اخلاق مداری، پیامدهای منفی یک سیستم هوش مصنوعی غیراخلاقی است.

دوره آموزش کاربردهای هوش مصنوعی در زندگی روزمره

تهیه کننده: مهدی کوهستانی

مدیر اجرایی آموزش و مدیر دپارتمان فناوری اطلاعات و ارتباطات

لطفا جهت مشاهده برنامه کلاس های آموزش Machine Learning اینجا کلیک کنید.

لطفا جهت مشاهده لیست کامل دوره های آموزش برنامه نویسی اینجا کلیک کنید.