یادگیری ماشینی چیست؟
یادگیری ماشینی شاخهای از هوش مصنوعی (AI) و علوم کامپیوتر است که بر استفاده از دادهها و الگوریتمها برای تقلید از روشی که انسانها یاد میگیرند تمرکز دارد و به تدریج دقت آن را بهبود میبخشد. طی چند دهه گذشته، پیشرفتهای تکنولوژیکی در زمینه ذخیرهسازی و قدرت پردازش، برخی از محصولات نوآورانه مبتنی بر یادگیری ماشینی، مانند موتور توصیهای نتفلیکس و خودروهای خودران را فراهم کرده است.
یادگیری ماشینی جزء مهمی از حوزه رو به رشد علم داده (Data Science) است. توسط روش های آماری و الگوریتم های طبقه بندی که در پروژه های داده کاوی آموزش داده می شود، پیش بینی و “کشف بینش” امکانپذیر می شود. این بینشها متعاقباً تصمیمگیری را در برنامهها و کسبوکارها هدایت میکنند. با گسترش داده های بزرگ (Big Data)، تقاضای بازار برای متخصصان تحلیل داده افزایش می یابد.
یادگیری ماشینی در مقابل یادگیری عمیق در مقابل شبکه های عصبی
اغلب، یادگیری عمیق و یادگیری ماشینی به جای یکدیگر مورد استفاده قرار می گیرند. درصورتیکه تفاوت ظریفی بین این دو مفهوم وجود دارد. یادگیری ماشینی (Machine Learning)، یادگیری عمیق (Deep Learning) و شبکه های عصبی (Neural Networks) همگی زیر شاخه های هوش مصنوعی هستند. با این حال، شبکه های عصبی در واقع زیر شاخه ای از یادگیری ماشینی هستند و یادگیری عمیق زیر شاخه ای از شبکه های عصبی است.
تفاوت یادگیری عمیق و یادگیری ماشینی در نحوه یادگیری هر الگوریتم است. یادگیری ماشینی عمیق میتواند از مجموعه دادههای برچسبگذاریشده، که به عنوان یادگیری نظارتشده نیز شناخته میشود، برای اطلاعرسانی الگوریتم خود استفاده کند، اما لزوماً به یک مجموعه داده برچسبدار نیاز ندارد. یادگیری عمیق میتواند دادههای بدون ساختار را به شکل خام (مثلا متن یا تصاویر) وارد کند و سپس به طور خودکار مجموعهای از ویژگیهایی را تعیین کند که دستههای مختلف دادهها را از یکدیگر متمایز میکند. این امر برخی از مداخلات انسانی مورد نیاز را حذف کرده و امکان استفاده از مجموعه داده های بزرگتر را فراهم می کند.
یادگیری ماشینی کلاسیک یا “غیر عمیق” بیشتر به مداخله انسان برای یادگیری وابسته است. در این روش، افراد متخصص مجموعه ای از ویژگی ها را برای درک تفاوت بین داده های ورودی تعیین می کنند که معمولاً برای یادگیری به داده های ساختاریافته بیشتری نیاز دارند.
شبکههای عصبی یا شبکههای عصبی مصنوعی از لایههای گرهی تشکیل شدهاند که شامل یک لایه ورودی، یک یا چند لایه پنهان و یک لایه خروجی است. هر گره به گره دیگری متصل می شود و دارای وزن و آستانه است. اگر خروجی هر گره بالاتر از مقدار آستانه مشخص شده باشد، آن گره فعال می شود و داده ها را به لایه بعدی شبکه ارسال می کند. در غیر این صورت، هیچ داده ای توسط آن گره به لایه بعدی منتقل نمی شود. کلمه ی”عمیق” در عبارت “یادگیری عمیق” فقط به تعداد لایه های شبکه عصبی اشاره دارد. شبکه عصبی که از بیش از سه لایه تشکیل شده می تواند یک الگوریتم یادگیری عمیق یا یک شبکه عصبی عمیق در نظر گرفته شود. شبکه عصبی که فقط سه لایه دارد، فقط یک شبکه عصبی اولیه است.
“یادگیری عمیق” و “شبکههای عصبی” باعث تسریع پیشرفت در زمینههایی مانند بینایی رایانه، پردازش زبان طبیعی و تشخیص گفتار میشوند.
روش های یادگیری ماشینی
مدل های یادگیری ماشینی به سه دسته اصلی تقسیم می شوند:
- یادگیری ماشینی نظارت شده: با استفاده از مجموعه داده های برچسب گذاری شده برای آموزش به الگوریتم ها جهت طبقه بندی داده ها یا پیش بینی دقیق نتایج تعریف می شود. یادگیری تحت نظارت به سازمان ها کمک می کند تا انواع مشکلات دنیای واقعی را حل کنند، مانند طبقه بندی هرزنامه ها در پوشه ای جداگانه از صندوق ورودی. برخی از روشهای مورد استفاده در یادگیری نظارت شده عبارتند از: شبکههای عصبی، رگرسیون خطی، رگرسیون لجستیک، الگوریتم جنگل تصادفی و ماشین بردار پشتیبان.
- یادگیری ماشینی بدون نظارت: از الگوریتم های یادگیری ماشینی برای تجزیه و تحلیل و خوشه بندی مجموعه داده های بدون برچسب استفاده می کند. این الگوریتم ها الگوهای پنهان یا گروه بندی داده ها را بدون نیاز به دخالت انسان کشف می کنند. توانایی این روش در کشف شباهتها و تفاوتها در اطلاعات، آن را برای تجزیه و تحلیل دادههای اکتشافی، استراتژیهای فروش متقابل، تقسیمبندی مشتری، و تشخیص تصویر و الگو، ایدهآل میکند. سایر الگوریتمهای مورد استفاده در یادگیری بدون نظارت شامل شبکههای عصبی، خوشهبندی k-means و روشهای خوشهبندی احتمالی است.
- یادگیری نیمه نظارتی: هنگام آموزش، از یک مجموعه داده برچسبدار کوچک برای هدایت طبقهبندی و استخراج ویژگی از یک مجموعه داده بزرگ و بدون برچسب استفاده میکند. یادگیری نیمه نظارت شده می تواند مشکلِ نداشتن داده های برچسب گذاری شده کافی برای الگوریتم یادگیری نظارت شده را حل کند. همچنین اگر برچسب گذاری داده های کافی بسیار پرهزینه باشد، مفید است.
یادگیری ماشینی تقویت شده
یادگیری ماشینی تقویت شده یک مدل یادگیری ماشینی است که شبیه به یادگیری نظارت شده است، اما الگوریتم با استفاده از داده های نمونه آموزش داده نمی شود. این مدل با استفاده از آزمون و خطا یاد می گیرد. بدین صورت که دنباله ای از نتایج موفقیت آمیز برای ایجاد بهترین توصیه یا خط مشی برای یک مشکل خاص تقویت می شود.
الگوریتم های رایج یادگیری ماشینی
تعدادی از الگوریتم های یادگیری ماشین که معمولا استفاده می شود عبارتند از:
شبکه های عصبی: شبکه های عصبی نحوه عملکرد مغز انسان را با تعداد زیادی گره پردازشی مرتبط شبیه سازی می کنند. شبکه های عصبی در تشخیص الگوها خوب هستند و نقش مهمی در کاربردهایی از جمله ترجمه زبان طبیعی، تشخیص تصویر، تشخیص گفتار و ایجاد تصویر دارند.
رگرسیون خطی: این الگوریتم برای پیش بینی مقادیر عددی بر اساس رابطه خطی بین مقادیر مختلف استفاده می شود. به عنوان مثال، این تکنیک می تواند برای پیش بینی قیمت خانه بر اساس داده های تاریخی برای منطقه مورد استفاده قرار گیرد.
رگرسیون لجستیک: این الگوریتم یادگیری نظارت شده برای متغیرهای پاسخ طبقهای، مانند پاسخهای «بله/خیر» به سؤالات، پیشبینی میکند. می توان از آن برای برنامه هایی مانند طبقه بندی هرزنامه و کنترل کیفیت در خط تولید استفاده کرد.
خوشه بندی: با استفاده از یادگیری بدون نظارت، الگوریتم های خوشه بندی می توانند الگوهای موجود در داده ها را شناسایی کنند تا بتوان آنها را گروه بندی کرد. رایانه ها می توانند با شناسایی تفاوت های بین اقلام داده ای که انسان ها نادیده گرفته اند، به متخصصان داده کمک کنند.
درخت تصمیم: درخت تصمیم را می توان هم برای پیش بینی مقادیر عددی (رگرسیون) و هم برای طبقه بندی داده ها به دسته ها استفاده کرد. درختان تصمیم از یک دنباله انشعاب از تصمیمات مرتبط استفاده می کنند که می تواند با یک نمودار درختی نمایش داده شود. یکی از مزایای درخت تصمیم این است که بر خلاف جعبه سیاه شبکه عصبی، اعتبارسنجی و ممیزی آسان است.
جنگل تصادفی: در جنگل تصادفی، الگوریتم یادگیری ماشین یک مقدار یا دسته را با ترکیب نتایج تعدادی درخت تصمیم پیشبینی میکند.
موارد استفاده از یادگیری ماشین در دنیای واقعی
در اینجا چند نمونه از یادگیری ماشینی وجود دارد که ممکن است هر روز با آنها روبرو شوید:
تشخیص گفتار: با نامهای تشخیص گفتار رایانهای یا گفتار به متن نیز شناخته میشود و قابلیتی است که از پردازش زبان طبیعی برای ترجمه گفتار انسان به قالب نوشتاری استفاده میکند. بسیاری از دستگاههای تلفن همراه برای انجام جستجوی صوتی از تشخیص گفتار در سیستمهای خود استفاده میکنند.
خدمات مشتری: چت رباتهای آنلاین حین مذاکره با مشتری جایگزین عوامل انسانی میشوند و نحوه تفکر ما را در مورد تعامل با مشتری در بین وبسایتها و پلتفرمهای رسانههای اجتماعی تغییر میدهند. رباتهای گفتگو به سؤالات متداول در مورد موضوعاتی مانند حمل و نقل پاسخ میدهند، یا توصیههای شخصی، فروش متقابل محصولات یا اندازههای پیشنهادی را برای کاربران ارائه میدهند.
بینایی رایانه: این فناوری هوش مصنوعی رایانهها را قادر میسازد تا اطلاعات معنیداری را از تصاویر دیجیتال، ویدیوها و سایر ورودیهای بصری به دست آورند و سپس اقدام مناسب را انجام دهند. بینایی کامپیوتر با پشتیبانی از شبکههای عصبی کانولوشنال، کاربردهایی در برچسبگذاری عکس در رسانههای اجتماعی، تصویربرداری رادیولوژی در مراقبتهای بهداشتی و خودروهای خودران در صنعت خودرو دارد.
موتورهای توصیه: با استفاده از دادههای رفتار مصرف گذشته، الگوریتمهای هوش مصنوعی میتوانند به کشف روندهای دادهای که میتوانند برای توسعه استراتژیهای فروش متقابل مورد استفاده قرار گیرند، کمک کنند. این رویکرد توسط خرده فروشان آنلاین برای ارائه توصیه های مربوط به محصول به مشتریان در طول فرآیند پرداخت استفاده می شود.
معاملات خودکار سهام: پلتفرمهای معاملاتی با فرکانس بالا مبتنی بر هوش مصنوعی که برای بهینهسازی سبد سهام طراحی شدهاند، هزاران یا حتی میلیونها معامله را در روز بدون دخالت انسان انجام میدهند.
تشخیص تقلب: بانک ها و سایر موسسات مالی می توانند از یادگیری ماشینی برای شناسایی تراکنش های مشکوک استفاده کنند. یادگیری تحت نظارت می تواند یک مدل را با استفاده از اطلاعات مربوط به تراکنش های جعلی شناخته شده آموزش دهد. تشخیص ناهنجاری میتواند تراکنشهایی را شناسایی کند که غیر معمول به نظر میرسند و مستحق بررسی بیشتر هستند.
چالش های یادگیری ماشینی
همانطور که فناوری یادگیری ماشین توسعه یافته، مطمئناً زندگی ما را آسانتر کرده است. با این حال، پیادهسازی یادگیری ماشینی در مشاغل، نگرانیهای اخلاقی زیادی را در مورد فناوریهای هوش مصنوعی نیز ایجاد کرده است. برخی از این موارد عبارتند از:
تکینگی فناوری:
تکینگی فناوری فرضیهای است که پیشبینی میکند که شتاب در فناوری در نهایت باعث میشود که هوش مصنوعی از هوش بشر پیشی بگیرد و منجر به تغییرات شگرف یا حتی پایان تمدن بشری بشود. چون تواناییهای چنین هوشی ممکن است قابل درک نباشد، اتفاقاتی که بعد از تکینگی فناوری میافتند ممکن است پیشبینیناپذیر باشند.
در حالی که این موضوع توجه عمومی زیادی را به خود جلب می کند، بسیاری از محققان نگران این ایده نیستند که هوش مصنوعی در آینده نزدیک از هوش انسانی پیشی بگیرد. تکینگی تکنولوژیک نیز به عنوان هوش مصنوعی قوی یا ابر هوش نامیده می شود. فیلسوف نیک بوستروم، ابرهوشی را اینگونه تعریف میکند: «هر عقلی که عملاً در هر زمینهای، از جمله خلاقیت علمی، خرد عمومی، و مهارتهای اجتماعی، از بهترین مغزهای انسان بسیار بهتر عمل میکند». علیرغم این واقعیت که ابرهوشی در جامعه قریب الوقوع نیست، ایده آن سوالات جالبی را ایجاد می کند زیرا ما استفاده از سیستم های خودران مانند اتومبیل های خودران را در نظر می گیریم. این غیر واقعی است که فکر کنیم یک ماشین بدون راننده هرگز تصادف نمی کند، اما چه کسی در این شرایط مسئول است؟ آیا هنوز باید وسایل نقلیه خودران توسعه دهیم یا این فناوری را به وسایل نقلیه نیمه خودران که به مردم کمک می کنند با خیال راحت رانندگی کنند محدود می کنیم؟ این ها انواع بحث های اخلاقی هستند که با توسعه فناوری جدید و خلاقانه هوش مصنوعی در حال وقوع هستند.
تاثیر هوش مصنوعی بر مشاغل
در حالی که بسیاری از تصورات عمومی از هوش مصنوعی در مورد از دست دادن شغل متمرکز است، این نگرانی احتمالاً باید دوباره اصلاح شود. با هر فناوری جدید و مخرب، می بینیم که تقاضای بازار برای نقش های شغلی خاص تغییر می کند. به عنوان مثال، وقتی به صنعت خودرو نگاه می کنیم، بسیاری از تولیدکنندگان، مانند جنرال موتورز، روی تولید خودروهای الکتریکی تمرکز می کنند تا با ابتکارات سبز هماهنگ شوند. صنعت انرژی از بین نمی رود، اما منبع انرژی در حال تغییر از مصرف سوخت به برق است.
به همین ترتیب، هوش مصنوعی تقاضا برای مشاغل را به مناطق دیگر منتقل می کند. باید افرادی وجود داشته باشند که به مدیریت سیستم های هوش مصنوعی کمک کنند. هنوز هم باید افرادی وجود داشته باشند که مشکلات پیچیده تری را در صنایعی که به احتمال زیاد تحت تأثیر تغییرات تقاضای شغلی قرار می گیرند، مانند خدمات مشتری، حل کنند. بزرگترین چالش هوش مصنوعی و تأثیر آن بر بازار کار، کمک به افراد برای انتقال به نقشهای جدید مورد تقاضا خواهد بود.
حریم خصوصی
داده هایی که افراد به اجبار در اختیار سازمان ها، ادارات، وب سایت ها و … قرار می دهند، همواره موجب نگرانی آنها است. این اطلاعات چگونه جمع آوری می شوند؟ توسط چه افرادی و با چه اهدافی مورد پردازش قرار می گیرند؟ آیا اطلاعات در اختیار افراد دیگری هم قرار می گیرد؟ ذخیره سازی این اطلاعات در چه مکانی و با چه سطحی از امنیت انجام شده است؟
با توجه به دغدغه های مذکور، سرمایهگذاری در امنیت به یک اولویت فزاینده برای کسبوکارها تبدیل شده است، زیرا آنها به دنبال حذف هرگونه آسیبپذیری و فرصتهایی برای نظارت، هک و حملات سایبری هستند.
تعصب و تبعیض
گزارش مواردی از تعصب و تبعیض در تعدادی از سیستم های یادگیری ماشینی، سوالات اخلاقی زیادی را در مورد استفاده از هوش مصنوعی ایجاد کرده است. البته این موضوع بصورت کاملا مغرضانه توسط فرآیندهای انسانی بوجود می آید. به عنوان مثال آمازون در تلاش خود برای خودکارسازی و سادهسازی یک فرآیند، ناخواسته بین نامزدهای شغلی بر اساس جنسیت برای نقشهای فنی تبعیض قائل شد و این شرکت در نهایت مجبور شد پروژه را کنار بگذارد. تعصب و تبعیض به عملکرد منابع انسانی نیز محدود نمی شود. آنها را می توان در تعدادی از برنامه های کاربردی از نرم افزار تشخیص چهره گرفته تا الگوریتم های رسانه های اجتماعی یافت.
مسئوليت
از آنجایی که قانون قابل توجهی برای تنظیم شیوه های هوش مصنوعی وجود ندارد، هیچ مکانیسم اجرایی واقعی برای اطمینان از اجرای هوش مصنوعی اخلاقی وجود ندارد. انگیزههای فعلی برای پایندی شرکت ها به اخلاق مداری، پیامدهای منفی یک سیستم هوش مصنوعی غیراخلاقی است.
دوره آموزش کاربردهای هوش مصنوعی در زندگی روزمره
تهیه کننده: مهدی کوهستانی
مدیر اجرایی آموزش و مدیر دپارتمان فناوری اطلاعات و ارتباطات
لطفا جهت مشاهده برنامه کلاس های آموزش Machine Learning اینجا کلیک کنید.
لطفا جهت مشاهده لیست کامل دوره های آموزش برنامه نویسی اینجا کلیک کنید.
مجتمع فنی تهران - نمایندگی گیلان میگوید:
علیرضا نجفی خواه میگوید:
آرزو رضایی فر میگوید: