فراگیری ماشین

یادگیری ماشینی
آموزش و هوش مصنوعی

یادگیری ماشینی رشته تحصیلی است که به کامپیوترها توانایی یادگیری بدون برنامه ریزی صریح را می دهد. ML یکی از هیجان‌انگیزترین فناوری‌هایی است که تا به حال با آن مواجه شده‌ایم. همانطور که از نام آن مشخص است، به کامپیوتری می دهد که آن را بیشتر به انسان شبیه می کند: توانایی یادگیری . امروزه یادگیری ماشینی به طور فعال مورد استفاده قرار می گیرد، شاید در مکان های بسیار بیشتری از آنچه انتظار می رود

یادگیری ماشین برای هر تحلیلگر داده و دانشمند داده مشتاق و همچنین برای کسانی که می خواهند حجم عظیمی از داده های خام را به روندها و پیش بینی ها تبدیل کنند، یک مهارت ضروری است. این مهارت را امروز با بنیاد یادگیری ماشینی – دوره خود گامی که توسط متخصصان صنعت که سالها در ML و پروژه های مبتنی بر صنعت تخصص دارند، طراحی و مدیریت کنید، بیاموزید

انواع مشکلات یادگیری ماشین

روش های مختلفی برای طبقه بندی مشکلات یادگیری ماشین وجود دارد. در اینجا، ما واضح ترین آنها را مورد بحث قرار می دهیم.
1. بر اساس ماهیت “سیگنال” یا “بازخورد” یادگیری موجود برای یک سیستم یادگیری

  • یادگیری نظارت شده : رایانه با ورودی‌های نمونه و خروجی‌های مورد نظر آن‌ها توسط «معلم» ارائه می‌شود و هدف یادگیری یک قانون کلی است که ورودی‌ها را به خروجی‌ها ترسیم می‌کند. روند آموزش تا زمانی ادامه می یابد که مدل به سطح مطلوبی از دقت در داده های آموزشی دست یابد. برخی از نمونه های واقعی عبارتند از:
    • طبقه بندی تصویر: شما با تصاویر/برچسب ها تمرین می کنید. سپس در آینده یک تصویر جدید ارائه می دهید و انتظار دارید که کامپیوتر شی جدید را تشخیص دهد.
    • پیش‌بینی بازار/رگرسیون: کامپیوتر را با داده‌های تاریخی بازار آموزش می‌دهید و از رایانه می‌خواهید که قیمت جدید را در آینده پیش‌بینی کند.
  • یادگیری بدون نظارت : هیچ برچسبی به الگوریتم یادگیری داده نمی شود و آن را به تنهایی برای یافتن ساختار در ورودی خود رها می کند. برای خوشه بندی جمعیت در گروه های مختلف استفاده می شود. یادگیری بدون نظارت می تواند به خودی خود یک هدف باشد (کشف الگوهای پنهان در داده ها).
    • خوشه بندی: شما از کامپیوتر می خواهید که داده های مشابه را به خوشه ها تفکیک کند، این در تحقیق و علم ضروری است.
    • تصویرسازی با ابعاد بالا: از رایانه برای کمک به تجسم داده های با ابعاد بالا استفاده کنید.
    • مدل‌های مولد: پس از اینکه یک مدل توزیع احتمال داده‌های ورودی شما را ثبت کرد، می‌تواند داده‌های بیشتری تولید کند. این می تواند برای قوی تر کردن طبقه بندی کننده شما بسیار مفید باشد.

یک نمودار ساده که مفهوم یادگیری نظارت شده و بدون نظارت را پاک می کند در زیر نشان داده شده است:

:

همانطور که به وضوح می بینید، داده ها در یادگیری نظارت شده برچسب گذاری شده اند، در حالی که داده های یادگیری بدون نظارت بدون برچسب هستند.

  • یادگیری نیمه نظارتی : مشکلاتی که در آنها مقدار زیادی داده ورودی دارید و فقط برخی از داده ها برچسب گذاری می شوند، مسائل یادگیری نیمه نظارت شده نامیده می شوند. این مشکلات بین یادگیری تحت نظارت و بدون نظارت قرار می گیرند. به عنوان مثال، یک آرشیو عکس که در آن فقط برخی از تصاویر برچسب گذاری شده اند (به عنوان مثال سگ، گربه، شخص) و اکثریت بدون برچسب هستند.
  • یادگیری تقویتی : یک برنامه کامپیوتری با یک محیط پویا تعامل دارد که در آن باید هدف خاصی را انجام دهد (مانند رانندگی وسیله نقلیه یا انجام یک بازی در برابر حریف). این برنامه بازخوردهایی را از نظر پاداش و تنبیه ارائه می کند که در فضای مشکل خود حرکت می کند.


2. بر اساس “خروجی” مورد نظر از یک سیستم یادگیری ماشینی

  • طبقه‌بندی : ورودی‌ها به دو یا چند کلاس تقسیم می‌شوند و یادگیرنده باید مدلی تولید کند که ورودی‌های دیده نشده را به یک یا چند (طبقه‌بندی چند برچسبی) از این کلاس‌ها اختصاص دهد. این معمولاً به روشی نظارت شده حل می شود. فیلتر کردن هرزنامه نمونه‌ای از طبقه‌بندی است، که در آن ورودی‌ها پیام‌های ایمیل (یا دیگر) و کلاس‌ها «هرزنامه» و «نه هرزنامه» هستند.
  • رگرسیون : همچنین یک مشکل یادگیری نظارت شده است، اما خروجی ها به جای گسسته پیوسته هستند. به عنوان مثال، پیش بینی قیمت سهام با استفاده از داده های تاریخی.

نمونه ای از طبقه بندی و رگرسیون در دو مجموعه داده مختلف در زیر نشان داده شده است:

    • خوشه بندی : در اینجا مجموعه ای از ورودی ها به گروه ها تقسیم می شوند. برخلاف طبقه‌بندی، گروه‌ها از قبل شناخته نشده‌اند، و این امر معمولاً یک کار بدون نظارت است.
      همانطور که در مثال زیر می بینید، نقاط داده داده شده به گروه هایی تقسیم شده اند که با رنگ های قرمز، سبز و آبی قابل شناسایی هستند.

  • تخمین چگالی : وظیفه یافتن توزیع ورودی ها در فضایی است.
  • کاهش ابعاد : ورودی ها را با نگاشت آنها در فضایی با ابعاد کمتر ساده می کند. مدل‌سازی موضوع یک مشکل مرتبط است، جایی که به یک برنامه فهرستی از اسناد زبان انسانی داده می‌شود و وظیفه دارد بفهمد کدام اسناد موضوعات مشابه را پوشش می‌دهند.

بر اساس این وظایف/مشکلات یادگیری ماشین، تعدادی الگوریتم داریم که برای انجام این کارها استفاده می شود. برخی از الگوریتم‌های رایج یادگیری ماشین عبارتند از: رگرسیون خطی، رگرسیون لجستیک، درخت تصمیم، SVM (ماشین‌های بردار پشتیبانی)، Naive Bayes، KNN (K نزدیکترین همسایگان)، K-Means، جنگل تصادفی و غیره.

توجه: تمامی این الگوریتم ها در مقالات بعدی پوشش داده خواهند شد.

اصطلاحات یادگیری ماشینی

  • مدل
    A یک نمایش خاص است که از داده ها با اعمال برخی از الگوریتم های یادگیری ماشین یاد می شود. به یک مدل، فرضیه نیز می گویند .
  • ویژگی
    یک ویژگی یک ویژگی قابل اندازه گیری فردی از داده های ما است. مجموعه ای از ویژگی های عددی را می توان به راحتی با یک بردار ویژگی توصیف کرد . بردارهای ویژگی به عنوان ورودی به مدل تغذیه می شوند. به عنوان مثال، برای پیش‌بینی یک میوه، ممکن است ویژگی‌هایی مانند رنگ، بو، طعم و غیره وجود داشته باشد.
    توجه: انتخاب ویژگی‌های آموزنده، متمایز و مستقل گامی حیاتی برای الگوریتم‌های مؤثر است. ما معمولاً از یک استخراج کننده ویژگی برای استخراج ویژگی های مربوطه از داده های خام استفاده می کنیم.
  • Target (Label)
    یک متغیر یا برچسب هدف، مقداری است که باید توسط مدل ما پیش‌بینی شود. برای مثال میوه مورد بحث در بخش ویژگی ها، برچسب با هر مجموعه ورودی نام میوه مانند سیب، پرتقال، موز و غیره خواهد بود.
  • آموزش
    ایده ارائه مجموعه‌ای از ورودی‌ها (ویژگی‌ها) و خروجی‌های مورد انتظار (برچسب‌ها) است، بنابراین پس از آموزش، ما یک مدل (فرضیه) خواهیم داشت که سپس داده‌های جدید را به یکی از دسته‌های آموزش‌دیده ترسیم می‌کند.
  • پیش‌بینی
    هنگامی که مدل ما آماده شد، می‌توان مجموعه‌ای از ورودی‌ها را به آن وارد کرد که خروجی (برچسب) پیش‌بینی‌شده‌ای را به آن ارائه می‌دهد.

شکل زیر مفاهیم فوق را پاک می کند:

 

منابع:

مقالات مرتبط:

منابع:

بدون دیدگاه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.

برنامه نویسی
آموزش الگوریتم دیکسترا کوتاهترین مسیر

در این مقاله قصد داریم درمورد الگوریتم دیکسترا کوتاهترین مسیر صحبت کنیم و این الگوریتم را به صورت گام به گام توضیح داده و همراه با رسم شکل مراحل آن را بررسی کنیم. پس اگر علاقمند به یادگیری این الگوریتم هستید در ادامه با ما همراه باشید.

اخبار ایران تکنولوژی
۷ الگوریتم که هر برنامه نویسی باید بداند

ما چند الگوریتم مرتب سازی در این لیست داریم و Merge Sort یکی از مهمترین الگوریتم‌ها است. این یک الگوریتم مرتب سازی کارآمد بر اساس تکنیک برنامه نویسی تقسیم و تسخیر است.

آموزش و هوش مصنوعی
تکنیک های طراحی الگوریتم

الگوریتم روشی است برای حل یک مسئله خاص در تعداد محدودی از مراحل برای ورودی با اندازه محدود. 
الگوریتم ها را می توان به روش های مختلفی طبقه بندی کرد. آن ها هستند: