فراگیری ماشین
- بهدست: Admingfars
- دستهبندی: آموزش و هوش مصنوعی, اخبار ایران تکنولوژی, برنامه نویسی
یادگیری ماشینی رشته تحصیلی است که به کامپیوترها توانایی یادگیری بدون برنامه ریزی صریح را می دهد. ML یکی از هیجانانگیزترین فناوریهایی است که تا به حال با آن مواجه شدهایم. همانطور که از نام آن مشخص است، به کامپیوتری می دهد که آن را بیشتر به انسان شبیه می کند: توانایی یادگیری . امروزه یادگیری ماشینی به طور فعال مورد استفاده قرار می گیرد، شاید در مکان های بسیار بیشتری از آنچه انتظار می رود
یادگیری ماشین برای هر تحلیلگر داده و دانشمند داده مشتاق و همچنین برای کسانی که می خواهند حجم عظیمی از داده های خام را به روندها و پیش بینی ها تبدیل کنند، یک مهارت ضروری است. این مهارت را امروز با بنیاد یادگیری ماشینی – دوره خود گامی که توسط متخصصان صنعت که سالها در ML و پروژه های مبتنی بر صنعت تخصص دارند، طراحی و مدیریت کنید، بیاموزید
انواع مشکلات یادگیری ماشین
روش های مختلفی برای طبقه بندی مشکلات یادگیری ماشین وجود دارد. در اینجا، ما واضح ترین آنها را مورد بحث قرار می دهیم.
1. بر اساس ماهیت “سیگنال” یا “بازخورد” یادگیری موجود برای یک سیستم یادگیری
- یادگیری نظارت شده : رایانه با ورودیهای نمونه و خروجیهای مورد نظر آنها توسط «معلم» ارائه میشود و هدف یادگیری یک قانون کلی است که ورودیها را به خروجیها ترسیم میکند. روند آموزش تا زمانی ادامه می یابد که مدل به سطح مطلوبی از دقت در داده های آموزشی دست یابد. برخی از نمونه های واقعی عبارتند از:
- طبقه بندی تصویر: شما با تصاویر/برچسب ها تمرین می کنید. سپس در آینده یک تصویر جدید ارائه می دهید و انتظار دارید که کامپیوتر شی جدید را تشخیص دهد.
- پیشبینی بازار/رگرسیون: کامپیوتر را با دادههای تاریخی بازار آموزش میدهید و از رایانه میخواهید که قیمت جدید را در آینده پیشبینی کند.
- یادگیری بدون نظارت : هیچ برچسبی به الگوریتم یادگیری داده نمی شود و آن را به تنهایی برای یافتن ساختار در ورودی خود رها می کند. برای خوشه بندی جمعیت در گروه های مختلف استفاده می شود. یادگیری بدون نظارت می تواند به خودی خود یک هدف باشد (کشف الگوهای پنهان در داده ها).
- خوشه بندی: شما از کامپیوتر می خواهید که داده های مشابه را به خوشه ها تفکیک کند، این در تحقیق و علم ضروری است.
- تصویرسازی با ابعاد بالا: از رایانه برای کمک به تجسم داده های با ابعاد بالا استفاده کنید.
- مدلهای مولد: پس از اینکه یک مدل توزیع احتمال دادههای ورودی شما را ثبت کرد، میتواند دادههای بیشتری تولید کند. این می تواند برای قوی تر کردن طبقه بندی کننده شما بسیار مفید باشد.
یک نمودار ساده که مفهوم یادگیری نظارت شده و بدون نظارت را پاک می کند در زیر نشان داده شده است:
:
همانطور که به وضوح می بینید، داده ها در یادگیری نظارت شده برچسب گذاری شده اند، در حالی که داده های یادگیری بدون نظارت بدون برچسب هستند.
- یادگیری نیمه نظارتی : مشکلاتی که در آنها مقدار زیادی داده ورودی دارید و فقط برخی از داده ها برچسب گذاری می شوند، مسائل یادگیری نیمه نظارت شده نامیده می شوند. این مشکلات بین یادگیری تحت نظارت و بدون نظارت قرار می گیرند. به عنوان مثال، یک آرشیو عکس که در آن فقط برخی از تصاویر برچسب گذاری شده اند (به عنوان مثال سگ، گربه، شخص) و اکثریت بدون برچسب هستند.
- یادگیری تقویتی : یک برنامه کامپیوتری با یک محیط پویا تعامل دارد که در آن باید هدف خاصی را انجام دهد (مانند رانندگی وسیله نقلیه یا انجام یک بازی در برابر حریف). این برنامه بازخوردهایی را از نظر پاداش و تنبیه ارائه می کند که در فضای مشکل خود حرکت می کند.
2. بر اساس “خروجی” مورد نظر از یک سیستم یادگیری ماشینی
- طبقهبندی : ورودیها به دو یا چند کلاس تقسیم میشوند و یادگیرنده باید مدلی تولید کند که ورودیهای دیده نشده را به یک یا چند (طبقهبندی چند برچسبی) از این کلاسها اختصاص دهد. این معمولاً به روشی نظارت شده حل می شود. فیلتر کردن هرزنامه نمونهای از طبقهبندی است، که در آن ورودیها پیامهای ایمیل (یا دیگر) و کلاسها «هرزنامه» و «نه هرزنامه» هستند.
- رگرسیون : همچنین یک مشکل یادگیری نظارت شده است، اما خروجی ها به جای گسسته پیوسته هستند. به عنوان مثال، پیش بینی قیمت سهام با استفاده از داده های تاریخی.
نمونه ای از طبقه بندی و رگرسیون در دو مجموعه داده مختلف در زیر نشان داده شده است:
-
- خوشه بندی : در اینجا مجموعه ای از ورودی ها به گروه ها تقسیم می شوند. برخلاف طبقهبندی، گروهها از قبل شناخته نشدهاند، و این امر معمولاً یک کار بدون نظارت است.
همانطور که در مثال زیر می بینید، نقاط داده داده شده به گروه هایی تقسیم شده اند که با رنگ های قرمز، سبز و آبی قابل شناسایی هستند.
- خوشه بندی : در اینجا مجموعه ای از ورودی ها به گروه ها تقسیم می شوند. برخلاف طبقهبندی، گروهها از قبل شناخته نشدهاند، و این امر معمولاً یک کار بدون نظارت است.
- تخمین چگالی : وظیفه یافتن توزیع ورودی ها در فضایی است.
- کاهش ابعاد : ورودی ها را با نگاشت آنها در فضایی با ابعاد کمتر ساده می کند. مدلسازی موضوع یک مشکل مرتبط است، جایی که به یک برنامه فهرستی از اسناد زبان انسانی داده میشود و وظیفه دارد بفهمد کدام اسناد موضوعات مشابه را پوشش میدهند.
بر اساس این وظایف/مشکلات یادگیری ماشین، تعدادی الگوریتم داریم که برای انجام این کارها استفاده می شود. برخی از الگوریتمهای رایج یادگیری ماشین عبارتند از: رگرسیون خطی، رگرسیون لجستیک، درخت تصمیم، SVM (ماشینهای بردار پشتیبانی)، Naive Bayes، KNN (K نزدیکترین همسایگان)، K-Means، جنگل تصادفی و غیره.
توجه: تمامی این الگوریتم ها در مقالات بعدی پوشش داده خواهند شد.
اصطلاحات یادگیری ماشینی
- مدل
A یک نمایش خاص است که از داده ها با اعمال برخی از الگوریتم های یادگیری ماشین یاد می شود. به یک مدل، فرضیه نیز می گویند . - ویژگی
یک ویژگی یک ویژگی قابل اندازه گیری فردی از داده های ما است. مجموعه ای از ویژگی های عددی را می توان به راحتی با یک بردار ویژگی توصیف کرد . بردارهای ویژگی به عنوان ورودی به مدل تغذیه می شوند. به عنوان مثال، برای پیشبینی یک میوه، ممکن است ویژگیهایی مانند رنگ، بو، طعم و غیره وجود داشته باشد.
توجه: انتخاب ویژگیهای آموزنده، متمایز و مستقل گامی حیاتی برای الگوریتمهای مؤثر است. ما معمولاً از یک استخراج کننده ویژگی برای استخراج ویژگی های مربوطه از داده های خام استفاده می کنیم. - Target (Label)
یک متغیر یا برچسب هدف، مقداری است که باید توسط مدل ما پیشبینی شود. برای مثال میوه مورد بحث در بخش ویژگی ها، برچسب با هر مجموعه ورودی نام میوه مانند سیب، پرتقال، موز و غیره خواهد بود. - آموزش
ایده ارائه مجموعهای از ورودیها (ویژگیها) و خروجیهای مورد انتظار (برچسبها) است، بنابراین پس از آموزش، ما یک مدل (فرضیه) خواهیم داشت که سپس دادههای جدید را به یکی از دستههای آموزشدیده ترسیم میکند. - پیشبینی
هنگامی که مدل ما آماده شد، میتوان مجموعهای از ورودیها را به آن وارد کرد که خروجی (برچسب) پیشبینیشدهای را به آن ارائه میدهد.
شکل زیر مفاهیم فوق را پاک می کند:
منابع:
- https://en.wikipedia.org/wiki/Machine_learning
- https://leonardoaraujosantos.gitbooks.io/artificial-intelligence/
- http://machinelearningmastery.com/data-terminology-in-machine-learning/
مقالات مرتبط:
منابع:
بدون دیدگاه