Posted: Sat Oct 17, 2020 1:20 pm Post subject: Data Science for Business what you need to know about data
What you need to know about data mining and Data-Analytic thinking
فصل دوم:
یادگیری فرآیند در داده کاوی بسیار مهم است وقتی فرآیند process را یاد می گیری دیگر نیازی به راه حل های ابتکاری و افراد نخبه برای بدست آوردن مفهوم خاصی ندارید.
هر مساله ای که برمبنای داده است راه حل خودش را برای کسب و کار مربوطه می طلبد.
یکی از مهارت های مهم شکستن مساله به زیرمساله هایی است که قبلا راه حلی یا ابزاری برای حل آنها وجود دارد و زمان و انرژی نیروی انسانی را در قسمت هایی استفاده کنیم که پیچیدگی بیشتر و خاصتر هستند.
تفاوت بین رگرسیون و کلاس بندی در این است که در رگرسیون یک مقدار عددی را پیش بینی می کند و در کلاس بندی عضویت یک کلاس بودن یا نبودن را چک می کنیم. در واقع در رگرسیون چک می کنیم که چه مقدار یک متغیر برای نمونه وجود دارد.
مساله co occurence تفاوت ریزی با خوشه بندی دارد در خوشه بندی ما به تشابه بین خصایص اشیا پی می بریم در حالیکه در co occurence تشابه اشیا بایکدیگر در یک تراکنش را ملاحظه می کنیم. مثل سبد خرید که در هنگام خرید پیشنهاد خرید کالای دیگری را بدهیم.
پروفایلینگ معمولا برای تشخیص تقلب نیز به کار می رود انجا که متوجه می شوی نمونه های مشابه از الگوی دیگری استفاده کرده اند.
تفاوت یادگیری نظارتی و غیرنظارتی در این است که در یادگری غیرنظارتی به ما می گویند این نمونه ها را از هم جدا کنید اما در نظارتی می گویند این داده ها را بر مبنای این شرایطی که ما میگوییم از هم جدا کنید.
خوشه بندی یک روش غیرنظارتی است درتس است که بر اساس تشابهات گروه بندی را انجام می دهد اما هیچ ضمانتی بر معنادار بودن این تفکیک وجود ندارد .
نکته دیگر اینکه در یادگیری نظارتی حتما هدف جزو یکی از خصایص داده های ما می باشد.
کلاس بندی، رگرسیون و مدلینگ علی توسط روش های نظارتی حل می شوند. تشابهات، پیش بینی لینک و کاهش ابعاد نیز نظارتی هستند. خوشه بندی، گروه بندی وقوع همگام و پروفایل کردن روش های غیرنظارتی هستند.
یادتان باشد که ای از داده کاوی دارید برای پیدا کردن یک الگو یا ساخت یک مدل استفاده می کنید . یا خیر قرار است از نتایج ان صرفا استفاده کنید! . اگر حالت اول است باید در پروسه خود داده کاوی این نتایج را بگنجانید در حالیکه در روش دوم چنین چیزی لازم نیست.
داده کاوی تمرکزش بر جستجوی دانش الگو و قوانین از روی داده به صورت خودکار می باشد.
You cannot post new topics in this forum You cannot reply to topics in this forum You cannot edit your posts in this forum You cannot delete your posts in this forum You cannot vote in polls in this forum