ParsX.com
پذیرش پروژه از دانشجویی ... تا سازمانی 09376225339
 
   ProfileProfile   Log in to check your private messagesLog in to check your private messages  |  FAQFAQ   SearchSearch   MemberlistMemberlist   UsergroupsUsergroups Log inLog in   RegisterRegister 

Data Warehouse Modeling: Data Cube and OLAP

 
Post new topic   Reply to topic    ParsX.com Forum Index -> داده کاوی اطلاعات
View previous topic :: View next topic  
Author Message
vahid
بي تو هرگز


Joined: 26 Nov 2004
Posts: 2973
Location: Tehran

PostPosted: Sat Mar 10, 2012 10:37 am    Post subject: Data Warehouse Modeling: Data Cube and OLAP Reply with quote

Data Cube: A multidimensional Data Model
دیتا کیوب یا مکعب داده چیست ؟ یک مکعب داده اجازه می دهد که داده را در ابعاد مختلفی مدل کنید. این ابعاد به نحوه نگرش شما در سیستم بستگی دارد . مثلا برای یک سیستم فروش شما ابعاد را زمان، آیتم، شاخه و مکان می توانید در نظر بگیرید. این ابعاد اجازه می دهد که فروش ماهانه اقلام یا شاخه ها یا مکانهایی که فروش اتفاق افتاده است را ردگیری نمایید .هر بعد ممکن است یک جدول داشته باشد که به ان جدول بعد یا dimension table می گویند . مثلا یک جدول بعد برای item می تواند خصایصی چون نام، برند، نوع داشته باشد. این جدول ابعاد می تواند توسط کاربران و خبرگان یا تو سط سیستم بصورت خودکار تولید شود .
Facts مقادیر عددی هستند که می توان راجع به انها اینطو رفکر کرد که در یک سیستم فروش فکت ها دلارهای فروخته شده ، تعداد اقلام فروخته شده، مقدار بودجه شده هستند. جدول fact شامل نام فکت ها یا اندازه انها می باشد.
Back to top
vahid
بي تو هرگز


Joined: 26 Nov 2004
Posts: 2973
Location: Tehran

PostPosted: Sat Mar 10, 2012 11:17 am    Post subject: Stars, Snowflakes, and Fact Constellations: Schemas Reply with quote

Star scheme : این مدل به این صورت است که انباره داده شامل یک جدول مرکزی fact table حاولی حجم زیادی داده بدون افزونگی می باشد و سپس یک مجوعه جداول دیگر دور ان هستند که به انها dimension table گویند که برای هر بعد یک جدول داریم . مثلا برای فروش sales دارای 4 جدول Time, item, branch, location و یک جدول fact به نام Sales داریم که به این 4 جدول متصل است . جدول fact دارای 4کلید خارجی است که از این 4 جدول دیگر وارد می شود و شامل dollars_sold و units_sold می باشد.
Snowflake schema : از همان مدل ستاره ای می باشد منتهی جدول ابعاد نورمال شده هستند. یعنی احتمال دارد زیرجداولی داشته باشند.
galaxy schema or a fact constellation اگر نیاز داشته باشیم که بیش از یک جدول Fact داشته باشیم از این روش استفاده می کنیم.
معمولا دو روش star و snowflake برای data mart ها به کار می رود
Back to top
vahid
بي تو هرگز


Joined: 26 Nov 2004
Posts: 2973
Location: Tehran

PostPosted: Sat Mar 10, 2012 12:06 pm    Post subject: Measures: Their Categorization and Computation Reply with quote

Measure ها چگونه محاسبه می شوند . برای پاسخ این سوال ابتدا باید دید این measure معیارها را چگونه دسته بندی می کنند ؟
معیارها به سه گروه دسته بندی می شوند distributive, algebraic, hodistic
Distributive : یک تابع تجمعی توزیعی است اگر به روش توزیعی زیر محاسبه شود . فرض کنید داده شما به n دسته قسمت بندی شده است . ما تابع را به هر پارتیشن اعمال می کنیم و n عدد نتیجه می دهد . اگر نتیجه حاصل شده روی n مقدار با نتیجه حاصل روی کل مجموعه داده یکی بود تابع به روش توزیعی می تواند محاسبه شود مثلا sum را یم توان روی چند زیرمکعب اعمال کرد سپس جمع انها را محاسبه کرد تا به حاصلجمع Cube رسید.
Count, min و max توابع توزیعی جمعی هستند.
Algebric : توابع تجمعی جبری از روی توابع توزیعی بدست می ایند مثلا avg از Sum/count محاسبه می شود یا min_N() یعنی nامین کمینه را محاسبه می کند . این توابع ارگومان های عددی می پذیرند .
Holistic : تابع تجمعی holistic است مثل median , mode , rank
Back to top
vahid
بي تو هرگز


Joined: 26 Nov 2004
Posts: 2973
Location: Tehran

PostPosted: Sun Mar 11, 2012 9:00 am    Post subject: Reply with quote

Dimensions: The Role of Concept Hierarchies
مفهوم سلسله مراتب را با مثالی برای بعد شهر در مثال ما نظر می گیریم . وقتی تعدادی شهر داشته باشیم این شهر ها در مفهوم بالاتر به استان ها و سپس به کشورهای مختلف می رسند.
Back to top
vahid
بي تو هرگز


Joined: 26 Nov 2004
Posts: 2973
Location: Tehran

PostPosted: Sun Mar 11, 2012 9:08 am    Post subject: Reply with quote

OLAP Operations
در مدل چند بعدی ، داده ها در چندین بعد سازماندهی شده اند ، هر بعدی شامل چند مرحله انتزاع مشخص شده از مفهوم سلسله مراتب است . این سازماندهی برای کاربران انعطاف پذیری را برای مشاهده داده ها در منظرهای گوناگون فراهم می اورد.
فعالیت های OLAP بگذارید به چند نمونه از فعالیت های OLAP برای داده چند بعدی بنگریم.
Roll-up : این عمل که drill-up هم نامیده می شود عملیات تجمع روی مکعب داده را انجام می دهد . یعنی مثلا اگر یکی از ابعاد ما شهرهای کشورهای مختلف بود می توانیم ان بعد را به بعد کشور کاهش دهیم یعنی جای مثلا 50 فیلد شهر به 5 فیلد کشور کاهش دهیم .
pivot : که rotate نیز گفته می شود یک نمایش از عملیاتی است که داده را روی محور می چرخاند تا یک نمای دیگری از نمایش داده داشته باشیم مثلا اگر یک slice را که روی مکان و ایتم است برگردانیم یعنی اگر مکان روی محور y بود روی x بگذاریم وایتم را نیز همین طور در واقع یک pivot یا rotate ایجاد کرده ایم.
Drill-down : که برخلاف Roll-up میباشد مثل این است که شما اطلاعات را بر اساس فصل داشته باشید حال با انجام این عمل ان را به ماه های سال تفکیک می کنیم.
slice and dice : عملیات slice برای انتخاب ابعادی از مکعب می باشد که در نتیجه یک Subcube را می دهد. به عبارت دیگر وقتی شرط می گذاریم برای ابعاد که مثلا محصولاتی که قرمز و زرد هستند عملا یک زیر مکعب هستند. این مفهوم slice است حالا اگر این شرط را روی چند بعد مختلف انجام دهیم یعنی مکان تولید و جنس تولید انگاه این مفهوم می شود dice

تفاوت سیستم های OLAP و دیتابیس های اماری:
خیلی از خصایص سیستم مOLAP مثل استفاده از چند بعد برای مدل کردن داده و سلسله مراتب مفاهیم ، ارتباط اندازه ها به ابعاد و مفاهیم roll-up و drill-down را در دیتابیس های آماری SDB نیز وجود دارد.
یک دیتابیس اماری یک دیتابیس سیستم است که برای پشتیبانی از برنامه های اماری طراحی شده است . شباهت این دو سیستم در لغات انهاست.
اما تفاوت OLAP و SDB این است که در SDB تمرکز روی برنامه های کاربردی اقتصادی اجتماعی است و OLAP برای برنامه های کسب و کار می باشد.
Back to top
Display posts from previous:   
Post new topic   Reply to topic    ParsX.com Forum Index -> داده کاوی اطلاعات All times are GMT + 3.5 Hours
Page 1 of 1

 
Jump to:  
You cannot post new topics in this forum
You cannot reply to topics in this forum
You cannot edit your posts in this forum
You cannot delete your posts in this forum
You cannot vote in polls in this forum