ParsX.com
پذیرش پروژه از دانشجویی ... تا سازمانی 09376225339
 
   ProfileProfile   Log in to check your private messagesLog in to check your private messages  |  FAQFAQ   SearchSearch   MemberlistMemberlist   UsergroupsUsergroups Log inLog in   RegisterRegister 

انتروپی شانون

 
Post new topic   Reply to topic    ParsX.com Forum Index -> بازشناسی اماری الگو
View previous topic :: View next topic  
Author Message
vahid
بي تو هرگز


Joined: 26 Nov 2004
Posts: 3067
Location: Tehran

PostPosted: Sun Jul 03, 2016 11:28 am    Post subject: انتروپی شانون Reply with quote

محاسبه انتروپی در داده کاوری
تئوری اطلاعات یکی از اساسی ترین مباحث در علوم کامپیوتر آمار و داده کاوی می باشد.
در این جا سعی من در این است که شما با روشی کاربردی مفهوم انتروپی را درک کنید:
۱. مقدمه ای بر مبحث تئوری اطلاعات
۲. پیاده سازی این مفهوم بااستفاده از php و sql
۳. استفاده از این کلاس ها برای کاوش اطلاعات وب
این راهنما یک نمونه ارتباط کاربردی بین تئوری اطلاعات و تئوری پایگاه داده ها نیز می باشد.
Back to top
vahid
بي تو هرگز


Joined: 26 Nov 2004
Posts: 3067
Location: Tehran

PostPosted: Sun Jul 03, 2016 11:32 am    Post subject: انتروپی تک متغیره و دو متغیره Reply with quote

در این مقاله هدف استفاده از انتروپی برای خلاصه کردن دیتالاگ صفحات وب می باشد. شما یاد می گیرید که چگونه انتروپی یک ستون از پایگاه داده ها را محاسبه کنید(تک متغیره) و اعداد نتیجه انتروپی نمایانگر چیست. در واقع هدف این است که با درک این مفهوم مسائل پیچیده تری که چند متغیره و دو متغیره می باشند را درک کنیم .
Back to top
vahid
بي تو هرگز


Joined: 26 Nov 2004
Posts: 3067
Location: Tehran

PostPosted: Sun Jul 03, 2016 11:33 am    Post subject: Reply with quote

http://www.onlamp.com/pub/a/php/2005/01/06/entropy.html?page=1
Back to top
vahid
بي تو هرگز


Joined: 26 Nov 2004
Posts: 3067
Location: Tehran

PostPosted: Sun Jul 03, 2016 11:41 am    Post subject: متغیرهای تصادفی گسسته Reply with quote

یک پایگاه داده تعداد زیادی متغیر گسسته تصادفی دارد:
ستون fname از جدول members
ستون product ID از جدول Transactions
ستون folder Id از جدول Files
ستون Ip address از جدول WebStats
ستون webpage ID از جدول Webstats
مقادیری که در هر یک از ستون های بالا ذکر شد می تواند اعداد گروه ها و متونی باشد که مجموعه ای از مقادیر متغیرهای تصادفی گسسته می باشند. چرا این متغیرهای تصادفی گسسته را باید در نظر بگیریم؟ توزیع مقادیر این ستون ها را می توانیم با یک تولیدکننده عدد گسسته مثل یک چندجمله ای که بصورت مناسبی پارامتربنده شده است بدست اورد.
Back to top
vahid
بي تو هرگز


Joined: 26 Nov 2004
Posts: 3067
Location: Tehran

PostPosted: Sun Jul 03, 2016 11:53 am    Post subject: تعریف ریاضیاتی اطلاعات Reply with quote

تئوریسین های اطلاعات مفهوم یک متغیر تصادفی گسسته را با یک سیگنال دارای نویز یکی می دانند. با این معادله می توانیم چنین فرض کنیم که ستون های دیتابیس بعنوان منبع یک سیگنال نویزی که حالت های گسسته سیگنال را تولید می کند یکی دانست.
محتوی اطلاعات حالات یک سیگنال منفی لگاریتم حالت احتمال ان می باشد :
I(p(s)) = -log(p(s))

به یاد داشته باشید که ارزش های تابع احتمال همیشه بین ۰ تا ۱ می باشد. لگاریتم این بازه عددی همیشه منفی می باشد. log2(0.5) = -1
حاصلضرب این لگاریتم در عدد ۱- همیشه عددی مثبت خواهد بود. کد php جمله بالا را ببینید:
<?php
for($p=0.0; $p<=1.0; $p+=0.1)
  $i = -log($p, 2); 
?>

زیبا کردن کد بالا با تگ های html خروجی دو متغیر $i و $p را به شکل زیر می کند:
p(s)   I(p(s))
0     1.#INF
0.1   3.32192809489
0.2   2.32192809489
0.3   1.73696559417
0.4   1.32192809489
0.5   1
0.6   0.736965594166
0.7   0.51457317283
0.8   0.321928094887
0.9   0.152003093445
1     0
Back to top
Display posts from previous:   
Post new topic   Reply to topic    ParsX.com Forum Index -> بازشناسی اماری الگو All times are GMT + 3.5 Hours
Page 1 of 1

 
Jump to:  
You cannot post new topics in this forum
You cannot reply to topics in this forum
You cannot edit your posts in this forum
You cannot delete your posts in this forum
You cannot vote in polls in this forum