پاورپوینت طراحی صفحات وب
دسته بندي :
علوم پایه »
دانلود پاورپوینت های علمی
لینک دانلود و خرید پایین توضیحات
دسته بندی : پاورپوینت
نوع فایل : powerpoint (..ppt) ( قابل ويرايش و آماده پرينت )
تعداد اسلاید : 29 اسلاید
قسمتی از متن powerpoint (..ppt) :
عنوان پروژه:
طراحی صفحات وب
دستهبندي صفحات وب
گروه کامپيوتر
چكيده
دستهبندي صفحات وب در بسياري از وظيفههاي مديريتي در وب نقش ضرورياي دارد. طبيعت غبرقابل کنترل محتواي وب چالشهاي جديدي را براي اين دسته بندي ايجاد مي کند اما طبيعت متصل صفحات وب و همچنين حالت نيمه ساختيافته آنها قابليتهايي را فراهم مي کند که به کمک اين دستهبندي ميآيد. امروزه توسعه زيادي در زمينه دستهبندي هوشمند صفحات صورت گرفته است بطوريکه بسياري از محققين تمرکز خود را بر روي اين قصيه قرار داده اند. در اين مقاله ما رويکردهاي دستهبندي صفحات وب را بررسي ميکنيم تا چشم انداز هاي جديدي را براي تحقيات بيابيم. همچنين در ابتدا برخي از کاربردهاي دستهبندي صفحات وب را بيان خواهيم نمود. همچنين خصوصيتها و الگوريتمهايي را که براي دستهبندي مفيد هستند توضيح خواهيم داد.
كلمات كليدي
دستهبندي صفحات وب، دستهکننده، درخت تصميمگيري، دستهکننده بيزي، ماشين بردار پشتيبان، خصوصيات درون صفحه، خصوصيات مجاورين، انتخاب قابليت
1- مقدمه
دستهبندي در بسياري از وظايف مديريت وبازيابي اطلاعات يک نقش حياتي ايفا مي کند. در وب دستهبندي محتوي صفحات وب براي تمرکز خزيدن [1] ، کمک به توسعه راهنماهاي وب [2] ، تحليل بر اساس موضوع [3] لينکهاي وب و براي تحليل ساختار موضوعي وب ضروري است. دستهبندي صفحات وب همچنين مي تواند به بهبود شرايط جستجوي وب نيز کمک نمايد [1] .
دستهبندي صفحات وب که به گروه بندي صفحات وب نيز معروف است عبارتست از فرايند نسبت دادن يک صفحه وب به يک يا چند گروه از پيش تعيين شده. دستهبندي اغلب بعنوان يک مسئله يادگيري مطرح مي شود که در آن از يکسري داده هاي برچسب گذاري شده براي آموزش و تمرين دستهکننده استفاده مي شود تا بر اساس آن دستهکننده بتواند داده ها را برچسب گذاري کند.
2- کاربردهاي دستهبندي صفحات وب
2-1- ايجاد ، پشتيباني يا توسعه راهنماهاي وب
برخي از سايتها مانند Yahoo! و dmoz ODP يکسري راهنماي وب دارند که بر اساس آن مي توان يکسري جستجو در گروههاي از پيش تعيين شده انجام داد که در حال حاضر اين راهنماها توسط انسان ايجاد مي شوند. در جولاي 2006 در dmoz ODP ، 73354 اديتور راهنما وجود داشت. با گسترش روزافزون صفحات وب ديدگاه سنتي به اين قضيه ديگر نمي تواند موثر باشد . اما با استفاده از دستهبندي صفحات وب مي توان اين راهنماها را براحتي ايجاد کرد و توسعه داد [1] .
2-2- بهبود کيفيت نتايج جستجو
گنگ بودن پرس و جوها [1] يکي از مشکلات اساسي براي نتايج جستجو مي باشد. بعنوان مثال کلمه bank هم به معني ساحل و هم به معني بانک است. رويکردهاي مختلفي براي بازيابي اطلاعات در اينگونه موارد مطرح گرديده است. Chekuri و گروهش دستهبندي اتوماتيک صفحات وب به منظور افزايش دقت جستجو در وب را مورد مطالعه قرار دادند. به يک دستهکننده آماري با استفاده از يکسري صفحات موجود آموزش داده شد، سپس اين دستهکننده بر روي يکسري صفحات جديد بکار گرفته شد که يک ليست مرتب از گروهها را ايجاد کرد که صفحات وب مي توانند در آن قرار گيرند. در زمان پرس و جو [2] از کاربر خواسته مي شود تا يک يا چند گروه را انتخاب نمايد بطوريکه فقط اطلاعات مربوط به آن گروهها برگردانده مي شوند يا اينکه موتور جستجو فقط يک ليست از گروههايي را نشان مي دهد که اطلاعات مورد نظر در آنها وجود دارد. اما اين رويکرد فقط زماني ثمربخش است که کاربر به دنبال يک چيز معلوم و مشخص بگردد.
نتايج جستجو معمولاً بر اساس رتبه بندي نمايش داده مي شوند. يک رويکرد ارائه شده توسط Chen and Damais نتايج جستجو را در يک ساختار سيسله مراتبي از پيش تعيين شده دستهبندي مي کند و نتايج گروهبندي شده را نشان مي دهد [4] . مطالعه کاربران آنها نشان ميدهد که نمايش گروهي براي کاربران خوشايندتر از نتايج ليست شده است و براي کاربران جهت يافتن اطلاعاتشان موثرتر است. در مقايسه با روش قبل اين روش در زمان پرس و جو اثر کمتري دارد زيرا گروه بندي صفحات در آن بصورت در جا [1] ايجاد مي شود. در هر حال لازم نيست که کاربر گروههاي مورد نظر خود براي جستجو را انتخاب نمايد بنابراين اين روش زماني که کاربر مورد جستجو را دقيقاً نميشناسد بسيار سودمند است.
متشابهاً Kaki نيز نمايش گروهي را براي نتايج جستجوي کاربران پيشنهاد داده است. آزمايشات وي نشان مي دهد که نمايش گروهي براي کاربران بسيار مفيد است مخصوصاً زماني که رتبه بندي نتايج راضي کننده نيست [5] .
Page and Brin الگوريتم رتبه بندي بر اساس لينک [2] را توسعه دادند که Pagerank ناميده شد. در اين روش ميزان معتبر بودن يک صفحه بر اساس يک گراف ايجاد شده از صفحات وب و لينکهايش و بدون در نظر گرفتن موضوع هر صفحه محاسبه مي شود . Haveliwala رتبهبندي بر اساس موضوع را ارائه کرد که باعث محاسبه رتبه بندي چندگانه مي شود بطوريکه رتبه بندي براي هر موضوع جداگانه خواهد بود . اين روش نياز به يکسري صفحات دارد که از قبل و با دقت دستهبندي شده باشند [1] .