تحقیق پردازش پرسوجو در پایگاه داده توزیع شده
دسته بندي :
دانش آموزی و دانشجویی »
دانلود تحقیق
لینک دانلود و خرید پایین توضیحات
دسته بندی : وورد
نوع فایل : word (..doc) ( قابل ويرايش و آماده پرينت )
تعداد صفحه : 31 صفحه
قسمتی از متن word (..doc) :
21
بسمه تعالی
پردازش پرسوجو در پایگاه داده توزیع شده
1
فهرست
1. مقدمه 2
2. تکنیکها و روشهای پایهایی پردازش پرسوجوی توزیعی 3
2-1. معماری پردازش پرسوجو 3
2-2. بهینهساز پرسوجو 5
2-2-1. تولید طرح با استفاده از برنامهنویسی پویا 5
2-3. تکنیکهای اجرای پرسوجو 6
2-3-1. Row Blocking 6
2-3-2. بهینهسازی برای Multicast 7
2-3-3. اجرای همروند پرسوجو 7
2-3-4. پيوند دادههای پارتیشن شده افقی 8
2-3-5. Semijion 9
2-3-6. Double-Piplined Hash Joins 9
2-3-7. Pointer-Based Joins and Distributed Object Assembly 10
2-3-8. Top N and Bottom N Queries 11
3. سیستمهای پایگاه دادهای به صورت CLIENT-SERVER 14
3-1. معماریهایClient-Server، Peer-to-Peer و Multitier 14
3-2. استفاده از منابع client 15
3-2-1. انتقال پرسوجو 15
3-2-2. انتقال داده 16
3-2-3. انتقال ترکیبی 16
3-2-4. مقایسه 17
4. سیستم پایگاههای داده نامتجانس 18
4-1. معماری Wrapper برای پایگاههای داده نامتجانس 18
4-2. تکنیکهای اجرای پرسوجو 18
4-2-1. Bindings 18
4-2-2. cursor caching 19
5. موقعیتدهی پویای داده 20
5-1. Replication vs. Caching 20
5-2. الگوریتمهای پویای Replication 21
5-3. Cache Investment 22
6. معماریهای جديد برای پردازش پرسوجو 23
6-1. مدلهای اقتصادی برای پردازش پرسوجو 23
6-2. سيستم اطلاعاتی مبتنی بر انتشار 24
2
مقدمه
پردازش دادههای توزیع شده یک واقعیت تبدیل شده است. دلایلی که هنوز پردازش دادههای توزیع شده را یک موضوع پیچیده میسازد عبارتند از:
سیستمهای توزیع شده خیلی وسیع هستند و هزاران سایت متجانس شامل کامپیوترهای شخصی و ماشینهای سرور بزرگ را در بر میگیرد
حالت سیستمهای توزیع شده به سرعت تغییر میکند زیرا بارگذاری سایتها از نظر زمانی متنوع میباشد و سایتهای جدید به سیستم افزوده شده است.
سیستمهای موجود باید تکمیل گردند. از انجا که سیستمهای موجود برای پردازش توزیعی طراحی نشدهاند و اینک نیاز است که با سیستمهای دیگر در محیط توزیعی تعامل داشته باشند.
این مقاله چگونگی انجام پردازش پرسوجو در محیطهای توزیع شده Distributed Query Processing
و سیستمهای اطلاعاتی را نمایش میدهد.
محققان از سال 1970 به سیستم پایگاه داده توزیعی علاقمند گردیدند. در این زمان پشتیبانی مدیریت دادههای توزیعی برای شرکتها و سازمانهایی که دادههای خود را در ادارات مختلف و یا محلهای معین نگهداری میکنند، مرکز توجه بود. اگرچه این نیاز احساس میشد و ایدههای بسیار خوبی موجود بود اما هرگز تلاشهای اولیه برای ساخت سیستمهای پایگاه داده توزیعی بطور تجاری موفقیتآمیز نبود. اما امروزه موقعیت تغییر نموده است. سیستمهای توزیعی هم مورد نیاز و هم امکانپذیر میباشند. پردازش دادههای توزیعی نیز بخاطر پیشرفتهای اخیر تکنولوژی میسر میباشد.
3
تکنیکها و روشهای پایهایی پردازش پرسوجوی توزیعی
در این بخش معماری پردازش پرسوجو شرح داده میشود و یک سری از تکنیکهای خاص پردازش پرسوجو برای پایگاه دادههای توزیعی و سیستمهای اطلاعاتی مطرح میگردد. این تکنیکها شامل روشهای متناوب برای حمل داده از یک سایت به یک یا چندین سایت دیگر و پیادهسازی الحاق Join
و انجام انواع مختلفی از پرسوجوها در محیطهای توزیعی میباشد.
شکل 1: مراحل پردازش پرسوجو
معماری پردازش پرسوجو
شکل 1یک معماری کلاسیک از پردازش پرسوجو را نمایش میدهد. این معماری میتواند برای هر نوع از سیستم پایگاه داده شامل centeralized systems و distributed systemsو parallel systems مورد استفاده قرار گیرد.
پردازش پرسوجو یک SQL (یا OQL) را به عنوان ورودی دریافت میکند و آن را در چندین فاز ترجمه و بهینه میسازد و به طرح اجرای پرسوجو Executable query plan
تبدیل میکند. در پایان برای بدست اوردن نتیجه پرسوجو، طرح را اجرا میکند. اگر پرسوجو یک interactive ad hoc query (dynamic SQL) باشد طرح بطور مستقیم توسط موتور اجرای پرسوجو query executation engine
اجرا میشود. و نتیجه به کاربر نمایش داده میشود. اگر پرسوجو یک canned query باشد که قسمتی از یک برنامه کاربردی باشد طرح در پایگاه داده ذحیره میشود و هر زمان که برنامه اجرا میشود، بوسیله موتور اجرای پرسوجو اجرا میشود. در زیر یک شرح مختصری از هر جز پردازش پرسوجو بیان میگردد.
Parser: در اولین فاز، پرسوجو تجزیه و به یک نمایش داخلی ترجمه میشود که میتواند به سادگی بوسیله فازهای بعدی پردازش شود.
بازنویسی پرسوجو: در این قسمت پرسوجو به منظور انجام بهینهسازی تغییر شکل مییابد. تغییر شکل شامل از بین بردن گزارههای زائد، سادهسازی عبارتها، خارج نمودن subquery و view از حالت تو در تو، میباشد. در یک سیستم توزیع شده، در اين مرحله همچنین پارتیشنهای یک جدول که باید برای پاسخ به پرسوجو در نظر گرفت، انتخاب میشوند.