5-1- مقدمه72
5-2- معرفی سیستم پیشنهادی73
5-3- مولفههای اصلی سیستم پیشنهادی74
5-4- روش رفع ناسازگاری بکار برده شده در سیستم پیشنهادی77
فصل ششم. ارزیابی و نتایج80
فصل هفتم. نتیجهگیری و کارهای آینده89
فهرست منابع92

فهرست جداول
جدول 6-1. مقادیر نهایی امتیازات بازیکنان 83
جدول 6-2. مقادیر نهایی منابع بازیکنان 83
جدول 6-3. مقادیر نهایی ویژگیهای اقتصادی بازیکنان 84
جدول 6-4. مقادیر نهایی ویژگیهای نظامی بازیکنان 84
جدول 6-5. مقادیر نهایی تجربههای بازیکنان 84
جدول 6-6. مقادیر پنج معیار امتیاز نهایی، منابع جمعآوری شده، ویژگیهای اقتصادی، امتیاز نظامی و تجربهی دو بازیکن 88
جدول 6-7. مقادیر پنج معیار امتیاز نهایی، منابع جمعآوری شده، ویژگیهای اقتصادی، امتیاز نظامی و تجربهی دو بازیکن 88
فهرست شکل ها
شکل2-1. یک کامپیوتر که یک الگوریتم را در یک حلقه اجرا میکند 15
شکل2-2. احتمال شکست، احتمال موفقیت و احتمال اولین موفقیت17
شکل2-3. یک ساختار سلسله مراتبی26
شکل2-4. یک ماتریس مقایسهایی دوبهدو27
شکل2-5. (الف)روند سلسله مراتبی تحلیلی استاندارد28
شکل2-5. (ب) نسخهی تغییر داده شدهی روند سلسله مراتبی تحلیلی 28
شکل2-6. ساختار نسخهی تغییر داده شدهی روند سلسله مراتبی تحلیلی29
شکل 3-1. یک ساختار تئوری برای یک سیستم تصمیمهمیار هوشمند33
شکل 3-2. مولفههای کلی یک سیستم تصمیمهمیار هوشمند35
شکل 3-3. ساختاری برای یک سیستم تصمیمهمیار هوشمند .37
شکل 3-4. روند ساخت مدلهای توصیفی و پیشگویی42

شما می توانید تکه های دیگری از این مطلب را با جستجو در همین سایت بخوانید

شکل 3-5. مولفههای اصلی مدل DM-NN و چگونگی ارتباط آنها43
شکل 3-6. رویهی اخذ دانش با استفاده از دادهکاوی44
شکل 3-7. ساختار داخلی مولفههای سیستم مشورتی هوشمند44
شکل 3-8. چرخهی حمایت از تصمیم در مدل DM-NN46
شکل 3-9. یک ساختار برای سیستم تصمیمهمیار هوشمند46

در این سایت فقط تکه هایی از این مطلب(به صورت کاملا تصادفی و به صورت نمونه) با شماره بندی انتهای صفحه درج می شود که ممکن است هنگام انتقال از فایل ورد به داخل سایت کلمات به هم بریزد یا شکل ها درج نشود-این مطالب صرفا برای دمو می باشد

ولی برای دانلود فایل اصلی با فرمت ورد حاوی تمامی قسمت ها با منابع کامل

اینجا کلیک کنید

شکل 3-10. تابع عضویت غیرنزولی فازی متناظر با “≥”49
شکل 3-11. تابع عضویت غیرصعود فازی متناظر با “≤”50
شکل 3-12. چگونگی ارتباط ماژولها در ساختار پیشنهادی54
شکل 3-13. ساختار یک سیستم مبتنی بر قانون.56
شکل 4-1. سناریوی یک بازی RTS.61
شکل 4-2. روند تکاملی اعمال شده در بازی RTS در مرجع [36]67
شکل 5-1. ساختار کلی سیستم پیشنهادی74
شکل 5-2. بخشی از مدل کلاس سیستم پیشنهادی76
شکل 5-3. درخت استنتاجی که از بسط تمامی راهحلهای ممکن، بدست آمده است78
شکل 5-4. درخت استنتاج سیستم، پس از اخذ تصمیم توسط تصمیمگیرنده79
شکل 6-1. تصاویری از اجرای نرمافزار82
شکل 6-2. نمودار پیشرفت بازیکنان در تمامی واحدها در طول بازی85
شکل 6-3. نمودار امتیاز بازیکنان در طول بازی85
شکل 6-4. نمودار تجربهی بازیکنان در طول بازی86
شکل 6-5. نمودار امتیاز اقتصادی بازیکنان در طول بازی86
شکل 6-6. نمودار امتیاز نظامی بازیکنان در طول بازی87
فصل اول
مقدمه

مقدمه
مقدمه
مسائل بسیاری وجود دارند که محدود به یک راهحل منحصر به فرد نمیباشند. علاوه براین، برخی از مسائل ممکن است تعداد نامحدودی مسیرهای پاسخ مشابه، داشته باشند. یک ناسازگاری1 هنگامی روی میدهد که تصمیمهای گوناگونی، متناظر با مسیرهای پاسخ متمایز، فراهم باشد.
به طور کلی در سیستمی که دارای مجموعههای نسبتاً بزرگی از قوانین و حقایق باشد، درج یک حقیقت میتواند منجر به صحیح شدن ارزش چندین قانون و در نتیجه فعال شدن آنها گردد. هر ترتیبی از اجرای این قوانین، میتواند نتایج متفاوتی را به دنبال داشته باشد که در این صورت این مجموعه از قوانین، مجموعهی قوانین ناسازگار نامیده میشوند. یک استراتژی رفع ناسازگاری ترتیبی را برای اجرای این مجموعه از قوانین تعیین مینماید.
سیستمهای هوشمند از قبیل سیستمهای مبتنی بر قانون، ابزارهای برنامهریزی، و ساختارهای وابسته به دانش، از استراتژیهای متفاوتی برای رفع ناسازگاری استفاده میکنند] 2[.
در این پژوهش در ابتدا در رابطه با این شیوههای متفاوت توضیحاتی ارائه میگردد و پس از آن ایدهایی که به منظور رفع ناسازگاری در سیستم پیشنهادی بکار برده شده، شرح داده میشود. سیستم پیشنهادی یک سیستم تصمیمهمیار هوشمند است که به منظور یاری رساندن به یک بازیکن در یک بازی استراتژیک بلادرنگ طراحی و پیادهسازی شده و شرح ساختار و ویژگیهای آن در فصول آتی آمده است. همچنین در این پایاننامه در ارتباط با سیستمهای تصمیمهمیار هوشمند و ساختارهای مختلفی که محققان برای پیادهسازی این سیستمها در نظر گرفتهاند، نیز مطالبی ارائه شده است.
رفع ناسازگاری
در بسیاری از سیستمهای مبتنی بر قانون، موتور استنتاج، یک مولفهی نرمافزاری است که در هنگام اجرای برنامهی کاربردی، بر روی مجموعهایی از قوانین، استنتاج میکند. از جمله مهمترین وظایفی که توسط موتور استنتاج صورت میگیرد، رفع ناسازگاری است] 47[. به طور کلی، رفع ناسازگاری، یک استراتژی، برای انتخاب ترتیب اجرای قوانین است هنگامی که بیش از یک قانون بتواند اجرا شود.
برای رفع ناسازگاری روشهای مختلفی وجود دارد. سادهترین راهحل، انتخاب تصادفی قوانین است. در برخی از استراتژیها، از جمله مهمترین فاکتورهایی که در انتخاب قوانین موثر است مقدار اولویتی است که توسط سازندهی سیستم به هر قانون اختصاص داده میشود که در این روش برای قوانین با الویت یکسان باید از روش دیگری استفاده گردد. روشهای خبرهتر از اطلاعات آماری مرتبط با موفقیتها و عدم موفقیتهای پیشین در هنگام بکار بردن قوانین مختلف، به منظور پیبردن به احتمال موفقیت، استفاده میکنند. همچنین برخی از روشها، هزینههای قوانین را که نشاندهندهی تلاشهایی است که حلکنندهی مسئله برای انجام اعمال بدان نیازمند است (مانند زمان) بحساب میآورند] 2[.
روشی که در این پژوهش به منظور رفع ناسازگاری بکار برده شده، با در نظر گرفتن یک خط استنتاج جداگانه برای هر یک از قوانین ناسازگار در طی روند استنتاج، تمامی حالات ممکن برای اولویتبندی در اجرای قوانین را تحت پوشش قرار میدهد.
سیستمهای تصمیمهمیار و سیستمهای تصمیمهمیار هوشمند
به طور کلی، اخذ تصمیم، یکی از مهمترین و حساسترین فعالیتهایی است که در هر سازمان و یا تشکیلاتی صورت میگیرد] 48[. برای پشتیبانی و حمایت از این روند پیچیده، دستهی متنوعی از سیستمهای اطلاعاتی مستقل بنام سیستمهای تصمیمهمیار، در طی دو دههی گذشته به وجود آمدهاند. این سیستمها به صورت ابزارهای مبتنی بر کامپیوتری که به منظور پشتیبانی از روند پیچیدهی اخذ تصمیم و حل مسئله ایجاد میشوند، تعریف و در جهت ایجاد محیطی برای تحلیل مسائل، ساخت مدلها و شبیهسازی رویهی تصمیمگیری و برنامههای تصمیمگیرندگان طراحی میگردند] 49[.
این سیستمهای اطلاعاتی، که به منظور حمایت فعل و انفعالی از تمامی مراحل روند اخذ تصمیم یک کاربر، طراحی میشوند، میتوانند شامل تکنولوژیهایی برگرفته از زمینههای علمی مختلف شامل حسابداری، علوم شناختی، علوم کامپیوتر، اقتصاد، مهندسی، مدیریت، آمار و … باشند و اغلب از سه مولفهی زیرسیستم داده، زیر سیستم مدل (که دارای مکانیزمی برای پردازش داده میباشد) و زیرسیستم ارتباط با کاربر، تشکیل شدهاند] 19[.
اگرچه، سیستمهای تصمیمهمیار با بکار بردن منابع اطلاعاتی و ابزارهای تحلیل گوناگون، شرایط بهتر و با کیفیت بیشتری را برای تصمیمگیرندگان فراهم میسازند و داشتن یک نقش حمایتی به جای جایگزینی کامل افراد در روند اخذ تصمیم، از اهداف اصلی آنهاست] 12[، اما نمیتوان آنها را به عنوان یک همیار هوشمند برای تصمیمگیرندگان در نظر گرفت. سیستمهای تصمیمهمیار هوشمند، برای مسائل عمومیایی که به تصمیمگیریهای مکرر نیاز دارند، مفید و از لحاظ اقتصادی مقرون به صرفه هستند. این سیستمهای محاورهایی مبتنی بر کامپیوتر، برای حل مسائل نیمه ساختیافته، از، ترکیب داده و دانش تخصصی و مدلهایی که برای حمایت از تصمیمگیرندگان در سازمانها بکار میرود، با تکنیکهای هوش مصنوعی، استفاده میکنند] 50[.
تعاریف مختلفی از تفاوتهای میان یک سیستم تصمیمهمیار و یک سیستم تصمیمهمیار هوشمند وجود دارد که این امر به دلیل وجود انواع مختلف سیستمهای تصمیمهمیار هوشمند میباشد. در این سیستمها، عملکرد هوشمندانه در تصمیمگیری، با بهبودهایی نظیر ارتقاء سیستم مدیریت پایگاه مدل و یا تقویت فاصل کاربر با استفاده از تکنیکهای گوناگون هوش مصنوعی مانند پردازش زبان طبیعی و یا سایر تکنیکهای مشابه، میسر شده است. همچنین، این نوع از سیستمها با حمایت از مسائلی با عدم قطعیت، امکان پشتیبانی از محدودهی وسیعتری از تصمیمات را فراهم ساخته و میتوانند قلمروهایی را کنترل و مدیریت نمایند که در آنها روند تصمیمگیری پیچیدهتر بوده و علاوه بر مهارت و خبرگی، به ارزیابی اثر راهحل پیشنهادی نیز نیاز دارد. از دیگر مزایای سیستمهای تصمیمهمیار هوشمند نسبت به سیستمهای تصمیمهمیار، بهبود سازگاری در تصمیمات، بهبود تشریح و تفسیر و توجیه پیشنهادات ارائه شده توسط سیستم میباشد] 19[.
Holsapple و Whinston از اولین محققانی بودند که به طراحی و مطالعهی سیستمهای تصمیمهمیار هوشمند، پرداختند] 51[. آنها مشخصههای زیر را برای این سیستمها پیشنهاد دادند:
این سیستمها شامل انواع مختلف دانش که نمودهای انتخاب شدهایی از دنیای تصمیمگیرنده را توصیف میکنند، میباشند.
این سیستمها دارای توانایی بدست آوردن و نگهداری دانش توصیفی2 مانند نگهداری رویداد3 و انواع دیگر دانش هستند.
این سیستمها میتوانند دانش را به شیوههای مختلف تولید نموده و ارائه دهند.
آنها میتوانند دانشی را برای ارائه یا بدست آوردن دانش جدید، انتخاب نمایند.
این سیستمها میتوانند به صورت مستقیم (هوشمند) با تصمیمگیرنده در ارتباط باشند.
اگرچه این سیستمها حامیانی هوشمند و انسانگونه در روند تصمیمگیری هستند، اما تصمیمگیرندگان باید تصمیمات نهایی و بحرانی را خود اتخاذ نمایند.
هدف از این پایاننامه
هدف از این پایاننامه، ارائهی یک سیستم تصمیمهمیار هوشمند است که در هنگام وقوع ناسازگاری، برای هر یک از قوانین ناسازگار، یک خط استنتاج مجزا را در نظرگرفته و با پیشبرد استنتاج در هر یک از این خطوط، امکان آگاهی از نتایج انتخاب هر یک از راهحلهای ممکن را برای تصمیمگیرنده فراهم میسازد. این سیستم، یک سیستم مبتنی بر قانون است که به منظور یارینمودن یک بازیکن در یک بازی استراتژیک بلادرنگ طراحی و پیادهسازی شده است.
در این پژوهش، روشهای گوناگونی که به منظور رفع ناسازگاری در سیستمهای هوشمند بکار برده شده و نیز ساختارهای مختلفی که برای سیستمهای تصمیمهمیار هوشمند مورد استفاده قرار گرفته، بررسی و ارائه شده است.
نگاه کلی به فصول پایاننامه
مطالب عنوان شده در این پایان نامه در قالب هفت فصل آورده شده‌اند. در فصل دوم، روشهای گوناگون رفع ناسازگاری شرح داده شده و فصل سوم به بیان ساختارهایی که برای سیستمهای تصمیمهمیار هوشمند در تحقیقات مختلف ارائه شده، میپردازد. در فصل چهارم بازیهای کامپیوتری استراتژیک بلادرنگ معرفی و ویژگیهای سیستمهای مربوط به این نوع از بازیها مطرح شده است. فصل پنجم، ساختار و مولفههای سیستم پیشنهادی و نیز روش رفع ناسازگاری بکار برده شده در این سیستم را شرح میدهد. ارزیابی سیستم پیشنهادی و نتایج آن در فصل ششم آورده شده و فصل انتهایی نیز به نتیجهگیری و ارائهی کارهای آیندهی میپردازد.
فصل دوم
روشهای رفع ناسازگاری
روشهای رفع ناسازگاری

مقدمه
رفع ناسازگاری، یک استراتژی، جهت انتخاب ترتیب اجرای قوانین است هنگامی که بیش از یک قانون بتواند اجرا شود. به طورکلی، در سیستمهایی که رفع ناسازگاری در روند استنتاج آنها صورت میگیرد، موتور استنتاج یک رویهی سه مرحلهایی شناسایی- رفع – عمل را بر روی مجموعهی قوانین اعمال میکند [1]:
شناسایی: تشخیص قوانینی که میتوانند اجرا گردند و قراردادن آنها در مجموعهی ناسازگاری.
رفع: استفاده از یک استراتژی به منظور انتخاب یک قانون از مجموعهی ناسازگاری.
عمل: اجرای قانون منتخب و افزودن نتایج آن به حافظهی کاری4.
در استراتژیهای رفع ناسازگاری، لیست اجرا5، فهرستی از تمامی قوانینی است که شرایط آنها ارضاء شده ولی هنوز اجرا نشدهاند. این لیست، همانند یک پشته6 عمل میکند و قانونی که در بالای آن قرار دارد، پیش از سایر قوانین موجود در آن اجرا میگردد. یک استراتژی رفع ناسازگاری، ترتیبی را برای اجرای قوانین موجود در لیست اجرا با اولویت یکسان تعیین مینماید.
در این فصل در رابطه با روشهایی که به منظور رفع ناسازگاری در سیستمهای مختلف بکار برده میشود، توضیحاتی ارائه شده است. این توضیحات، در ابتدا استراتژیهای سادهتر و در ادامه روشهایی با پیچیدگی بیشتر را شرح میدهد.
برخی استراتژیهای ساده برای رفع ناسازگاری
به طور کلی به منظور رفع ناسازگاری در بسیاری از سیستمها، از روشهای سادهایی استفاده شده که در ادامه در رابطه با هر یک از این استراتژیها توضیحات مختصری ارائه میگردد [1]:
استراتژی تصادفی: در این استراتژی، به هر فعالسازی7، یک عدد تصادفی نسبت داده میشود که به منظور تعیین مکان قرارگیری آن فعالسازی، در میان فعالسازیهایی با اولویت یکسان، بکار برده خواهد شد. در برخی از سیستمها، این عدد تصادفی هنگامی که استراتژی تغییر مییابد نیز نگاه داشته میشود تا در هنگام انتخاب مجدد این استراتژی ترتیبی مشابه، تولید گردد.
استراتژی عمقی: در این استراتژی، قوانینی که بتازگی فعال شدهاند، در لیست اجرا، در بالای تمامی قوانین با اولویت یکسان قرار میگیرند. به عنوان مثال، فرض کنید در یک مجموعهی قوانین و حقایق، حقیقت fact-a منجر به فعالسازی قوانین rule-1 و rule-2 گردد و حقیقت fact-b منجر به فعالسازی قوانین rule-3 و rule-4 گردد. حال اگر حقیقت fact-a پیش از حقیقت fact-b وارد سیستم گردد، قوانین rule-3 و rule-4 در بالای قوانین rule-1 و rule-2 در لیست اجرا قرار خواهند گرفت. مکان rule-1 نسبت به rule-2 و rule-3 نسبت به rule-4، قراردادی خواهد بود.
استراتژی عرضی: در این استراتژی، قوانینی که بتازگی فعال شدهاند، در پایین تمامی قوانین با اولویت یکسان قرار میگیرند. به عنوان مثال، فرض کنید در یک مجموعهی قوانین و حقایق، حقیقت fact-a منجر به فعالسازی قوانین rule-1 و rule-2 گردد و حقیقت fact-b منجر به فعالسازی قوانین rule-3 و rule-4 گردد. حال اگر حقیقت fact-a پیش از حقیقت fact-b وارد سیستم گردد، قوانین rule-1 و rule-2 در بالای قوانین rule-3 و rule-4 در لیست اجرا قرار خواهند گرفت. در این روش نیز مکان rule-1 نسبت به rule-2 و rule-3 نسبت به rule-4، قراردادی خواهد بود.
استراتژی سادگی8: در این استراتژی، در میان قوانین با اولویت یکسان، قوانینی که بتازگی فعال شدهاند، در بالای تمامی قوانین فعالشده با مشخصه9ی یکسان و یا بیشتر، قرار میگیرند. مشخصهی یک قانون با تعداد مقایسههایی که باید در قسمت سمت چپ10 یک قانون انجام گیرد، تعیین میشود. هر مقایسه با یک ثابت و یا متغیرهایی که سابقاً مقید شدهاند، یک واحد به مشخصهی قانون میافزاید. همچنین هر فراخوانی تابع که در قسمت سمت چپ یک قانون انجام گیرد، نیز مشخصهی قانون را یک واحد افزایش میدهد. توابع بولی and، or و not، مشخصهی یک قانون را تغییر نمیدهند، اما آرگومانهای آنها سبب تغییر مشخصه میگردند. فراخوانی توابع در صورتی که در داخل یک فراخوانی تابع صورت گیرند نیز سبب افزایش مشخصه نمیگردند. به عنوان مثال مشخصهی قانونی که در زیر تعریف شده است، 5 میباشد.
(defrule example
(item ?x ?y ?x)
(test (and (numberp ?x) (> ?x (+ 10 ?y)) (< ?x 100)))
=>)
مقایسه با یک ثابت، مقایسه متغیر ورودی x با انقیاد قبلی آن و فراخوانی توابع numberp، < و >، هر یک، یک واحد به مشخصهی قانون میافزاید و فراخوانی توابع and و + تاثیری در مقدار مشخصه نخواهد داشت.
استراتژی پیچیدگی11: در این استراتژی، در میان قوانین با اولویت یکسان، قوانینی که بتازگی فعال شدهاند، در بالای تمامی قوانین فعالشده با مشخصهی یکسان و یا کمتر، قرار میگیرند.
استراتژی LEX12: در این استراتژی در ابتدا، تازگی (تأخر)13 نهاد الگوهایی14 که منجر به فعالسازی قانون شدهاند، به منظور تعیین مکان قرارگیری قانون فعالشده، بکار برده میشوند. هر حقیقت و نمونه15، ذاتا ً با یک “برچسب زمان” که نشاندهندهی تازگی نسبی آن در مقایسه با هر حقیقت و یا نمونهی دیگری در سیستم است، نشانهگذاری میگردد. نهاد الگوهای مربوط به فعالسازی هر قانون به منظور تعیین مکان قرارگیری، به ترتیب نزولی مرتب میگردند. یک فعالسازی با نهاد الگوهایی با تازگی بیشتر، پیش از فعالسازیهایی با نهاد الگوهایی با تازگی کمتر قرار میگیرد. برای تعیین ترتیب قرارگیری دو فعالسازی، برچسبهای زمان مرتب شدهی دو فعالسازی، با شروع از دو بزرگترین برچسب زمان، یک به یک مقایسه میگردند. این مقایسه باید تا هنگامی که برچسب زمان یک فعالسازی، بزرگتر از برچسب زمان متناظر با آن از فعالسازی دیگر، باشد ادامه یابد. فعالسازی با برچسب زمان بزرگتر پیش از سایر فعالسازیها در لیست اجرا قرار میگیرد. اگر یک فعالسازی نهاد الگوهای بیشتری نسبت به سایر فعالسازیها داشته باشد و برچسب زمانهای مقایسه شده، همگی مساوی باشند، فعالسازی با برچسب زمانهای بیشتر پیش از سایر فعالسازیها در لیست اجرا قرار میگیرد. اگر دو فعالسازی دارای تازگی دقیقاً مساوی باشند، فعالسازی با مشخصهی بیشتر در بالای فعالسازی با مشخصهی کمتر قرار میگیرد. برچسب زمان یک عامل شرطی not، کمتر از برچسب زمان یک نهاد الگو میباشد.
به عنوان نمونه، شش فعالسازی زیر را در نظر بگیرید (کاما در پایان هر فعالسازی نشاندهندهی حضور یک عامل شرطی not میباشد). در این مثال فرض بر این است که برچسب زمان حقایق، مشابه با اندیس آنها باشد.
rule-6: f-1, f-4
rule-2: f-3, f-1
rule-5: f-1, f-2, f-3,
rule-1: f-1, f-2, f-3
rule-3: f-2,f-1
rule-4: f-1,f-2,
لیستی که در زیر آمده، ترتیبی است که استراتژی LEX برای اجرا در نظر میگیرد.
rule-6: f-4, f-1
rule-5: f-3, f-2, f-1,
rule-1: f-3, f-2, f-1
rule-2: f-3, f-1
rule-4: f-2,f-1,
rule-3: f-2,f-1
برطبق این استراتژی، ترتیب اجرای قوانین از بالا به پایین خواهد بود.
استراتژی MEA16: در این استراتژی در ابتدا، برچسب زمان اولین نهاد الگوی مربوط به اولین الگو، به منظور تعیین مکان قرارگیری قانون فعالشده، بکار برده میشود. فعالسازیایی که برچسب زمان اولین الگوی آن بزرگتر از برچسب زمان اولین الگوی سایر فعالسازیها باشد، پیش از سایر فعالسازیها در لیست اجرا قرار میگیرد. اگر دو فعالسازی دارای دو برچسب زمان متناظر با اولین الگوی مساوی باشند، از استراتژی LEX برای تعیین مکان قرارگیری فعالسازیها استفاده میگردد. به عنوان مثال، ترتیبی که این استراتژی برای اجرای شش فعالسازی مثال قبل در نظر میگیرد، به صورت زیر (از بالا به پایین) خواهد بود.
rule-2: f-3, f-1
rule-3: f-2, f-1
rule-6: f-1, f-4
rule-5: f-1, f-2, f-3,
rule-1: f-1,f-2,f-3
rule-4: f-1,f-2,
رفع ناسازگاری با استفاده از یک مقدار سودمندی
از جمله استراتژیهای دیگری که برای رفع ناسازگاری بکار برده میشود، استفاده از یک مقدار سودمندی17 است. در این روش که در ساختار شناختی18 ACT-R نیز اعمال شده [2]، به هر قانون i، یک مقدار سودمندی Ui نسبت داده میشود و در هنگام وقوع ناسازگاری، قانون با بیشترین مقدار Ui انتخاب میگردد (i=arg⁡max⁡〖U_i 〗 ). این مقدار سودمندی برای هر قانون به صورت زیر تعریف میگردد:
U_i=P_i G-C_i+ξ(σ^2 )
که در آن، Pi احتمال پیشبینی شده برای تحقق هدف پس از اجرای قانون i، Ci میانگین هزینهی قانون (میانگین مدت زمان لازم برای رسیدن به هدف)، G پارامتر مقدار هدف (که معمولا بر حسب واحدهای زمانی اندازهگیری میشود) و ξ(σ^2) مقدار پیشبینی شده برای نویز هدف میباشد. ξ(σ^2) یک عدد تصادفی است که از یک توزیع نرمال با میانگین صفر و واریانس σ^2 بدست میآید. این روش رفع ناسازگاری، مشخصههای حل مسئله توسط انسان مانند احتمال تطبیق و تاثیر انتخاب را مدل میکند. در حقیقت، سودمندی، تابعی از احتمال موفقیت و مقدار هدف میباشد.
نویز ξ در رفع ناسازگاری، کاندید مناسبی برای مدلسازی سطوح مختلف خبرگی است. بررسیهای صورت گرفته [3] نشان میدهد که با افزایش واریانس نویز σ^2، یک مدل حل مسئلهی خبره ممکن است مانند یک مدل حل مسئلهی بیتجربه رفتار کند.
همچنین در تحقیقات دیگری [4]، این پیشنهاد مطرح شده است که این واریانس نویز باید عدم قطعیت یک موفقیت را دنبال کند و تغییرات آن میتواند نقش مهمی را در بهینهسازی رفتار انتخاب بازی کند. علاوه بر این نشان داده شده که اگر مقدار هدف G، به صورت پویا کنترل گردد، میتواند هزینهی تلاشها را بهینه سازد [5].
در حقیقت، نویز و مقدار هدف به ترتیب عرض و عمق جستجو برای یافتن یک راهحل را کنترل میکنند. برای پی بردن به علت نیاز به داشتن احتمال موفقیت P و مقدار هدف G و هزینه C، فرض کنید که هزینهی رسیدن به هدف (C)، یک متغیر تصادفی باشد و P(C) احتمال آنکه هدف با هزینهی C بدست آید (احتمال آنکه هزینه دقیقاً برابر با C باشد). در این صورت امید ریاضی هزینه برابر است:
E(C)=∑_C▒〖C P(C)〗 (E{t}= ∫_0^∞▒tP(t)dt)
تابع توزیع P(C)برابر است با احتمال موفقیت برای هر هزینهایی. دانش توابع توزیع P(C) برای تصمیمات مختلف، این امکان را برای حلکنندهی مسئله فراهم میسازد تا هزینههای پیشبینی شده E(C) را محاسبه و بهترین قانون (استراتژی) را برای حل مسئله انتخاب نماید.
البته مشکل در این موقعیت، در حل مسئله برای اولین بار و نداشتن هیچگونه اطلاعاتی در زمینهی P(C) میباشد. تنها راه ممکن برای تعیین این توزیعها، سعی در حل مسئله با استفاده از استراتژیهای گوناگون میباشد. در این صورت سوالی که مطرح میشود این است که کی یک استراتژی را رها کنیم و به سراغ استراتژی دیگری برویم. این ویژگی، یعنی توانایی رهاکردن راهحلهایی با امید کمتر برای حل مسئله بدون اینکه آنها را به طور کامل بررسی کنیم (بدون آنکه آنها را تا انتها پیش ببریم)، یکی از ویژگیهای انسان در حل مسئله است. در بهبودی که بر این روش مطرح شده، به این سوال پاسخ داده شده است. بخش 2-4 به شرح این شیوهی بهبود یافته میپردازد.
رفع ناسازگاری با استفاده از هزینههای تخمین زده شدهی تصادفی
یکی از مهمترین مشخصههای الگوریتمی که در بهبود روش قبلی مطرح شده [2]، این است که دقیقاً مشخص میسازد که یک راهحل تا چه عمقی بررسی گردد.
برای توضیح این روش رفع ناسازگاری، ابتدا حل مسئله به عنوان مشاهدهایی19 از یک روند پواسن شرح داده میشود. فرض کنید که یک کامپیوتر تعدادی مسئله را با استفاده از یک الگوریتم مشخص حل میکند و هر بار پس از دستیابی به حالت هدف، کامپیوتر دوباره راه اندازی شده20 و مجدداً به حل مسئله میپردازد. حال اگر امید ریاضی هزینه یا هزینهی مورد انتظار راهحلی که کامپیوتر از آن استفاده میکند برابر با E{C} باشد، آنگاه ما حالت هدف را هر E{C} ثانیه و یا با نرخ λ=1/(E{C}) مشاهده خواهیم کرد که در این صورت میتوان رویداد حالت هدف را تحت یک روند پواسن بررسی نمود. در نتیجه احتمال مشاهدهی n رویداد در مدت زمان t برابر است با:
P(n|λ)= (λt)^n/n! e^(-λt) , n=0, 1, 2, … .
که در این رابطه λ نرخ مقدار میانگین21 نامیده میشود و برابر است با 1/(E{C}) ،
و n تعداد مشاهدات رویداد تا زمان t میباشد (n=0, 1, 2, …).
شکل2-1. یک کامپیوتر که یک الگوریتم را در یک حلقه اجرا میکند. وضعیت هدف با نرخ λ=1/(E{C}) مشاهده میگردد که E{C} امید ریاضی هزینه (هزینهی مورد انتظار) میباشد.
برطبق رابطهی (2-3)، هنگامی که λ=0 (یا E{C}= ∞) باشد، احتمال برای هر t، برابر با صفر خواهد بود که متناظر است با حالتی که رویداد غیرممکن باشد. بنابراین، برای اینکه یک رویداد امکانپذیر باشد، باید λ>0 (یا E{C}< ∞). از اینرو در حل یک مسئله با یک نگاه خوشبینانه که فرض بر ممکن بودن حالت هدف است، داریم:
∃G<∞ :E{C}≤G
حال به بررسی برخی از موارد خاص از احتمال پواسن (رابطهی (2-3)) میپردازیم:
احتمال شکست22: احتمال اینکه رویداد رخ ندهد (n=0)، که برطبق رابطهی (2-3) این احتمال برابر است با: q(t)=P(n=0)=e^(-λt)
این تابع به صورت یک منحنی نزولی با خط تیره در شکل 2-2 نشان داده شده است.
احتمال موفقیت23: احتمال اینکه رویداد حداقل یکبار رخ دهد (n>0):
p(t)=P(n>0)=〖1-q(t)=1-e〗^(-λt)
این تابع به صورت یک منحنی با خط تیره در شکل 2-2 نشان داده شده است. این نمودار در صورتی که λ>0 با زمان افزایش مییابد.
هنگامی که یک مسئله مخصوصاً برای اولین بار حل میشود، آنچه که در این روش مد نظر است اولین رخداد حالت هدف میباشد. بعلاوه، در اغلب موارد نیازی به حل مجدد مسئلهایی دقیقاً مانند مسئلهی قبل نیست. بنابراین، در این روش، مطلوب، احتمال اولین موفقیت میباشد.
احتمال اولین موفقیت: احتمال آنکه رویداد، دقیقاً یکبار رخ دهد (n>0) که برابر است با:
p_1 (t)=P(n=1)=〖λte〗^(-λt)
این تابع به صورت یک منحنی با خط پیوسته در شکل 2-2 نشان داده شده است. این منحنی تا هنگامی که به یک مقدار بیشینه قطعی برسد، برحسب زمان افزایش و پس از آن کاهش مییابد.
شکل2-2. احتمال شکست q(t) که با زمان کاهش مییابد، احتمال موفقیت p(t) که با زمان افزایش مییابد و احتمال اولین موفقیت p_1 (t) که دارای یک مقدار بیشینهی یکتا در t= 1/λ=E{C}میباشد.
برای بدست آوردن زمان24 متناظر با مقدار بیشینهی احتمال اولین موفقیت، داریم:
(p_1 ) ̇(t)= d/dt λte^(-λt)=0 => t=1/λ
این مقدار متناظر است با امید ریاضی هزینه E{C}. در این نقطه احتمال اولین موفقیت برابر است با احتمال شکست:
p_1 (t)= q(t)=e^(-1) , t=1/λ
همانطور که مشاهده میشود برای یک سیستم با دو خروجی (اولین موفقیت و متمم آن)، این زمان متناظر با هنگام بیشترین بینظمی است و در نتیجه بهترین زمان برای بدست آوردن یک تخمین جدید برای λ با استفاده از اطلاعات جدید میباشد. اگر این تخمین جدید بسیار بزرگتر از مقدار مورد انتظار، از کار در آید، ممکن است زمان بهینه برای تغییر استراتژی و یا رها کردن نیز باشد.
تخمین امید ریاضی هزینه
در واقعیت، در هنگام حل یک مسئله، نرخ λ مجهول است و آنچه که ما سعی در تخمین آن داریم، امید ریاضی هزینه یا هزینهی مورد انتظار میباشد. در این موقعیت، تعداد موفقیتها n و نیز مقدار زمان (یا هزینهی) سپری شده، معلوم هستند. حال برای تخمین نرخ λ (و در ادامه E(λ))، با فرض اینکه n تعداد موفقیتها پس از سپری شدن زمان t باشد، میتوان از احتمال پسین25 P(λ|n) که از طریق فرمول بیز قابل محاسبه است، استفاده نمود:
P(λ│n)= P(n,λ)/P(n) =(P(n│λ)P(λ))/P(n)
هنگامی که احتمال پیشین تمامی مقادیر λ مساوی باشد، آنگاه احتمال درستنمایی26 با استفاده از توزیع پواسن (رابطهی 2-3) شرح داده میشود و احتمال پسین میتواند از طریق درستنمایی بدست آید:
P(λ│n)=tP(n│λ)
حال با استفاده از رابطهی فوق برای احتمال پسین، میتوان برآورد میانگین پسین λ را محاسبه نمود:
E(λ)= ∫_0^∞▒〖λP(λ│n)dλ= (n+1)/t〗
و بنابراین E(C)≈ t/(n+1).
این برآورد به سمت موفقیتها اریب27 بوده (خوشبینانه) و نسبت به برآورد 1/n مفیدتر است زیرا میتواند حتی هنگامی که هیچ موفقیتی هنوز مشاهده نشده است(n=0) نیز بکار رود. به همین دلیل الگوریتم خوشبین28 نامیده میشود.
برآورد بازگشتی
برای روشنتر شدن موضوع، مثال حل مسئله توسط یک کامپیوتر (شکل 2-1) را در نظر بگیرید، اما با یک تفاوت، امید ریاضی هزینه E(C) نامعلوم باشد.
هدف، راهاندازی مجدد کامپیوتر به گونهایی است که حالت هدف با بیشترین نرخ ممکن ظاهر گردد. فرض کنید ∆t فاصلهی زمانی باشد که پس از آن کامپیوتر راهاندازی مجدد میشود. اگر کامپیوتر بسیار دیر راهاندازی مجدد شود ∆t>E{C}، آنگاه واضح است که نرخ وقوع حالت هدف بالاترین حد ممکن نخواهد بود. از طرف دیگر، اگر کامپیوتر بسیار زود راهاندازی مجدد شود ∆t<E{C}، آنگاه در اغلب موارد کامپیوتر، زمان لازم برای اتمام حل مسئله را نخواهد داشت. فرض کنید در یک دنباله از آزمایشات، اولین رویداد حالت هدف در فواصل زمانی ∆t ثبت گردد، در این صورت اگر حالت هدف ثبت شده باشد، کامپیوتر باید پس از آن به سرعت راهاندازی مجدد گردد و در غیر این صورت، پس از ∆t مجدداً راهاندازی شود. همانطور که مشاهده میشود، این آزمایشات تنها دو خروجی ممکن خواهد داشت (آزمایشات دو جملهایی29):
شکست: حالتی که در آن حالت هدف هنوز بدست نیامده و تعداد موفقیتها n تغییر نیافته است، که در این صورت کل تلاش (زمان) سپری شده با C=∆t، افزایش خواهد یافت.
موفقیت: حالتی که در آن حالت هدف بدست آمده و تعداد موفقیتها n یک واحد افزایش یافته است، که در این صورت کل تلاش (زمان) سپری شده با C≤∆t، افزایش خواهد یافت.
با شمارش تعداد موفقیتها n و مجموعگیری از زمان سپری شده در k آزمایش t=C_0+…+C_k، میتوان برآوردی از امید ریاضی هزینه E{C} با استفاده از فرمول میانگین پسین بدست آورد:
E(C)≈C ̅= t/(n+1)
رفع ناسازگاری

در بخش قبل، توضیحاتی در رابطه با بدست آوردن برآوررد هزینهی یک استراتژی مشخص (الگوریتم، تصمیم و یا قانون) با استفاده از تخمین نرخ یک روند پواسن فرضی ارائه و برای شرح بیشتر موضوع مثالی از یک کامپیوتر که به منظور حل یک مسئله، در یک حلقهی بیپایان قرار دارد (شکل 2-1) مطرح گردید. در یک روند مشابه میتوان یک ناسازگاری را به صورت زیر توصیف نمود: یک انتخاب از میان تعداد بسیاری کامپیوتر مانند کامپیوتر مثال فوق که سعی در حل مسئلهی همسانی دارند، اما تنها با استفاده از یک کامپیوتر در یک زمان.
اگر گزینه30ها (انتخاب کامپیوترها، استراتژیها و یا قوانین) را با x نشان دهیم، با فرض اینکه هر کامپیوتر از یک الگوریتم متفاوت با هزینهی پیشبینی شدهی E{C(x)} متفاوت استفاده میکند، آنگاه هدف، یافتن سریعترین (کمهزینهترین) x خواهد بود. برای هر گزینهی x اطلاعات زیر ثبت میشود:
k(x) – تعداد دفعاتی که x بکار برده شده است
n(x) – تعداد موفقیتها برای x
t(x)=C_0 (x)+…+C_k(x) (x)– تلاشها (زمانها)یی که با استفاده از x سپری شده است
پس از استفاده از هر گزینه میتوان برآوردی از امید ریاضی آن را با استفاده از رابطهی 2-13 (E(C(x))≈C ̅(x)) محاسبه نمود. به منظور رفع ناسازگاری ابتدا یک برآورد هزینهی تصادفی معرفی میشود:
C ̃(x)=(k(x) C ̅(x)+ξ(C ̅(x)))/(k(x)+1)
که در این رابطه، ξ(C ̅(x)) یک “پیشبینی تصادفی” نامیده میشود و یک متغیر تصادفی است که بگونهایی تعریف شده که مقدار امید ریاضی آن برابر با هزینهی تخمین زده شده C ̅(x) میباشد (E{ξ}=C ̃(x)). به عنوان مثال میتوان از تابع زیر استفاده نمود:
ξ(C(x))=rand∈(0,2C ̅(x))
ناسازگاری با انتخاب یک گزینهی x با کمترین هزینهی تخمینزده شدهی تصادفی، رفع میگردد:
x=arg⁡min[C ̃(x)]
الگوریتم خوشبین در دو برنامهی کاربردی مورد بررسی قرار گرفته است:
در یک سیستم با ساختاری با یک ویژگی افزوده شده نسبت به ساختار ACT-R که در آن مکانیزم رفع ناسازگاری با این الگوریتم جایگزین شده است [5].
در یک برنامهی جستجوی نمایشی [2].
که هر دو آنها با زبان Lisp پیادهسازی شدهاند.
رفع ناسازگاری با استفاده از برنامهنویسی خطی
در این مدل، تابع هدف به صورت یک تابع خطی از متغیرهای تصمیم در نظر گرفته میشود که این متغیرها به وسیلهی عاملهای مختلف موجود در مسئله فراهم میگردد. صورت کلی این تابع به صورت f(x)=c_1 x_1+c_2 x_2+…+c_n x_nمیباشد که x_1,x_2,…,x_n متغیرهای تصمیم و c_1,c_2,…,c_n ضرایب هستند. یک مثال برای این روش، نحوهی عملکرد یک شرکت صنعتی است، هدف این شرکت ماکزیمم نمودن سود کلی است. در این مورد x_1,x_2,…,x_n ممکن است نشاندهندهی کمیتهای محصولهای متفاوت شرکت و c_1,c_2,…,c_n سود واحد هر محصول از این شرکت باشد. هر عامل در این محیط میتواند به صورت یک واحد از شرکت در نظر گرفته شود و هر یک از این واحدها ممکن است دید متفاوتی از سود کلی شرکت داشته باشند. در صورتی که ضرایب، ثابت در نظر گرفته شود، ماکزیمم سود، تنها به مقادیر متغیرهای تصمیم بستگی خواهد داشت. حال اگر بیش از یک مجموعه از مقادیر برای هدف وجود داشته باشد، در تعیین مقدار هر محصول، ناسازگاری روی خواهد داد. در این صورت به عامل دیگری در محیط برای رفع ناسازگاری نیاز است. این عامل میتواند با محاسبهی تابع هدف برای مقادیر مختلف متغیرهای تصمیم و مقایسهی آنها، مسئله را حل کند [6].
مدل برنامهنویسی خطی دارای مزایای زیر است:
سادگی: برنامهنویسی خطی بر تئوری معادله مبتنی است و تنها از یک معادله با توان 1 استفاده میکند.
شفافیت: در معادلهی هدف، متغیرهای تصمیم و ارتباط میان آنها بیان میگردد، درنتیجه شناسایی ارتباط بین این متغیرها از طریق این معادله کار سادهایی است.
قابلیت بسط: تعداد عاملهای محیط میتواند بسیار زیاد باشد و عامل رفع ناسازگاری میتواند مسئله را بین آنها حل کند.
سلسله مراتب: مشابه با قابلیت بسط، هر عامل میتواند یک زیرهدف داشته باشد که آن نیز میتواند با برنامهنویسی خطی شرح داده شود.
صحت: این مدل بر تئوریهای کمی مبتنی است و از آنجا که تئوریهای کمی بسیار شفاف و قطعی هستند، اگر یک مدل بتواند با تئوریهای کمی شرح داده شود، قابل اثبات خواهد بود.
معایب برنامهنویسی خطی شامل موارد زیر است:
در عمل، یافتن معادلات محدودیت به صورت متغیرهای تصمیم کار مشکلی است.
برنامهنویسی خطی نمیتواند مسائل مبهم را بپوشاند، به عنوان مثال، اگر متغیرهای تصمیم با احتمالاتی، مقادیری را دریافت کنند، نمایش این احتمالات با استفاده از تابع هدف برنامهنویسی خطی امکانپذیر نیست.
رفع ناسازگاری با استفاده از تئوری بازی
در این مدل، عاملهای موجود در محیط با یکدیگر رقابت و راهحلهایی را برای مقادیر متغیرهای تصمیم برای عامل رفع ناسازگاری فراهم میکنند و این عامل یک راهحل را از میان آنها انتخاب میکند. هنگامی که دو عامل، مقادیر راهحل خود را محاسبه کردند، میتوانند از یک روش همکاری برای مبادلهی دانش خود استفاده کنند. عامل رفع ناسازگاری یک جدول تصمیم را بر طبق قوانین تئوری بازی تنظیم و با توجه به آن، تعیین میکند که چه راهحلی اتخاذ گردد. به عنوان مثال شرکتی را در نظر بگیرید که به دنبال بیشترین سود خود است. فرض کنید دو عامل در این محیط حضور دارند که هر یک دارای دو گزینه بوده و به دنبال بیشترین سود برای شرکت و بیشترین سود برای خود میباشند، از اینرو گزینهای که یک عامل انتخاب میکند، ممکن است با گزینهای که عامل دیگر انتخاب میکند، ناسازگار باشد. در این صورت به عاملی نیاز است که این ناسازگاری را رفع سازد [6].
برای تئوری بازی حداقل دو مزیت وجود دارد:
تئوری بازی بر این فرض مبتنی است که گیرندهی تصمیم، خود یک تصمیم منطقی اتخاذ میکند. این فرض باید در هر نوعی از تئوری تصمیم گیری وجود داشته باشد.

دسته بندی : پایان نامه

پاسخ دهید