پايان نامه بررسي قوانين انجمني در داده کاوي توزيع شده و ارائه مدلي مبتني بر سيستم‌هاي چند عامله براي آن

تحقیق و پروژه و پایان نامه و مقاله دانشجویی

پايان نامه بررسي قوانين انجمني در داده کاوي توزيع شده و ارائه مدلي مبتني بر سيستم‌هاي چند عامله براي آن یکی از پایان نامه و تحقیق های جامع و کامل و دارای منابع معتبر می باشد این پایان نامه دارای 107 صفحه به صورت فایل ورد و قابل ویرایش می باشد که جهت دریافت و دانلود متن کامل پايان نامه بررسي قوانين انجمني در داده کاوي توزيع شده و ارائه مدلي مبتني بر سيستم‌هاي چند عامله براي آن بر روی گزینه خرید انتهای ایمیل کلیک نمائید پس از وارد نمودن اطلاعات مربوطه و پرداخت قادر به دانلود متن کامل پایان نامه مربوطه می باشد همچنین لینک پایان نامه همان لحظه به ایمیل شما ارسال می گردد.

فهرست مطالب

فصل اول مقدمه و کلیات تحقیق 1
1-1- مقدمه 2
1-2- تعریف مسأله و سوالات اصلی تحقیق 2
1-3- اهمیت و ضرورت انجام تحقیق 3
1-4- اهداف اساسی از انجام تحقیق 3
1-4-1- هدف اصلی 3
1-4-2- اهداف فرعی 3
1-5- پرسش‌های تحقیق 4
1-5-1- پرسش اصلی 4
1-5-2- پرسش‌های فرعی 4
1-6- فرضیه‌ها 4
1-7- روش تحقیق 4
1-8- جنبه‌های نوآوری 5
1-9- مراحل انجام تحقیق 5
1-10- ساختار پایاننامه 5
فصل دوم ادبیات و پیشینه تحقیق 6
2-1- مقدمه 7
2-2- داده‌کاوی 7
2-2-1- خوشه‌بندی 8
2-2-1-1- روشهای تقسيمبندی 8
2-2-1-2- روشهای سلسله مراتبی 8
2-2-1-3- روشهای مبتنی بر چگالی 9
2-2-2- طبقه‌بندی 9
2-2-2-1- طبقه‌بندی مبتنی بر قواعد 10
2-2-3- کشف قواعد انجمنی 12
2-2-3-1- تعاریف و مفاهیم اصلی در قواعد انجمنی 12
2-2-3-1-1- تقسیم بندی قواعد انجمنی 14
2-2-3-1-2- استخراج قواعد تک‌سطحی تک بعدی دودویی 14
2-2-3-1-2-1- مرحله پیوست 16
2-2-3-1-2-2- مرحله هرس 17
2-2-3-1-3- محاسبه اطمینان و استخراج قواعد نهایی 17
2-3- داده‌کاوی توزيع شده 17
2-4- عاملها و سيستمهای چندعامله 18
2-4-1- عامل 19
2-4-1-1- مقايسه عامل با شیء 20
2-4-1-2- معماری عاملها 23
2-4-1-2-1- معماری BDI 24
2-4-2- سيستم‌های چندعامله 25
2-4-2-1- مذاکره 28
2-5- بهره‌گيری از عامل برای داده‌کاوی 30
2-5-1- سيستم‌های چندعامله، بستری برای داده‌کاوی توزيع شده 30
2-6- مروری بر کارهای انجام شده 32
2-6-1- داده‌کاوی توزيع شده 33
2-6-2- کارهای مهم انجام شده در زمينه داده‌کاوی با استفاده از عامل 36
2-7- جمع‌بندی 39
فصل سوم روش تحقیق 40
3-1- مقدمه 41
3-2- داده‌کاوی توزیع شده 41
3-2-1- گروه‌بندی مدل‌های داده‌کاوی توزیع شده 42
3-2-2- مشکلات داده‌کاوی توزیع شده 43
3-2-2-1- افزونگی داده 43
3-2-2-2- تغییرات پویای محیط 43
3-2-2-3- سربار ارتباطات 44
3-2-2-4- مشکلات داده‌کاوی توزیع شده به روش سنتی 44
3-3- عامل‌ها و داده‌کاوی 44
3-3-1- حوزه کاوش عامل 46
3-3-2- داده‌کاوی برپایه‌ی عامل 48
3-3-3- مزیت بهره‌گیری از عامل‌ها در داده‌کاوی 50
3-3-3-1- زیرساخت داده‌کاوی سازمانی 51
3-3-3-2- بکارگیری هوشمندی انسان و دامنه 51
3-3-3-3- پشتیبانی از کاوش توزیع شده و موازی 51
3-3-3-4- پیش پردازش داده 52
3-3-3-5- یادگیری سازگار 52
3-3-3-6- کاوش تعاملی 52
3-3-4- داده‌کاوی توزیع شده برپایه‌ی عامل‌ها 53
3-3-4-1- چالش‌های داده‌کاوی توزیع شده 53
3-3-5- مزیت بهره‌گیری از عامل‌ها در داده‌کاوی توزیع شده 55
3-3-5-1- ایزوله بودن منابع داده 55
3-3-5-2- پویایی منابع داده و دستگاه‌های محاسباتی 55
3-3-5-3- داده‌کاوی توزیع شده‌ی تعاملی 56
3-3-5-4- انتخاب منابع و جمع‌اوری داده پویا 56
3-3-5-5- محدودیت‌های زمانی در منابع داده توزیع شده 56
3-3-5-6- داده‌کاوی توزیع شده با چند استراتژی 56
3-3-5-7- داده‌کاوی توزیع شده‌ی مشارکتی 56
3-3-5-8- پوشیدگی داده‌های منبع 56
3-3-5-9- محدودیت‌های سازمانی در منابع داده توزیع شده 57
3-4- الگوریتم‌های کشف قوانین انجمنی 57
3-4-1- الگوریتم AIS 57
3-4-2- الگوریتم SETM 58
3-4-3- الگوریتم Apriori یا پیشینار 58
3-4-4- الگوریتم AprioriTid 60
3-5- جمع‌بندی 61
فصل چهارم محاسبات و یافته‌های تحقیق 62
4-1- مقدمه 63
4-2- معماری پیشنهادی برای داده کاوی توزیع شده برپایه‌ی سیستم‌های چند عامله 66
4-2-1- معماری چهار لایه‌ی پیشنهادی 66
4-2-1-1- لایه‌ی اول، لایه‌ی کاربر 66
4-2-1-2- لایه‌ی دوم، لایه‌ی مدیریت 67
4-2-1-3- لایه‌ی سوم، لایه پردازش 68
4-2-1-4- لایه‌ی چهارم، لایه‌ی منابع 69
4-3- مطالعه موردی 71
4-3-1- تحلیل عملکرد الگوریتم‌های کشف قوانین انجمنی 71
4-3-2- F-Trade: یک سیستم کاوش عامل برای سرویس‌های مالی 75
4-3-3- داده‌کاوی چند منبع بر پایه‌ی عامل 77
4-3-4- کاوش الگوی رفتار سازگار بر پایه‌ی عامل توسط HMM 81
4-3-4-1- چارچوب سیستم 81
4-3-4-2- مدلسازی عامل 83
4-4- جمع‌بندی 84
فصل پنجم نتیجه‌گیری و پیشنهادات 86
5-1- مقدمه 87
5-2- خلاصه تحقیق 87
5-3- پیشنهادات برای کارهای آتی 87
پیوست منابع و مآخذ 89

منابع و مآخذ

[1]     Wang J., Data mining: opportunities and challenges: Irm Press, 2003.

[2]     Rao V.S., Vidyavathi S., “Distributed Data Mining and Mining Multi-Agent Data,” IJCSE) International Journal on Computer Science and Engineering, vol. 2, pp. 1237-1244, 2010.

[3]     Chen M.S., Han J., Yu P.S., “Data mining: an overview from a database perspective,” Knowledge and Data Engineering, IEEE Transactions on, vol. 8, pp. 866-883, 1996.

[4]     Han J., Kamber M., “Data mining: Concepts and Techniques, 2nd Edition,” San Francisco, CA, itd: Morgan Kaufmann, 2005.

[5]     Grossman R., Kasif S., Moore R., Rocke D., Ullman J., “Data mining research: Opportunities and challenges,” presented at the A Report of Three Workshops on Mining Large, Massive and Distributed Data, 1999.

[6]     Mitchell T.M., “Machine learning. 1997,” Burr Ridge, IL: McGraw Hill, 1997.

[7]     Bing L., Wynne H., Yiming M., “Integrating classification and association rule mining,” in KDD, New York City, New York, USA., 1998, pp. 80-86.

[8]     Bing L., Yiming M., Ching  Kian W., “Improving an association rule based classifier,” Principles of Data Mining and Knowledge Discovery, pp. 293-317, 2000.

[9]     Kargupta H., Joshi A., Sivakumar K., Yesha Y., Data mining: Next generation challenges and future directions: AAAI Press, 2004.

[10]   Weiss G., Multiagent systems: a modern approach to distributed artificial intelligence: The MIT press, 1999.

[11]   Sycara K.P., “Multi-agent Systems,” AI magazine, Intelligent Agents, vol. 19, pp. 79-92, 1998.

[12]   Chira C., “Software agents,” IDIMS Report, February, vol. 21, 2003.

[13]   Odell J., “Agents: Technology and usage (Part 1),” Executive Report, vol. 3, 2000.

[14]   Wooldridge M., Jennings N.R., “Intelligent agents: Theory and practice,” Knowledge engineering review, vol. 10, pp. 115-152, 1995.

[15]   Wooldridge M., “Agent-based computing,” Interoperable Communication Networks, vol. 1, pp. 71-98, 1998.

[16]   Jennings N.R., Norman T.J., Faratin P., “ADEPT: an agent-based approach to business process management,” ACM Sigmod Record, vol. 27, pp. 32-39, 1998.

[17]   Etzioni O., Weld D.S., “Intelligent agents on the internet: Fact, fiction, and forecast,” IEEE expert, vol. 10, pp. 44-49, 1995.

[18]   Horn E., Kupries M., Reinke T., “Properties and models of software agents and prefabrication for agent application systems,” 1999, p. 10 pp.

[19]   Bradshaw J.M., “An introduction to software agents,” Software agents, vol. 5, pp. 3-46, 1997.

[20]   Bratman M., “Intentions, Plans and Practical Reason,” ed: Harvard University Press, Cambridge, MA, 1987.

[21]   Bratman M.E., Israel D.J., Pollack M.E., “Plans and resource‐bounded practical reasoning,” Computational intelligence, vol. 4, pp. 349-355, 1988.

[22]   Jennings N.R., Sycara K., Wooldridge M., “A roadmap of agent research and development,” Autonomous agents and multi-agent systems, vol. 1, pp. 7-38, 1998.

[23]   Jennings N.R., “On agent-based software engineering,” Artificial intelligence, vol. 117, pp. 277-296, 2000.

[24]   Newell A., “The knowledge level,” Artificial intelligence, vol. 18, pp. 87-127, 1982.

[25]   Bussmann S., Mueller J., “A negotiation framework for cooperating agents,” 1992 Proceedings of the Special Interest Group on Cooperating KnowledgeBased Systems, pp. 1-17, 1993.

[26]   Wooldridge M.J., An introduction to multiagent systems: Wiley, 2009.

[27]   Zhang C., Zhang Z., Cao L., “Agents and data mining: mutual enhancement by integration,” Autonomous Intelligent Systems: Agents and Data Mining, pp. 259-275, 2005.

[28]   Cao L., Data mining and multi-agent integration: Springer, 2009.

[29]   Cao L., Gorodetsky V., Liu J., Weiss G., “Agents and data mining interaction: 4th international workshop on agents and data mining interaction,” in ADMI 2009, Budapest, Hungary, 2009, pp. 23-35.

[30]   Cao L., Gorodetsky V., Mitkas P.A., “Guest Editors’ Introduction: Agents and Data Mining,” Intelligent Systems, IEEE, vol. 24, pp. 14-15, 2009.

[31]   Grossman R., “A top-ten list for data mining,” SIAM News, vol. 34, 2001.

[32]   Park B., Kargupta H., Distributed data mining: algorithms, systems, and applications: Y. Nong, 2002.

[33]   Bhaduri K., Das K., Liu K., Kargupta H., Ryan J., “Distributed Data Mining Bibliography,” Distributed Data Mining Bibliography, 2011.

[34]   Stolfo S., Prodromidis A.L., Tselepis S., Lee W., Fan D.W., Chan P.K., “JAM: Java agents for meta-learning over distributed databases,” 1997, pp. 74-81.

[35]   Luo P., Xiong H., Lu K., Shi Z., “Distributed classification in peer-to-peer networks,” 2007, pp. 968-976.

[36]   Aoun-Allah M., Mineau G., “Distributed data mining: why do more than aggregating models,” 2007, pp. 2645-2650.

[37]   Datta S., Giannella C., Kargupta H., K-Means Clustering Over a Large, Dynamic Network,” in 2006 SIAM Conference on Data Mining, 2006.

[38]   Gionis A., Mannila H., Tsaparas P., “Clustering aggregation,” in 21st ICDE Conference, 2005, pp. 341-352.

[39]   Chen B.C., Chen L., Lin Y., Ramakrishnan R., “Prediction cubes,” in 31st VLDB Conference, Norway, 2005, pp. 982-993.

[40]   Gray J., Bosworth A., Layman A., Pirahesh H., “Datacube: A relational aggregation operator generalizing group-by, cross-tab, and sub-totals,” in 12th ICDE Conference, 1996, pp. 152-159.

[41]   Agrawal R., Srikant R., “Fast algorithms for mining association rules,” in VLDB Conferences, Santiago, Chile, 1994, pp. 487-499.

[42]   Ashrafi M.Z., Taniar D., Smith K., “ODAM: An optimized distributed association rule mining algorithm,” Distributed Systems Online, IEEE, vol. 5, 2004.

[43]   Cheung D.W., Ng V.T., Fu A.W., Fu Y., “Efficient mining of association rules in distributed databases,” IEEE Transactions on Knowledge and Data Engineering, vol. 8, pp. 911-922, 1996.

[44]   Han J., Pei J., Yin Y. , “Mining frequent patterns without candidate generation,” in ACM SIGMOD, 2000, pp. 1-12.

[45]   Manjhi A., Shkapenyuk V., Dhamdhere K., Olston C., “Finding (recently) frequent items in distributed data streams,” in ICDE Conference, 2005, pp. 767-778.

[46]   Sun J., Papadimitriou S., Faloutsos C., “Distributed pattern discovery in multiple streams,” Advances in Knowledge Discovery and Data Mining, pp. 713-718, 2006.

[47]   Li T., Ogihara M., Zhu S., “Association-based similarity testing and its applications,” Intelligent Data Analysis, vol. 7, pp. 209-232, 2003.

[48]   Webb G.I., Butler S., Newlands D., “On detecting differences between groups,” in 9th ACM SIGKDD Conference, 2003, pp. 256-265.

[49]   Bailey S., Grossman R., Sivakumar H., Turinsky A., “Papyrus: a system for data mining over local and wide area clusters and super-clusters,” 1999, p. 63.

[50]   Schuster A., Wolff R., “Communication-efficient distributed mining of association rules,” Data Mining and Knowledge Discovery, vol. 8, pp. 171-196, 2004.

[51]   Schuster A., Wolff R., Gilburd B., “Privacy-preserving association rule mining in large-scale distributed systems,” 2004, pp. 411-418.

[52]   Bala J., Baik S., Hadjarian A., Gogia B.K., Manthorne C., “Application of a distributed data mining approach to network intrusion detection,” 2002, pp. 1419-1420.

[53]   Stolfo S.J., Fan W., Lee W., Prodromidis A., Chan P.K., “Cost-based modeling for fraud and intrusion detection: Results from the JAM project,” 2000, pp. 130-144 vol. 2.

[54]   Fujibuchi W., Kato T., “Classification of heterogeneous microarray data by maximum entropy kernel,” BMC bioinformatics, vol. 8, p. 267, 2007.

[55]   Merugu S., Ghosh J., “A distributed learning framework for heterogeneous data sources,” in The 11th ACM KDD Conference, 2005, pp. 208-217.

[56]   Kargupta H., Park B.H., Hershberger D., Johnson E., “Collective data mining: A new perspective toward distributed data analysis,” in Advances in Distributed and Parallel Knowledge Discovery, 1999.

[57]   Kantarcioglu M., Clifton C., “Privacy-Preserving Distributed Mining of Association Rules on Horizontally Partitioned Data,” in ACM SIGMOD Workshop on Research Issues on Data Mining and Knowledge Discovery (DMKD’02), 2002.

[58]   Qiu L., Li Y., Wu X., “Preserving privacy in association rule mining with bloom filters,” Journal of Intelligent Information Systems, vol. 29, pp. 253-278, 2007.

[59]   Yin X., Han J., Yang J., Yu P., “Crossmine: Efficient classification across multiple database relations,” Constraint-Based Mining and Inductive Databases, pp. 172-195, 2006.

[60]   Wang J., Zeng H., Chen Z., Lu H., Tao L., Ma W.Y., “ReCoM: reinforcement clustering of multi-type interrelated data objects,” in SIGIR Conference, 2003, pp. 274-281.

[61]   Agrawal R., Shafer J.C., “Parallel mining of association rules,” Knowledge and Data Engineering, IEEE Transactions on, vol. 8, pp. 962-969, 1996.

[62]   Han E.H., Karypis G., Kumar V., “Scalable parallel data mining for association rules,” in ACM SIGMOD Conference, 1997.

[63]   Li S., Wu T., Pottenger W.M., “Distributed higher order association rule mining using information extracted from textual data,” ACM SIGKDD Explorations Newsletter, vol. 7, pp. 26-35, 2005.

[64]   Otey M.E., Wang C., Parthasarathy S., Veloso A., Meira Jr W., “Mining frequent itemsets in distributed and dynamic databases,” in ICDM Conference, 2003, pp. 617-620.

[65]   Wu X., Zhang S., “Synthesizing high-frequency rules from different data sources,” Knowledge and Data Engineering, IEEE Transactions on, vol. 15, pp. 353-367, 2003.

[66]   Zaki M.J., “Parallel and distributed association mining: A survey,” Concurrency, IEEE, vol. 7, pp. 14-25, 1999.

[67]   Zhang S., Zaki M.J., “Mining multiple data sources: local pattern analysis,” Data Mining and Knowledge Discovery, vol. 12, pp. 121-125, 2006.

[68]   Buehrer G., Parthasarathy S., Tatikonda S., Kurc T., Saltz J., “Toward terabyte pattern mining: an architecture-conscious solution,” in 12th ACM SIGPLAN symposium on Principles and practice of parallel programming, 2007, pp. 2-12.

[69]   Han J., Pei J., Yin Y., “Mining frequent patterns without candidate generation,” in ACM SIGMOD Conf., 2000, pp. 1-12.

[70]   Zhang T., Ramakrishnan R., Livny M., “BIRCH: an efficient data clustering method for very large databases,” in ACM SIGMOD Conference, 1996, pp. 103-114.

[71]   Zhu X., Jin R., “Multiple information source cooperative learning,” in 21st International Joint Conference on Artificial Intelligence, 2009, pp. 1369–1376.

[72]   Parthasarathy S., Ogihara M., “Exploiting dataset similarity for distributed mining,” Parallel and Distributed Processing, pp. 399-406, 2000.

[73]   Bay S.D., Pazzani M.J., “Detecting group differences: Mining contrast sets,” Data Mining and Knowledge Discovery, vol. 5, pp. 213-246, 2001.

[74]   Dong G., Li J., “Efficient mining of emerging patterns: Discovering trends and differences,” in 5th ACM SIGKDD Conference, 1999, pp. 43-52.

[75]   Yang Y, Wu X., Zhu X., “Conceptual equivalence for contrast mining in classification learning,” Data & Knowledge Engineering, vol. 67, pp. 413-429, 2008.

[76]   Xu K., Liao S.S., Li J., Song Y., “Mining comparative opinions from customer reviews for Competitive Intelligence,” Decision support systems, vol. 50, pp. 743-754, 2011.

[77]   Ji X., Bailey J., Dong G., “Mining minimal distinguishing subsequence patterns with gap constraints,” in ICDM Conference, 2005, p. 8 pp.

[78]   Jin R., Agrawal G., “Systematic approach for optimizing complex mining tasks on multiple databases,” in ICDE Conference, 2006, pp. 17-17.

[79]   Bucila C., Gehrke J., Kifer D., White W., “Dualminer: A dual-pruning algorithm for itemsets with constraints,” Data Mining and Knowledge Discovery, vol. 7, pp. 241-272, 2003.

[80]   Tsur D., Ullman J.D., Abiteboul S., Clifton C., Motwani R., Nestorov S., Rosenthal A., “Query flocks: a generalization of association-rule mining,” ACM-SIGMOD Conference, vol. 27, pp. 1-12, 1998.

[81]   Zhu X., Wu X., “Discovering relational patterns across multiple databases,” in ICDE Conference, 2007, pp. 726-735.

[82]   Prodromidis A.L., Stolfo S.J., Tselepis S., Truta T., Sherwin J., Kalina D., “Distributed data mining: the JAM system architecture,” 2001.

[83]   Kargupta H., Hamzaoglu I., Stafford B., “PADMA: Parallel data mining agents for scalable text classification,” in High Performance Computing, 1997.

[84]   Da Silva J.C., Giannella C., Bhargava R., Kargupta H., Klusch M., “Distributed data mining and agents,” Engineering Applications of Artificial Intelligence, vol. 18, pp. 791-807, 2005.

[85]   Webb G.I., “Efficient search for association rules,” in Proceedings of the sixth ACM SIGKDD international conference on Knowledge discovery and data mining, 2000, pp. 99-107.

[86]   Paul S., “An optimized distributed association rule mining algorithm in parallel and distributed data mining with xml data for improved response time,” International Journal of Computer Science and Information Technology, vol. 2, 2010.

[87]   Prodromidis A.L., “Management of intelligent learning agents in distributed data mining systems,” Ph.D., School of Arts and Science, Columbia University, Columbia, 1999.

[88]   Zhu X., Li B., Wu X., He D., Zhang C., “CLAP: Collaborative pattern mining for distributed information systems,” Decision support systems, 2011.

[89]   Ogunde A., Folorunso O., Sodiya A., Ogunleye G., “A Review of Some Issues and Challenges in Current Agent-Based Distributed Association Rule Mining,” Asian Journal of Information Technology, vol. 10, pp. 84-95, 2011.

[90]   Cao L., Luo C., Zhang C., “Agent-mining interaction: an emerging area,” Autonomous Intelligent Systems: Multi-Agents and Data Mining, pp. 60-73, 2007.

[91]   Cao L., Luo D., Xiao Y., Zheng Z., “Agent collaboration for multiple trading strategy integration,” Agent and Multi-Agent Systems: Technologies and Applications, pp. 361-370, 2008.

[92]   Cao L., Yu P., Zhang C., Zhao Y., Domain driven data mining: Springer, 2010.

[93]   Rudowsky I., “Intelligent agents,” Communications of the Association for Information Systems, vol. 14, p. 275, 2004.

[94]   Albashiri K.A., Coenen F., Leng P., “EMADS: An extendible multi-agent data miner,” Knowledge-Based Systems, vol. 22, pp. 523-528, 2009.

[95]   Jie Y., “Research on Association Rules in Distributed Data Mining,” Energy Procedia, vol. 13, pp. 8575-8580, 2011.

چکیده

 امروزه با توجه به گسترش روز افزون اطلاعاتی که بشر با آنها سر و کار دارد، بهره‌گيری از روش‌هايی همچون داده‌کاوی برای استخراج دانش و اطلاعات نهفته در داده‌ها، امری غيرقابل اجتناب می‌باشد. یکی از مسائلی که امروزه در بحث داده‌کاوی مورد توجه قرار گرفته است، بحث توزیع‌شدگی ذاتی داده‌ها است. توسعه فناوری شبکه‌های کامپیوتری و تکنولوژی پایگاه داده توزیع شده، ذخیره سازی توزیع شده و نسل فنی جدیدی از داده کاوی توزیع شده را ترویج داده است. داده کاوی توزیع شده از محاسبات توزیع شده استفاده می‌کند، و دانش مورد نیاز کاربران را از پایگاه داده‌های توزیع شده استخراج می‌کند. این حوزه چشم‌انداز کاربردی گسترده‌ای دارد. سه هدف اصلی برای داده کاوی از سیستم‌های اطلاعاتی توزیع شده وجود دارد: 1) شناسایی الگوهای مهم محلی در پایگاه داده‌های مجزا، 2) ادغام الگوهای محلی و استخراج الگوهای کلی پس از یکپارچه شدن پایگاه داده‌های توزیع شده، و 3) شناسایی الگوهای رابطه‌ای خاص در مجموعه داده‌های مختلف.

با توجه به قابليت‌های عامل و سيستم‌های چندعامله و مناسب بودن آن‌ها برای محيط‌های توزيع شده به نظر می‌رسد که بتوان از قابليت‌های آنها برای داده‌کاوی در محيط‌های توزيع شده بهره برد. در اين تحقيق ما قصد داريم تا ضمن بررسی کارهای موجود در زمينه کاربرد عامل و سيستم‌های چندعامله در داده‌کاوی، بحث کاوش قوانین انجمنی در محیط‌های توزیع شده را مورد بررسی قرار دهیم. ما مساله خود را در دو فاز مورد بررسی قرار خواهيم داد. در فاز اول خصوصيت‌ها و قابلیت‌های يک عامل و مزایای ترکیب تکنولوژی چند عامله با داده‌کاوی توزیع شده مورد بررسی قرار خواهند گرفت، و در فاز دوم یک معماری برای داده‌کاوی در محیط‌های توزیع شده برپایه‌ی تکنولوژی چند عامله ارائه می‌دهیم. بطور کلی دستاورد اصلی اين تحقيق ارائه يک رويکرد مبتنی بر عامل برای مساله کاوش قوانین انجمنی با استفاده از قابليت‌های هدفگرايی، هوشمندی، يادگيری و استدلال است.

کلمات کلیدی: داده کاوی توزیع شده، سیستم چند عامله، قوانین انجمنی

-1- مقدمه

در این فصل به معرفی کلیات این پژوهش و ساختار آن می‌پردازیم. بدین منظور ابتدا به بیان تعریف مسئله، ضرورت، اهداف و پرسش‌های این تحقیق خواهیم پرداخت و در نهایت به تعریف واژه‌ها و اصطلاحات مورد استفاده در پایان نامه می‌پردازیم.

1-2- تعریف مسأله و سوالات اصلی تحقیق

امروزه با توجه به گسترش روز افزون اطلاعاتی که بشر با آن‌ها سر و کار دارد، بهره‌گيری از روش‌هايی همچون داده‌کاوی برای استخراج دانش و اطلاعات نهفته در داده‌ها، امری غيرقابل اجتناب می‌باشد. یکی از مسائلی که امروزه در بحث داده‌کاوی مورد توجه قرار گرفته است، بحث توزیع‌شدگی ذاتی داده‌ها است. توسعه فناوری شبکه‌های کامپیوتری و تکنولوژی پایگاه داده توزیع شده، ذخیره سازی توزیع شده و نسل فنی جدیدی از داده کاوی توزیع شده را ترویج داده است.

داده‌کاوی توزيع شده عبارت است از کشف نيمه خودکار الگوهای پنهان موجود در داده‌ها، در حالتی که داده‌ها و يا مکانيزم‌های استنتاج، به صورت توزيع شده باشند. غيرمتمرکز بودن داده‌ها بدان معناست که داده‌ها به صورت توزيع شده بين دو يا چند سايت بوده و هزينه انتقال تمام يا بخشی از داده‌ها به يک سايت مرکزی، قابل صرف‌نظر نباشد. توزيع شده بودن مکانيزم‌های استنتاج، به معنای لزوم لحاظ کردن هزينه ارتباط بين مکانيزم‌های مختلف در حال استخراج دانش می‌باشد. اين توزیع‌شدگی ممکن است به دلايل مختلفی از جمله ارائه شدن مکانيزم استخراج دانش در قالب يک سرويس اينترنتی و يا صرفاً ناشی از توزیع‌شدگی داده‌ها باشد. چنين رويکردی به داده‌کاوی، برخلاف جهت کلی تحقيقات انجام شده است که به طور عمده به تکنيک‌های متمرکز پرداخته و نه فقط بر تمرکز، که بر همگونی و ساختار مسطح (در مقابل ساختار رابطه‌ای) داده‌های هدف متکی می‌باشند. مسائلی نظير استخراج دانش در حالت عدم دسترسی به تمام داده‌های موجود، برقراری ارتباط موثر و بهينه با ساير مکانيزم‌های در حال استخراج دانش و نيز تبادل دانش يا اطلاعات ميانی به جای اطلاعات خام، فقط تعدادی از مسائل اوليه داده‌کاوی توزيع شده با توجه به تعريف آن می‌باشند. بنابراين، داده‌کاوی توزيع شده در عين حال که به عنوان راه حلی کليدی برای مشکلات اصلی پيش روی داده‌کاوی مطرح می‌باشد، خود سرمنشأ چالش‌ها و مسائل متعددی گرديده است؛ حل مؤثر اين مشکلات منجر به استفاده هرچه بيشتر از داده‌کاوی و ايجاد امکانات جديد و بهره‌برداری از پتانسيل‌های موجود در قلمروهائی خواهد شد که عليرغم نياز مبرم به داده‌کاوی، استفاده بسيار محدودی از آن به عمل می‌‌آورند.

1-3- اهمیت و ضرورت انجام تحقیق

داده کاوی توزیع شده از محاسبات توزیع شده استفاده می‌کند، و دانش مورد نیاز کاربران را از پایگاه داده‌های توزیع شده استخراج می‌کند. این حوزه چشم‌انداز کاربردی گسترده‌ای دارد. معمولاً پايگاه‌هايی که اين داده‌ها را ايجاد يا دريافت می‌کنند، متعلق به افراد حقيقی يا حقوقی هستند که هر کدام به دنبال اهداف و منافع خود می‌باشند و حاضر نيستند دانش خود را به طور رايگان در اختيار ديگران قرار دهند. سیستم داده کاوی توزیع شده چند عامله، نسبتاً یک حوزه تحقیقاتی جدید است. با تکنولوژی نوظهور هوش مصنوعی سازگار است، انعطاف پذیری و هوشمندی خاصی دارد، استفاده از منابع را بهبود بخشیده و پایداری سیستم را افزایش داده است. و لذا نتایج این تحقیق می‌تواند در عمل مورد استفاده قرار گیرد و به عنوان یک موضوع پژوهشی مورد توجه قرار گیرد.

1-4- اهداف اساسی از انجام تحقیق

در اینجا اهداف تحقیق را به دو دسته هدف اصلی و اهداف فرعی تقسیم می­کنیم: “هدف کلی”  که منظور همان موضوع تحقیق است که قصد مشخص نمودن آن‌را داریم و به عبارتی آنچه در پایان مطالعه قصد رسیدن بدان را داریم. “هدف کلی”  معمولاً در یک جمله قابل فهم صریح و رسا و مختصر بیان می‌شود که برای خواننده گویا و قابل فهم است. در گونه دوم “اهداف جزئی یا اختصاصی” تحقیق بیان می‌شود. این اهداف از تقسیم یا شکستن “هدف کلی”  به اجزای کوچک‌تر بدست می‌آیند. اهداف جزئی راه رسیدن به  “هدف کلی” را قدم به قدم مشخص  می­نمایند.

1-4-1- هدف اصلی

ارائه مدلی مبتنی بر سیستم‌های چند عامله برای داده‌کاوی در محیط‌های توزیع شده

سیستم داده کاوی توزیع شده چند عامله، حوزه تحقیقاتی جدیدی است که با تکنولوژی نوظهور هوش مصنوعی سازگار بوده، انعطاف پذیری و هوشمندی خاصی داشته، استفاده از منابع را بهبود بخشیده و پایداری سیستم را افزایش داده است. و لذا ارائه مدلی مبتنی بر سیستم‌های چند عامله برای داده‌کاوی در محیط‌های توزیع شده در دستور کار قرار گرفت. نتایج این تحقیق می‌تواند در عمل مورد استفاده قرار گرفته و به عنوان یک موضوع پژوهشی مورد توجه قرار گیرد.

1-4-2- اهداف فرعی

بررسی قوانین انجمنی در چند مدل از داده کاوی

ارائه یک مدل مبتنی بر سیستم‌های چند عامله

ارزیابی مدل

1-5- پرسش‌های تحقیق

پرسش‌های تحقیق به دنبال چگونگی دست‌یابی به اهداف تحقیق می‌باشند. لذا مانند اهداف تحقیق، پرسش‌های تحقیق را نیز به دو دسته تقسیم می‌کنیم: پرسش اصلی و پرسش‌های فرعی. که “پرسش اصلی” به دنبال جوابی در راستای دست‌یابی به هدف اصلی تحقیق می‌باشد و “پرسش‌های فرعی” نیز به دنبال چگونگی دست یافتن به اهداف فرعی تحقیق هستند.

پرسش‌های تحقیق حاضر عبارتند از:

1-5-1- پرسش اصلی

استفاده از عامل‌ها و سیستم‌های چندعامله در داده کاوی توزیع شده چه اثراتی ایجاد می‌کند؟

1-5-2- پرسش‌های فرعی

چه روش‌هایی برای بهینه سازی الگوریتم‌های موجود، وجود دارد؟

عامل‌ها و سیستم‌های چندعامله در حوزه داده کاوی توزیع شده در چه کاربردهایی حائز اهمیت است؟

چه راه حل‌هایی را می‌توان برای رفع مشکلات موجود در این حوزه یافت؟

1-6- فرضیه‌ها

با توجه به قابلیت‌های به اثبات رسیده‌ی عامل‌ها و سیستم‌های چندعامله در زمینه‌های مختلف، فرض ما این است که عامل‌ها و سیستم‌های چندعامله می‌توانند به عنوان ابزار مناسبی در تأثیر بهبود کارایی الگوریتم‌های داده کاوی در محیط توزیع شده به کار گرفته شوند.

1-7- روش تحقیق

روش انجام تحقیق از طريق مطالعه الگوريتم‌ها و روش‌هاي مختلف موجود در راستاي موضوع تحقیق مي‌باشد. و نیز از طريق مقايسه با روش‌هاي مرتبط موجود انجام خواهد شد.

1-8- جنبه‌های نوآوری

با انجام این تحقیق می‌توان از تکنیک‌های داده کاوی در محیط‌های توزیع شده با سرعت و دقت بیشتری بهره برد.

1-9- مراحل انجام تحقیق

مطالعه‌ی اولیه و ادبیات مسأله

شناسايي و بیان کامل مسأله

بررسي فعالیت‌هاي پیشین در راستاي حل مسأله

بهره‌گیري از نقاط قوت روش‌هاي مختلف و دست‌یابی به مدلی کارآمدتر

حل مسأله و تحلیل آن

1-10- ساختار پایان‌نامه

ساختار این تحقیق شامل پنج فصل است.

فصل یک: مقدمه و کلیات تحقیق ارائه خواهد شد و به تعریف مسئله و ضرورت انجام تحقیق خواهیم پرداخت.

فصل دوم: به بیان ادبیات و تاريخچه‌اي از داده کاوی، داده کاوی توزیع شده، عامل‌ها و سیستم‌های چندعامله پرداخته، چندين تکنیک رايج در این حوزه را ذکر می‌کنیم و كاربردها و خصوصیات آن‌ها را شرح خواهیم داد.

فصل سوم: به بیان روش تحقیق، نحوه‌ی گردآوري داده‌ها و شیوه‌ی تجزيه و تحلیل اطلاعات خواهیم پرداخت.

فصل چهارم: در این فصل، به بیان یافته­های تحقیق در هر یک از مراحل اجرایی تحقیق خواهیم پرداخت و در نهایت مدلی بر پایه سیستم‌های چند عامله به منظور بهبود سرعت و دقت عملیات داده‌کاوی در محیط‌های توزیع شده ارائه خواهیم داد.

فصل پنجم: در این فصل، به پرسش­های تحقیق پاسخ داده خواهد شد و پیشنهادهایی برای کارهای آینده ارائه می­شود.

فصل دوم                 ادبیات و پیشینه تحقیق

2-1- مقدمه

در این فصل، به سه بخش اصلی با عناوین داده‌کاوی، عامل‌ها و سیستم‌های چند عامله، و کاربرد عامل‌ها در داده‌کاوی می­پردازیم و در نهایت به بررسی کارهای انجام شده در این حوزه خواهیم پرداخت.

2-2- داده­کاوی

داده کاوی، یک تکنولوژی نوظهور است، که از ابزارها و تکنیک‌های مدل‌سازی و تجزیه و تحلیل آماری، الگوریتم‌های ریاضی، و متدهای یادگیری ماشین برای کشف الگوهای معتبر و ناشناخته در مجموعه داده‌های حجیم استفاده می‌کند. هرچند این تکنولوژی دوران نوباوگی خود را طی می‌کند، اما شرکت‌ها و سازمان‌های بسیاری از جمله خرده‌فروشی‌ها، بانک‌ها، مراکز درمانی، کارخانجات تولیدی، ارتباطات راه دور، و مؤسسات دولتی از ابزارها و تکنیک‌های داده‌کاوی برای تحلیل داده‌هایشان و کشف اطلاعات و دانش مفید از آن‌ها استفاده می‌کنند.[1, 2] داده‌کاوی اطلاعاتی را از پایگاه داده‌ها استخراج می‌کند که از طریق کوئری‌ها و گزارش‌گیری‌ها قابل دست‌یابی نیستند.

رشد انفجاری داده‌های ذخیره شده در پایگاه داده‌ها، نیاز به تکنولوژی‌های جدید که بتوانند حجم عظیم داده‌ها را هوشمندانه به دانش مفید تبدیل کنند، را پدید آورده است.[3] داده­کاوی به معنای يافتن نيمه خودکار الگوهای پنهان در مجموعه داده­های[1] موجود می‌باشد.[4] این تکنولوژی با دیگر تکنیک‌های تحلیل داده، که سیستم، مقادیر اولیه را می‌گیرد و خود، الگوهایی را تولید می‌کند، متفاوت است. داده‌کاوی توسط ابزارهای الگوریتمیک، الگوها، تغییرات، آنومالی‌ها، قوانین، و ساختارهای مهم آماری، و رویدادها را از مجموعه داده‌های عظیم استخراج می‌کند.[5] می‌توان گفت که داده کاوی در جهت کشف اطلاعات پنهان و روابط موجود در بين داده­های فعلی و پيش­بينی موارد نامعلوم و يا مشاهده نشده عمل می­کند. برای انجام عمليات کاوش لازم است قبلاً روی داده­های موجود پیش پردازش‌هایی انجام گيرد. عمل پيش پردازش اطلاعات خود از دو بخش کاهش اطلاعات، و خلاصه­سازی و کلی­سازی داده­ها تشکيل شده است. کاهش اطلاعات عبارت است از توليد يک مجموعه کوچک‌تر، از داده­های اوليه، که تحت عمليات داده­کاوی نتايج تقریباً یکسانی با نتايج داده­کاوی روی اطلاعات اوليه به دست دهد.[4] پس از انجام عمل کاهش اطلاعات و حذف خصايص غير مرتبط نوبت به خلاصه­سازی و کلی­سازی داده­ها می‌رسد. داده­های موجود در بانک‌های اطلاعاتی معمولاً حاوی اطلاعات در سطوح پايينی هستند، بنابراين خلاصه­سازی مجموعه بزرگی از داده­ها و ارائه آن به صورت يک مفهوم کلی اهميت بسيار زيادی دارد. کلی­سازی اطلاعات، فرآيندی است که تعداد زيادی از رکوردهای يک بانک اطلاعاتی را به صورت مفهومی در سطح بالاتر ارائه می‌نمايد. تکنیک‌‌های داده­کاوی به چند دسته تقسيم می­شوند که سه دسته اصلی عبارتند از خوشه­بندی[2]، طبقه­بندی[3] و کشف قواعد انجمنی[4]. در ادامه هر يک از اين روش‌ها را به طور کلی معرفی می­نماييم.

2-2-1- خوشه­بندی

فرآيند خوشه­بندی سعی دارد که يک مجموعه داده را به چندين خوشه­ تقسيم نمايد بطوريکه داده‌های قرار گرفته در يک خوشه با يکديگر شبيه بوده و با داده­های خوشه­های ديگر متفاوت باشند. در حال حاضر روش‌های متعددی برای خوشه­بندی داده­ها وجود دارد که بر اساس نوع داده­ها، شکل خوشه­ها، فاصله داده­ها و غيره عمل خوشه­بندی را انجام می­دهند. مهم‌ترین روش‌های خوشه­بندی در زير معرفی شده­اند:

2-2-1-1- روش‌های خوشه‌بندی مبتنی بر تقسيم‌بندی

این روش‌ها، داده­های موجود در يک مجموعه داده را به k خوشه تقسيم می­کنند، بطوريکه هر خوشه دو خصوصيت زير را داراست:

هر خوشه يا گروه حداقل شامل يک داده می­باشد.

هر داده موجود در مجموعه داده دقیقاً به يک گروه يا خوشه تعلق دارد.

معيار اصلی در چنين مجموعه داده­هايی ميزان شباهت داده­های قرار گرفته در هر خوشه می­باشد. در حاليکه داده‌های قرار گرفته در دو خوشه مختلف از نظر شباهت با يکديگر فاصله زيادی دارند. مقدار k که به عنوان پارامتر استفاده می­گردد، هم می­تواند به صورت پويا تعيين گردد و هم اينکه قبل از شروع الگوريتم خوشه­بندی مقدار آن مشخص گردد.

2-2-1-2- روش‌های سلسله مراتبی[5]

روش‌های سلسله مراتبی به دو دسته کلی روش‌های پایین به بالا[6] و روش‌های بالا به پایین[7] تقسيم می‌گردند. روش‌های سلسله مراتبی پایین به بالا به اين صورت عمل می­کنند که در شروع هر کدام از داده­ها را در يک خوشه جداگانه قرار می­دهد و در طول اجرا سعی می­کند تا خوشه­هايی نزديک به يکديگر را با هم ادغام نمايد. اين عمل ادغام تا زمانی که يا تنها يک خوشه داشته باشيم و يا اينکه شرط خاتمه برقرار گردد، ادامه می­يابد. روش‌های بالا به پایین دقیقاً به طریق عکس عمل می­کنند، به اين طريق که ابتدا تمام داده­ها را در يک خوشه­ قرار می­دهد و در هر تکرار از الگوريتم، هر خوشه به خوشه­های کوچک‌تر شکسته می­شود و این کار تا زمانی ادامه می­يابد که يا هر کدام از خوشه­ها تنها شامل يک داده باشند و يا شرط خاتمه الگوريتم برقرار گردد. شرط خاتمه معمولاً تعداد کلاستر يا خوشه می­باشد.

[1]Dataset

[2] Clustering

[3] Classification

[4] Association rule mining

[5] Hierarchical Clustering Algorithms

[6] bottom-up

[7] top-down

همه پایان نامه و تحقیق و پروژه های به صورت فایل دانلودی می باشند و شما به محض پرداخت آنلاین مبلغ همان لحظه قادر به دریافت فایل خواهید بود. این عملیات کاملاً خودکار بوده و توسط سیستم انجام می پذیرد. ضمنا همان لحظه لینک دانلود به ایمیل شما ارسال می گردد.

 جهت پرداخت مبلغ شما به درگاه پرداخت یکی از بانک ها منتقل خواهید شد، برای پرداخت آنلاین از درگاه بانک این بانک ها، حتماً نیاز نیست که شما شماره کارت همان بانک را داشته باشید و بلکه شما میتوانید از طریق همه کارت های عضو شبکه بانکی، مبلغ  را پرداخت نمایید

مطالب پیشنهادی:
برچسب ها : , , , , , , , , ,
برای ثبت نظر خود کلیک کنید ...

به راهنمایی نیاز دارید؟ کلیک کنید

جستجو پیشرفته

دسته‌ها

آخرین بروز رسانی

    Fatal error: Call to undefined function jdate() in /home/bmaghale/domains/bmaghale.ir/public_html/wp-content/themes/digitaliran5/sidebar.php on line 122