کاربرد داده کاوی در نرم افزار و فناوری اطلاعات

کاربرد داده کاوی در نرم افزار و فناوری اطلاعات

کاربرد-داده-کاوی-در-نرم-افزار-و-فناوری-اطلاعات

پروژه و تحقیق علم داده کاوی  و کاربرد آن در نرم افزار و it
تعداد صفحات : 100 با فرمت وردو قابل ویرایش 
 

داده‌کاوی، پایگاه‌ها و مجموعه‌ حجیم داده‌ها را در پی کشف و استخراج، مورد تحلیل قرار می‌دهد. این گونه مطالعات و کاوش‌ها را به واقع می‌توان همان امتداد و استمرار دانش کهن و همه جا گیر آمار دانست. تفاوت عمده در مقیاس، وسعت و گوناگونی زمینه‌ها و کاربردها، و نیز ابعاد و اندازه‌های داده‌های امروزین است که شیوه‌های ماشینی مربوط به یادگیری، مدل‌سازی، و آموزش را طلب می‌نماید.

در سال ۱۹۶۰ آماردانان اصطلاح “Data Fishing” یا “Data Dredging”به معنای “صید داده” را جهت کشف هر گونه ارتباط در حجم بسیار بزرگی از داده‌ها بدون در نظر گرفتن هیچگونه پیش فرضی بکار بردند. بعد از سی سال و با انباشته شدن داده‌ها در پایگاه داده اصطلاح داده کاوی در حدود سال ۱۹۹۰ رواج بیشتری یافت. اصطلاحات دیگری نظیر “Data Archaeology”یا “Information Harvestingg” یا “Information Discovery” یا“Knowledge Extractionn” نیز بکار رفته‌اند.

 

مقدمه

بسیاری از شرکت‌ها و موسسات دارای حجم انبوهی از اطلاعات هستند. تکنیک‌های داده‌کاوی به طور تاریخی به گونه‌ای گسترش یافته‌اند که به سادگی می‌توان آنها را بر ابزارهای نرم‌افزاری و … امروزی تطبیق داده و از اطلاعات جمع‌آوری شده بهترین بهره را برد.

در صورتی که سیستم‌های داده‌کاوی بر روی سکوهای Client/Server قوی نصب شده باشد و دسترسی به بانک‌های اطلاعاتی بزرگ فراهم باشد، می‌توان به سوالاتی از قبیل :کدامیک از مشتریان  ممکن است خریدار کدامیک از محصولات آینده شرکت باشند، چرا، در کدام مقطع زمانی و بسیاری از موارد مشابه پاسخ داد.

ویژگی‌ها

یکی از ویژگیهای کلیدی در بسیاری از ابتکارات مربوط به تامین امنیت ملی، داده کاوی است. داده کاوی که به عنوان ابزاری برای کشف جرایم، ارزیابی میزان ریسک و فروش محصولات به کار می‌رود، در بر گیرنده ابزارهای تجزیه و تحلیل اطلاعات به منظور کشف الگوهای معتبر و ناشناخته در بین انبوهی از داده هاست. داده کاوی غالباً در زمینه تامین امنیت ملی به منزله ابزاری برای شناسایی فعالیت‌های افراد خرابکار شامل جابه جایی پول و ارتباطات بین آنها و همچنین شناسایی و ردگیری خود آنها با بررسی سوابق مربوط به مهاجرت و مسافرت هاست.

داده کاوی پیشرفت قابل ملاحظه‌ای را در نوع ابزارهای تحلیل موجود نشان می‌دهد اما محدودیت‌هایی نیز دارد. یکی از این محدودیت‌ها این است که با وجود اینکه به آشکارسازی الگوها و روابط کمک می‌کند اما اطلاعاتی را درباره ارزش یا میزان اهمیت آنها به دست نمی‌دهد. دومین محدودیت آن این است که با وجود توانایی شناسایی روابط بین رفتارها و یا متغیرها لزوماً قادر به کشف روابط علت و معلولی نیست. موفقیت داده کاوی در گرو بهره‌گیری از کارشناسان فنی و تحلیل گران کار آزموده‌ای است که از توانایی کافی برای طبقه‌بندی تحلیل‌ها و تغییر آنها برخوردار هستند.

بهره‌برداری از داده کاوی در دو بخش دولتی و بخش خصوصی رو به گسترش است.[۱] صنایعی چون بانکداری، بیمه، بهداشت و بازاریابی آنرا عموماً برای کاهش هزینه‌ها، ارتقاء کیفی پژوهش‌ها و بالاتر  بردن میزان فروش به کار می‌برند. کاربرد اصلی داده کاوی در بخش دولتی به عنوان ابزاری برای تشخیص جرایم بوده‌است اما امروزه دامنه بهره‌برداری از آن گسترش روزافزونی یافته و سنجش وبهینه‌سازی برنامه‌ها را نیز در بر می‌گیرد. بررسی برخی از برنامه‌های کاربردی مربوط به داده کاوی که برای تامین امنیت ملی به کار می‌روند، نشان دهنده رشد قابل ملاحظه‌ای در رابطه با کمیت و  دامنه داده‌هایی است که باید تجزیه و تحلیل شوند.

توانایی‌های فنی در داده کاوی از اهمیت ویژه‌ای برخوردار اند اما عوامل دیگری نیز مانند چگونگی پیاده‌سازی و نظارت ممکن است نتیجه کار را تحت تأثیر قرار دهند. یکی از این عوامل کیفیت داده هاست که بر میزان دقت و کامل بودن آن دلالت دارد. عامل دوم میزان سازگاری نرم‌افزار داده کاوی با بانکهای اطلاعاتی است که از سوی شرکت‌های متفاوتی عرضه می‌شوند. عامل سومی که باید به آن اشاره کرد به بیراهه رفتن داده کاوی و بهره‌برداری از داده‌ها به منظوری است که در ابتدا با این نیت گرد آوری نشده‌اند. حفظ حریم خصوصی افراد عامل دیگری است که باید به آن توجه داشت.

اصولاً به پرسش‌های زیر در زمینه داده کاوی باید پاسخ داده شود:

  • سازمانهای دولتی تا چه حدی مجاز به بهره‌برداری از داده‌ها هستند؟
  • آیا از داده‌ها در چارچوبی غیر متعارف بهره‌برداری می‌شود؟
  • کدام قوانین حفظ حریم خصوصی ممکن است به داده کاوی مربوط شوند؟

کاوش در داده‌ها بخشی بزرگ از سامانه‌های هوشمند است. سامانه‌های هوشمند زیر شاخه‌ای بزرگ و پرکاربرد از زمینه علمی جدید و پهناور یادگیری ماشینی هستند که خود زمینه‌ای در هوش مصنوعی است. فرایند گروه گروه کردن مجموعه‌ای از اشیاء فیزیکی یا مجرد به صورت طبقه‌هایی از اشیاء مشابه هم را خوشه‌بندی می‌نامیم.

با توجه به اندازه‌های گوناگون (و در اغلب کاربردها بسیار بزرگ و پیچیده) مجموعه‌های داده‌ها مقیاس‌پذیری الگوریتم‌های به کار رفته معیاری مهم در مفاهیم مربوط به کاوش در داده‌ها است.

کاوش‌های ماشینی در متون حالتی خاص از زمینهٔ عمومی‌تر کاوش در داده‌ها بوده، و به آن دسته از کاوش‌ها اطلاق می‌شود که در آن‌ها داده‌های مورد مطالعه از جنس متون نوشته شده به زبان‌های طبیعی انسانی باشد.

چیستی

داده کاوی به بهره‌گیری از ابزارهای تجزیه و تحلیل داده‌ها به منظور کشف الگوها و روابط معتبری که تا کنون ناشناخته بوده‌اند اطلاق می‌شود. این ابزارها ممکن است مدلهای آماری، الگوریتم‌های ریاضی و روش‌های یاد گیرنده (Machine Learning Methods) باشند که کار این خود را به صورت خودکار و بر اساس تجربه‌ای که از طریق شبکه‌های عصبی (Neural Networks) یا درخت‌های تصمیم گیری (Decision Trees) به دست می‌آورند بهبود می‌بخشد. داده کاوی منحصر به گردآوری و مدیریت داده‌ها نبوده و تجزیه و تحلیل اطلاعات و پیش بینی را نیز شامل می‌شود برنامه‌های کاربردی که با بررسی فایل‌های متن یا چند رسانه‌ای به کاوش داده‌ها می‌پردازند پارامترهای گوناگونی را در نظر می‌گیرد که عبارت اند از:

  • قواعد انجمنی (Association): الگوهایی که بر اساس آن یک رویداد به دیگری مربوط می‌شود مثلاً خرید قلم به خرید کاغذ.
  • ترتیب (Sequence): الگویی که به تجزیه و تحلیل توالی رویدادها پرداخته و مشخص می‌کند کدام رویداد، رویدادهای دیگری را در پی دارد مثلاً تولد یک نوزاد و خرید پوشک.
  • پیش بینی(Prediction): در پیش بینی هدف پیش بینی یک متغیر پیوسته می‌باشد. مانند پیش بینی نرخ ارز یا هزینه‌های درمانی.
  • رده‌بندی یا طبقه‌بندی (Classification): فرایندی برای پیدا کردن مدلی است که رده‌های موجود در داده‌ها را تعریف می‌نماید و متمایز می‌کند، با این هدف که بتوان از این مدل برای پیش بینی رده رکوردهایی که برچسب رده آنها (متغیر هدف) ناشناخته می‌باشد، استفاده نمود.[۲]در حقیقت در رده‌بندی بر خلاف پیش بینی، هدف پیش بینی مقدار یک متغیر گسسته است. روش‌های مورد  استفاده در پیش بینی و رده‌بندی عموماً یکسان هستند.
  • خوشه‌بندی(Clustering): گروه بندی مجموعه‌ای از اعضاء، رکوردها یا اشیاء به نحوی که اعضای موجود در یک خوشه بیشترین شباهت را به یکدیگر و کمترین شباهت را به اعضای خوشه‌های دیگر داشته باشند
  • مصورسازی (visualization): مصورسازی داده‌ها یکی از قدرتمندترین و جذابترین روش‌های اکتشاف در داده‌ها می‌باشد.

برنامه‌های کاربردی که در زمینه تجزیه و تحلیل اطلاعات به کار می‌روند از امکاناتی چون پرس و جوی ساخت یافته (Structured query) که در بسیاری از بانک‌های اطلاعاتی یافت می‌شود و از ابزارهای  تجزیه و تحلیل آماری برخوردارند اما برنامه‌های مربوط به داده کاوی در عین برخورداری از این قابلیت‌ها از نظر نوع با آنها تفاوت دارند. بسیاری از ابزارهای ساده برای تجزیه و تحلیل داده‌ها روشی بر پایه راستی آزمایی (verification) را به کار می‌برند که در آن فرضیه‌ای بسط داده شده آنگاه داده‌ها برای تایید یا رد آن بررسی می‌شوند. به طور مثال ممکن است این نظریه مطرح شود که فردی که یک چکش خریده حتماً یک بسته میخ هم خواهد خرید. کارایی این روش به میزان خلاقیت کاربر برای ارایه فرضیه‌های متنوع و همچنین ساختار برنامه بکار رفته بستگی دارد. در مقابل در داده کاوی روشهایی برای کشف روابط بکار برده می‌شوند و به کمک الگوریتم‌هایی روابط چند بعدی بین داده‌ها تشخیص داده شده و آنهایی که یکتا (unique) یا رایج هستند شناسایی می‌شوند. به طور مثال در یک فروشگاه سخت‌افزار ممکن است بین خرید ابزار توسط مشتریان با تملک خانه شخصی یا نوع خودرو، سن، شغل، میزان درآمد یا فاصله محل اقامت آنها با فروشگاه رابطه‌ای برقرار شود.

در نتیجه قابلیت‌های پیچیده‌اش برای موفقیت در تمرین داده کاوی دو مقدمه مهم است یکی فرمول واضحی از مشکل که قابل حل باشد و دیگری دسترسی به داده متناسب. بعضی از ناظران داده کاوی را مرحله‌ای در روند کشف دانش در پایگاه داده‌ها می‌دانند (KDD). مراحل دیگری در روند KDDD به صورت تصاعدی شامل، پاکسازی داده، انتخاب داده انتقال داده، داده کاوی، الگوی ارزیابی، و عرضه  دانش می‌باشد. بسیاری از پیشرفت‌ها در تکنولوژی و فرایندهای تجاری بر رشد علاقه‌مندی به داده کاوی در بخش‌های خصوصی و عمومی سهمی داشته‌اند. بعضی از این تغییرات شامل:

  • رشدشبکه‌های کامپیوتری که در ارتباط برقرار کردن پایگاهها داده مورد استفاده قرار می‌گیرند.
  • توسعه افزایش تکنیکهایی بر پایه جستجو مثل شبکه‌های عصبی و الگوریتم‌های پیشرفته.
  • گسترش مدل محاسبه کلاینت سروری که به کاربران اجازه دسترسی به منابع داده‌های متمرکز شده را از روی دسک تاپ می‌دهد.
  • و افزایش توانایی به تلفیق داده از منابع غیر متجانس به یک منبع قابل جستجو می‌باشد.

علاوه بر پیشرفت ابزارهای مدیریت داده، افزایش قابلیت دسترسی به داده و کاهش نرخ نگهداری داده نقش ایفا می‌کند. در طول چند سال گذشته افزایش سریع جمع‌آوری و نگه داری حجم اطلاعات وجود داشته‌است. با پیشنهادهای برخی از ناظران مبنی بر آنکه کمیت داده‌های دنیا به طور تخمینی هر ساله دوبرابر می‌گردد. در همین زمان هزینه ذخیره‌سازی داده‌ها بطور قابل توجهی از دلار برای هر مگابایت به پنی برای مگابایت کاهش پیدا کرده‌است. مطابقاً قدرت محاسبه‌ها در هر ۱۸  ۲۴ ماه به دوبرابر ارتقاء پیدا کرده‌است این در حالی است که هزینه قدرت محاسبه رو به کاهش است. داده کاوی به طور معمول در دو حوزه خصوصی و عمومی افزایش پیدا کرده‌است. سازمانها داده کاوی را به عنوان ابزاری برای بازدید اطلاعات مشتریان کاهش تقلب و اتلاف و کمک به تحقیقات پزشکی استفاده می‌کنند. با اینهمه ازدیاد داده کاوی به طبع بعضی از پیاده‌سازی و پیامد اشتباه را هم دارد. اینها شامل نگرانی‌هایی در مورد کیفیت داده‌ای که تحلیل می‌گردد، توانایی کار گروهی پایگاههای داده و نرم‌افزارها بین ارگانها و تخطی‌های بالقوه به حریم شخصی می‌باشد. همچنین ملاحظاتی در مورد محدودیتهایی در داده کاوی در ارگان‌ها که کارشان تاثیر بر امنیت دارد، نادیده گرفته می‌شود.


دانلود فایل

دانلود تحقیق در مورد متن کاوی

دانلود تحقیق در مورد متن کاوی

دانلود-تحقیق-در-مورد-متن-کاوی

دانلود تحقیق در مورد متن کاوی
تعداد صفحات : 42 با فرمت ورد و قابل ویرایش
 
    رشد فزاینده پایگاه داده ها در تقریبا هر ناحیه از فعالیت انسان باعث شده است که نیاز برای ابزارهای قدرتمند جدید برای تغییر دادن داده به دانش مفید افزایش یابد. برای برآوردن این نیاز محققان در ناحیه های مختلف مانند یادگیری ماشین ، شناسایی الگو، آنالیز داده آماری، بصری سازی داده ، شبکه¬های عصبی، اقتصاد سنجی، بازیابی اطلاعات، استخراج اطلاعات و….. روش¬ها و ایده¬هایی را کاوش کرده¬اند. ذات غيرساخت يافته ي اين متون، اعمال همان روشهايي را که ما در مورد پایگاه داده¬های غیرمتنی بکار مي بريم، غير ممکن مي سازد. بنابراین روش¬ها و الگوریتم های پردازش (پیش پردازش)خاصی برای استخراج الگوهای مفید موردنیاز است. متن کاوی اطلاعات متنی غیرساختیافته را استفاده می کند و آنرا برای کشف ساختار و معناهای ضمنی پنهان در متن بررسی می¬کند. در این مقاله ما به بررسی یکی از جدیدترین زمینه¬های مورد تحقیق در داده کاوی، متن کاوی می¬پردازیم. در این مقاله روش¬های موجود برای پیش پردازش کردن، رده بندی ، استخراج اطلاعات ، روش¬های یافتن روابط شرح داده می¬شوند در پایان هر بخش ارزیابی و مقایسه¬ای روی روش¬های بیان شده در آن بخش صورات می¬گیرد و در پایان تعدادی از کاربردهای متن کاوی بیان می¬گردند. 
 
چکیده

1 مقدمه

2.1 تعاریف متن کاوی

3.1 ناحیه­های سرچ مرتبط

2 پردازش متن

3 روش­ها پیش پردازش کردن متون

1.3 مدل فضای برداری

4 روش­های متن کاوی …

1.4 فازهای اصلی فرآیند متن کاوی…

2.4 رده­بندی …

3.4 استخراج اطلاعات

4.4 روش­ها ترکیبی

5 کاربردهای متن کاوی

6 کاربردها

7 نتیجه­گیری و کارهای آینده

8 مراجع

 


دانلود فایل

به‌کارگیری داده‌کاوی در پایگاه‌های داده عظیم

به‌کارگیری داده‌کاوی در پایگاه‌های داده عظیم

به‌کارگیری-داده‌کاوی-در-پایگاه‌های-داده-عظیم

به‌کارگیری داده‌کاوی در پایگاه‌های داده عظیم 

تعداد صفحات : 72 با فرمت ورد و قابل ویرایش
 
در نسل اول یا نسل سنتی، فقط انجام پرس‌وجوهای ساده امکان‌پذیر بود، مثلاً تعداد فروش یک کالای خاص چقدر است؟ میزان خرید یک مشتری خاص در ماه جاری چه مبلغی است؟ در نسل دوم یا همان پردازش لحظه‌ای برخط (OLAP) امکان پرس‌وجوی همزمان چندبعدی فراهم گردید. در این روش به‌عنوان‌مثال به سؤالاتی مانند: «میزان فروش محصولات به تفکیک فروشنده، خریدار و مسیر خاص چقدر است؟» به‌صورت لحظه‌ای و با استفاده از مکعب تصمیم و گزارش ماتریسی پاسخ داده می‌شود؛ اما در نسل سوم یا همان داده‌کاوی فقط مسئله پرس‌وجو و دریافت گزارش‌ها از داده‌ها نیست، بلکه از حجم انبوه داده‌ها، الگویی کشف می‌شود که هیچ‌وقت امکان کشف این الگوها در پردازش لحظه‌ای برخط (OLAP) یا روش سنتی وجود نداشت. انواع اطلاعات و الگوهایی که از طریق داده‌کاوی به دست می‌آیند و کاربرد دارند عبارت‌اند از: وابستگی، تسلسل و توالی، طبقه‌بندی، خوشه‌بندی و پیش‌بینی. برای استخراج این الگوها اغلب از روش‌های نوینی مانند شبکه عصبی و درخت‌های تصمیم استفاده می‌شود. در عمل برای امکان انجام داده‌کاوی و استفاده از تکنیک‌های فوق‌الذکر، ابتدا باید نسبت به ایجاد یک انبار داده مناسب اقدام کرد. یک انبار داده در حقیقت پایگاه داده‌ای است که داده‌های جاری و همچنین سوابق قبلی تراکنش‌ها را در خود ذخیره کرده و با منابع خارج سازمان نیز ارتباط برقرار می‌کند.
داده‌کاوی، فرآیند مرتب‌سازی و طبقه‌بندی داده‌های حجیم و آشکارسازی اطلاعات مرتبط باهم می‌باشد. امروزه داده‌کاوی به‌عنوان یکی از ابزارهای بسیار مهم مدیران جهت شناخت وضعیت دقیق‌تر سازمان و همچنین کمک در اتخاذ تصمیمات مناسب کاربرد دارد. با استفاده از این تکنیک، داده‌های موجود در سازمان با به‌کارگیری ابزارهای نرم‌افزاری، موردبررسی و تحلیل دقیق قرار می‌گیرد تا الگوهای پنهان و پیچیده‌ای که در آن‌ها وجود دارد کشف و استخراج گردد. داده‌کاوی را می‌توان نسل سوم تکنولوژی‌هایی نامید که با داده سروکار دارند.
 
چکیده

فصل اول: مقدمه‌ای بر داده‌کاوی

1-1- دلیل پیدایش داده‌کاوی

1-2- روند کشف دانش

1-3- جایگاه داده‌کاوی در میان علوم مختلف

1-4- چه‌کارهایی را نمی‌توان با داده‌کاوی انجام داد

1-5- داده‌کاوی در مقابل انبار داده

1-6- داده‌کاوی در مقابل پردازش لحظه‌ای برخط (OLAP)

1-7- کاربرد هوش مصنوعی و آمار در داده‌کاوی

فصل دوم: توصیف داده‌ها در داده‌کاوی

2-1- خلاصه‌سازی و به تصویر درآوردن داده‌ها

2-2- خوشه‌بندی

2-3- تحلیل لینک

فصل سوم: مدل‌های پیش‌بینی داده‌ها

3-1- کلاس‌بندی

3-2- رگرسیون

3-3- دنباله زمان

فصل چهارم: مدل‌ها و الگوریتم‌های داده‌کاوی

4-1- شبکه‌های عصبی

4-2- درخت‌های تصمیم

4-3- مارس

4-4- استنتاج قوانین

4-5- K– نزدیک‌ترین همسایه و استدلال مبتنی بر حافظه

4-6- رگرسیون منطقی

4-7- تحلیل تفکیکی

4-8- مدل افزودنی کلی

4-9- افزایشی

فصل پنجم: سلسله‌مراتب انتخاب‌ها

فصل ششم: مراحل فرآیند کشف دانش از پایگاه داده‌ها

6-1- انبارش داده‌ها

6-2- انتخاب داده‌ها

6-3- تبدیل داده‌ها

6-4- کاوش داده‌ها

6-5- تفسیر نتیجه

فصل هفتم: عملیات داده‌کاوی

7-1- مدل‌سازی پیشگویی‌کننده

7-2- تقطیع پایگاه داده‌ها

7-3- تحلیل پیوند

7-4- تشخیص انحراف

فصل هشتم: قابلیت‌های داده‌کاوی

8-1- داده‌کاوی و انبار داده‌ها

8-2- داده‌کاوی، آمار و هوش مصنوعی

8-3- کاربردهای داده‌کاوی

8-4- داده‌کاوی موفق

8-5- تحلیل ارتباطات

فصل نهم: طبقه‌بندی

9-1- تئوری بیز

9-2- رگرسیون

9-3- گروه‌بندی داده‌ها

9-4- بخش‌بندی

9-5- سلسله مراتبی

9-6- گروه‌بندی بر اساس تراکم

9-7- کاوش قوانین پیوندی

9-8- آپریوری

9-9- دی. اچ.پی

9-10- خلاصه‌سازی و کلی‌نگری داده‌ها در سطوح مختلف

9-11- رهیافت هرم داده‌ها

9-12- رهیافت استنتاج بر اساس صفت خاصه

9-13- الگوریتم‌های ژنتیک

فصل دهم: ساختن یک پایگاه داده داده‌کاوی

10-1- جستجوی داده

10-2- آماده‌سازی داده برای مدل‌سازی

10-3- ساختن مدل داده‌کاوی

10-4- تائید اعتبار ساده

10-5- ارزیابی و تفسیر

فصل یازدهم: ماتریس‌های پیچیدگی

11-1- ایجاد معماری مدل و نتایج

نتیجه‌گیری

منابع و مراجع

 

فهرست شکل‌ها

شکل (1-1): داده‌کاوی به‌عنوان یک مرحله از فرآیند کشف دانش

شکل (1-2): سیر تکاملی صنعت پایگاه داده

شکل (1-3): معماری یک نمونه سیستم داده کاو

شکل (1-4): داده‌ها از انبار داده‌ها استخراج می‌گردند

شکل (1-5): داده‌ها از چند پایگاه داده استخراج‌شده‌اند

شکل (4-1): شبکه عصبی با یک لایه نهان

شکل (4-2): Wx,y وزن یال بین x و y است

شکل (4-3): درخت تصمیم‌گیری

شکل (4-4): محدوده همسایگی (بیشتر همسایه‌ها در دسته x قرارگرفته‌اند)

شکل (8-1): داده‌ها از انبار داده‌ها استخراج می‌گردند

شکل (8-2): ساختار ارتباطاتی به روش گرافیکی

 

دانلود فایل

داده كاوی با استفاده از نرم افزار WEKA

داده كاوی با استفاده از نرم افزار WEKA

داده-كاوی-با-استفاده-از-نرم-افزار-weka

داده كاوی با استفاده از نرم افزار WEKA

تعداد صفحات : 44 با فرمت ورد و قابل ویرایش
 
سالهای اخیر نیاز به یک فرایند خودکار برای کشف الگوهای جالب و پنهان در پایگاه داده های واقعی و دستکاری حجم زیادی از داده ها بوجود آمده است. این فرایند داده کاوی با الگوریتمهای بسیاری برای عملیات موردنظر همراه است و این الگوریتم ها باید قابلیت مقیاس پذیری بر روی مجموعه داده های بزرگ جهت اجرای کارا را داشته باشند.
  Weka یک نرم افزار داده کاوی متن‌باز می‌باشد که بسیاری از الگوریتم‌های یادگیری ماشین را پشتیبانی می‌کند. تمام قسمت‌های این نرم‌افزار به زبان جاوا نوشته شده است و در نتیجه می‌تواند بر روی هر پلتفرمی اجرا گردد.
نرم افزار وکا مجموعه ای از به روزترین الگوریتم های یادگیری ماشین و ابزارهایی برای پیش پردازش داده ها می باشد. با توجه به اینکه کلیه امکانات WEKA در قالب واسط های کاربری مناسب در اختیار کاربران قرار می گیرد بنابراین کاربران میتوانند متدهای مختلف را بر روی داده های خود پیاده سازی کرده و بهترین الگوریتم را برای کار انتخاب نمایند. این نرمافزار در دانشگاه Waikato نیوزلند ایجاد شده است و نام آن از حروف اول کلمات Waikato Environment for Knowledge Analysis می باشد. این نرم افزار به زبان برنامه نویسی Java نوشته شده است و میتوان آن را بر روی پلتفرم های متفاوتی که ماشین مجازی Java بر روی آنها نصب شده است اجرا نمود. همچنین این نرم افزار تحت مجوز GNU GPL انتشار یافته است و این بدان معناست که استفاده از آن رایگان بوده و کاربران به راحتی می توانند به کدمنبع های آن دسترسی داشته و حتی آنها را بر حسب نیاز تغییر داده و روشهای دیگری را نیز به آنها اضافه کنند.
 

                   مقدمه  

                 معرفه نرم افزار weka   

                 روش استفاده از weka 

                 واسط هاي weka

                 واسط Explorer

Preprocess                 

 Classify                 

 Cluster                  

Associate                 

                نتيجه گيري

دانلود فایل

دانلود مقاله داده کاوی در وب

دانلود مقاله داده کاوی در وب

دانلود-مقاله-داده-کاوی-در-وب

دانلود مقاله داده کاوی در وب
تعداد صفحات :92 با فرمت ورد و قابل ویرایش
 
 
فصل اول : داده کاوی و وب

مقدمه4

طبقه بندی Web mining5

داده کاوی و visualization در اینترنت.. 7

کاوش الگو8

وب کاوی در E-Commerce9

فصل دوم : پردازشها و تكنيكهايweb data mining11

مقدمه11

مراحل Data mining16

مراحل جستجو17

پردازش روي نتايج.. 18

جنبه هاي واسط كاربر19

خروجيهاي data mining web:21

پياده سازيهاي data mining web:23

فصل سوم : کاوش پايگاه داده هاي وب.. 29

مقدمه30

جستجو در پايگاه دادةها در وب.. 30

داده كاوي شيئي – رابطهاي.. 31

اشتراك داده در مقابل داده كاوي در وب.. 31

كاوش پايگاههاي دادة نيمه ساختيافته32

كاوش و سپس ادغام33

Web mining و Meta data34

كاوش متاديتا35

انبار و كاوش35

متاديتا براي كاوش چند رسانهاي.. 36

متا ديتا براي web mining36

كاوش پايگاه دادههاي توزيع شده، ناهمگن ، وراثتي و متحد در وب37

ماژولهايي از DP براي داده كاوي.. 37

داده كاوي روي پايگاه داده توزيع شده 38

كاوش و سپس اجتماع38

كاوش interoperating و مخزن39

همكاري ميان عاملهاي كاوش.. 39

واسط براي مجتمع سازي.. 40

معماريها وweb data mining41

ماژولهاي داده كاوي مثل اشياء41

فصل چهارم : بازیابی اطلاعات و داده کاوی در وب.. 44

مقدمه45

موتورهای جستجوگر46

ماژولهای موتورهای جستجو46

web data mining برای موتورهای جستجو47

پویش داده های چند گانه وب.. 48

کاوش متن49

کاوش مستقیم روی دادههای غیرساخت یافته50

کاوش تصویر51

کاوش ویدئو52

کاوشAudio :53

کاوش مستقیم داده با فرمت صدا 53

کاوش نوع داده ی چند رسانه ای.. 54

سیستم سوال/جواب و داده کاوی وب.. 54

زبانهایMark up و داده کاوی وب55

خلاصه56

فصل پنجم : مدیریت اطلاعات و داده کاوی وب.. 57

مقدمه58

همکاری بین عاملهای کاوش58

مدیریت دانشها و داده کاوی وب.. 59

مدیریت دانش و داده کاوی وب.. 60

محاسبات بیسیم و داده کاوی وب61

کیفیت سرویس و داده کاوی وب62

اجتماع سرویسهای وب و داده کاوی.. 63

فصل ششم : کاوش الگوهاي كاربردي و ساختار روي وب.. 64

مقدمه65

تحليل الگوهاي كاربردي و روندهاي پيشبيني.. 65

خروجيها و تكنيكهاي web usage mining: 66

web mining براي e-commerce75

كاوش ساختار روي وب.. 76

بازبيني web structure mining76

جمع بندی و نتیجه گیری.. 77

گرافیک سه بعدی چیست ؟79

کارت گرافیک سه بعدی.. 80

کارت گرافیک سه بعدی.. 83

نتیجه گیری90

مراجع91

 

در عصر حاضر Web Mining محیط اینترنت جهانی را تبدیل به محیطی کاربردی تر کرده است.که کاربران میتوانند سریعتر و راحتتر اطلاعات مورد نیازشان را پیدا کنند که شامل :کشف و تحلیل داده ، مستندات وmulti media از محیط اینترنت جهانی میباشد ,Web Mining  از جزئیات سند ومحتویات سند و ساختار Hyper Link برای کمک به کاربر جهت مشاهده اطلاعات مورد نیازش استفاده میکند.

وب و موتورهای جستجو خودشان شامل اطلاعات ارتباطی درباره ی مستندات هستند و Web Mining  این ارتباطات را کشف میکند و به سه بخش تقسیم بندی مینماید.
در اولین بخش Web Content Mining، موتورهای جستجو محتویات را با کلمات کلیدی تعریف میکنندومی شناسند.پیدا کردن کلمات کلیدی محتوا و پیدا کردن یک ارتباط بین محتوای صفحه ی وب و محتوای سوال کاربر، Content Mining  گفته میشود.
Hyper Linksاطلاعاتی را درباره ی سایر مستندات روی وب که در سند دیگری مهم هستند تهیه میکند.این لینکها عمقی را به سند اضافه میکنند و حالت چند بعدی که از خصوصیات وب است ایجاد میکنند. کاوش این ساختار لینک دومین بخش یعنی   Web Structure Mining  است.

دانلود فایل

داده کاوی در صنعت بانکداری

داده کاوی در صنعت بانکداری

داده-کاوی-در-صنعت-بانکداری

 داده کاوی در صنعت بانکداری

تعداد صفحات : 51 با فرمت ورد و قابل ویرایش
 
ODM   به عنوان ابزار استخراج دانش اتکاپذیر ی از داده های تعریف شده است و فن آوری است که فرایند تصمیم  گیری را به وسیله دگرگون ساختن داده ها به سوی دانش ارزشمند در جهت کسب یک مزیت رقابتی سوق می دهد و به عنوان شیوه بکار بردن ابزارهای داده کاوی تعریف شده است.
با توجه به اینکه سازمان ها داده های تجاری بسیاری رادر تصرف خود  دارند و تراباتهای داده را در بانک های اطلاعاتی شان جمع آوری می کنند.و با فلج ساختن اطلاعات یک چالش کلیدی در تصمیم گیری تشکیلات سازمانی ایجاد می کنند به این منظور پروسه کشف دانش از پایگاه داده سازمانی مطرح شده است که یک فرایند علمی برای شناسایی الگوهای معتبر، نوین، بالقوه  مفید، قابل فهم از داده ها می باشد. مهمترین بخش این فرایند داده کاوی  یا کاوش دانش می باشد با ستفاده از الگوریتم های مشخص الگوها را از پایگاه داده استخراج می کنند.
داده کاوی عبارت است کشف روش ها والگوهای ویژه درپایگاه داده های بزرگ، برای هدایت تصمیم گیری در آینده.
امروزه مدیریت ارتباط با مشتری  فقط یک مزیت رقابتی نیست  بلکه شناسایی و جذب مشتریان وفادار و نگه داشتن آنها برای ادامه حیات در بازار رقابت امری ضروری است بانک ها و موسسسات اعتباری در گذشته به دلیل محدودیت تنوع خدمات و عدم دسترسی به اطلاعات مشتریان از روش های ساده جهت سنجش اعتبار مشتریان خود استفاده می کردند ولی امروز با وجود بانکداری الکترونیکی ثبت اطلاعات  تراکنشی مشتریان راحت تر صورت می گیرد و همین امر موجب شده که روش های کمی جایگزین روش های کیفی شود. 
در این تحقیق نگاه مختصری به مسیر تکاملی داده کاوی در صنعت بانکدار ی پرداخته و تکنیک های مورد استفاده داده کاوی در کشف و سوءاستفاده های مالی، ارزیابی و عملکرد بانک و اعتبارسنجی مشتریان بانک و مدیریت ارتباط  مشتریان معرفی شده اند.
 

چکیده

مقدمه2

فصل اول3

1-1- فرایند کشف دانش و داده کاوی3

1-1-1- درک قلمرو3

1-1-2- انتخاب داده ها4

1-1-3- پاکسازی و پردازش اولیه4

1-1-4- کشف الگوها4

1-1-5- تفسیر و نمایش الگوها4

1-1-6- ارائه دانش5

1-2- معرفی برخی از روشهای داده کاوی5

1-3- تحلیل انحراف6

1-4- نمایه سازی7

1-5- قوانین وابستگی7

1-6- تحلیل توالی8

1-7- خوشه بندی9

1-8- دسته بندی12

1-9- پیش بینی12

1-9-1- درخت های تصمیمTree-based methods13

1-10- شبکه های عصبی مصنوعی14

1-10-1- شبکه عصبی چیست؟14

1-10-2- تطبیق های خود سازمانده17

1-10-3- تکنیک های نزدیکترین همسایه(Nearest Neighbor Techniques)17

1-10-4- استدلال مبتنی بر حافظه ((Memory-Based reasoning17

1-11- الگوریتم ژنتیک20

1-12- بهینه سازی22

فصل دوم24

2-1- داده کاوی در بازاریابی و مدیریت ارتباط با مشتریان بانک24

2-2- مدیریت ارتباط با مشتری و پروفایل سازی از ان ها25

2-2-1- شناسایی مشتریان26

2-2-2- جذب مشتریان27

2-2-3- حفظ مشتریان27

2-2-4- توسعه مشتریان27

2-2-5- مراقبت از مشتری29

2-2-6- داده کاوی و تحلیل رویگردانی مشتریان31

2-3- کاربرد های داده کاوی در کشف تقلب سوئ استفاده های مالی32

2-4-داده کاوی و پیش بینی عملکرد بانک37

2-5- داده کاوی در ارزیابی اعتبار مشتریان بانک39

3-5- کاربرد داده کاوی در ارزیابی عملکرد بانک ها52

4-5- نتیجه گیری:55

5-5– منابع.56

دانلود فایل

کاربرد داده کاوی در تجارت الکترونیک

کاربرد داده کاوی در تجارت الکترونیک

کاربرد-داده-کاوی-در-تجارت-الکترونیک

کاربرد داده کاوی در تجارت الکترونیک 
تعداد صفحات : 120 با فرمت ورد و قابل ویرایش
 
امروزه با گسترش سيستم هاي پايگاهي و حجم بالاي داده ها ي ذخيره شده در اين سيستم ها ، نياز به ابزاري است تا بتوان داده هاي ذخيره شده را پردازش کردواطلاعات حاصل از اين پردازش را در اختيار کاربران قرار داد . با استفاده از پرسش هاي ساده در SQL و ابزارهاي گوناگون گزارش گيري معمولي ، مي توان اطلاعاتي را در اختيار کاربران قرار داد تا بتوانند به نتيجه گيري در مورد داده ها و روابط منطقي ميان آنها بپردازند اما وقتي که حجم داده ها بالا باشد ، کاربران هر چند زبر دست و با تجربه باشند نمي توانند الگوهاي مفيد را در ميان حجم انبوه داده ها تشخيص دهند و يا اگر قادر به اين کار هم با شند ، هزينه عمليات از نظر نيروي انساني و مادي بسيار بالا است .از سوي ديگر کاربران معمولا فرضيه اي را مطرح مي کنند و سپس بر اساس گزارشات مشاهده شده به اثبات يا رد فرضيه مي پردازند ، در حالي که امروزه نياز به روشهايي است که اصطلاحا به کشف دانش بپردازند يعني با کمترين دخالت کاربر و به صورت خودکار الگوها و رابطه هاي منطقي را بيان نمايند .
داده کاوي يکي از مهمترين اين روشها است که به وسيله آن الگوهاي مفيد در داده ها با حداقل دخالت کاربران شناخته مي شوند و اطلاعاتي را در اختيار کاربران و تحليل گران قرار مي دهند تا براساس آنها تصميمات مهم و حياتي در سازمانها اتخاذ شوند …. 
 
چکیده :

فصل اول  مفاهیم داده کاوی

مديريت ذخيره سازی و دستيابی اطلاعات

ساختار بانک اطلاعاتی سازمان:

مفاهيم پايه در داده کاوي

تعاريف داده کاوي

مراحل فرايند کشف دانش از پايگاه داده ها

الگوريتم هاي داده كاوي

آماده سازي داده براي مدل سازي

ابزارهای تجاری داده کاوی Tools DM Commercial

منابع اطلاعاتی مورد استفاده

محدودیت های داده کاوی

حفاظت از حریم شخصی در سیستم‌های داده‌كاوی

کاربردهای داده کاوی

داده كاوي درمديريت ارتباط بامشتري

داده کاوی و مدیریت بهینه وب سایت ها

داده‌كاوي و مديريت دانش

فصل دوم : تجارت الکترونیکی

مقدمه اي بر تجارت الکترونيکي

ویژگی های تجارت الکترونیکی

طبقه‌هاي مختلف تجارت الکترونيکي

تفاوت تجارت الکترونيکي با تجارت سنتي

نقش دولت در تجارت الکترونيک

فصل سوم : شکل دهي موقعيت بازار

1- چار چوبي براي تحليل موقعيت بازار

1-1-پرورش موقعيت :

1-2-کشف هسته اصلي موقعيت :

1-3- شناسايي مشتريان هدف :

1-4- مطالعه توانمنديها و منابع شرکت :

1-5- اندازه گيري جذابيت موقيت :

2- ويژگي هاي تحليل موقعيت بازار در اقتصاد جديد:

3- دو نوع ارزش ( value type ) عمده

4- شناسايي نياز هاي برآورده شده و برآورده نشده :

4-1- فرآيند تصميم گيري مشتري

4-2- آشکارسازي نيازهاي برآورده شده و برآورده نشده

5- تعيين مشتريان ويژهاي که شرکت قصد متقاعد کردن آنهارا دارد.

5-1- روشهايي براي تقسم بندي بازار:

5-2-تقسيم بندي قابل اجرا و معني دار

_ تقسيم بندي قابل اجرا(Actionable Segmentation)

_ تقسيم بندي معني دار

5-3-ترکيب مناسبي از متغير ها

5-4-تناظر بازار و مشتريان هدف

6- تأمين منابع

6-1- منابع شركت :

6-2- شركا :

7- جذابيت يک موقعيت :

7-1- شدت رقابت

رقباي نزديک (Adjacent competitors)  :

بررسي رقبا : (competitor Map)

7-2-پويايي هاي مربوط با مشتريان :

7-3- فناوري :

7-4-سود دهي مالي :

8-ارزيابي نهايي(go/No-go)

آيا شركت قادر است در مورد ارزش يا ارزشهاي ارائه شده با ديگران رقابت كند؟

چگونه يك شركت يك سرويس آنلاين را توسعه مي دهد؟

يك سيستم منابع مناسب و موفق چگونه است؟

معيارهايي براي ارزيابي كيفيت يك سيستم منبع:

مشارکت (Partnership):

مدلهاي سوددهي براي شركتهاي آنلاين چه هستند؟

2-1- مدلهاي مبتني بر كاربر و شركت:

مدلهاي مبتني بر خلق ارزش توسط شركت:

واسط مشتري

1- هفت عنصر طراحي براي واسط مشتري

2- چه چيز تعيين كننده جلوه يك وب سايت است؟

3- محتويات وب سايت

4- تشكل ها در سايت

5- اهرمهاي مورد استفاده براي سفارشي كردن يك سايت

6- يك سايت چگونه با مشتريان خود ارتباط بر قرار مي كند؟

7- اتصال يك وب سايت با وب سايتهاي ديگر

8- اشكال مختلف تجارت در وب سايت

تبادل الكترونيكي داده ها (EDI)

1- انواع خريد يک شرکت

2- خريد مواد مستقيم

3- تبادل الکترونيکي داده ها (EDI)

EDI هاي نسل آينده

مراجع و ماخذ فارسی

مراجع و ماخذ لاتین و سایتهای اینترنتی

 

دانلود فایل

مفهوم داده کاوی و نقش آن در تصمیم گیری راهبردی

مفهوم داده کاوی و نقش آن در تصمیم گیری راهبردی

مفهوم-داده-کاوی-و-نقش-آن-در-تصمیم-گیری-راهبردی

مفهوم داده کاوی و نقش آن در تصمیم گیری راهبردی 

تعداد صفحات :  43 با فرمت ورد و قابل ویرایش
 
داده کاوی  یا کشف دانش در پايگاه داده ها (KDD) یکی از تکنیک های هوش تجاری است که امروزه شرکت ها و سازمان های پویا از آن برای تجزیه و تحلیل نیازهای مشتریان خود استفاده می کنند تا بتوانند براساس آن تصمیمات استراتژیکی را برای بهبود وضع جدید در سازمان بگیرند. که لازمه تحقق این امر داشتن پایگاه داده قوی و قابل فهم در آن سازمان یا شرکت است تا بتوان تمامی داده های مفید را برای تصمیم گیری از آن استخراج کرد. داده کاوی حتی در برخی مواقع می تواند منجر به تغییر سیاست های سازمان ها شود، یعنی از طریق داده کاوی مشخص می شود که سیاست کنونی سازمان در قبال مشتریان و سرویس گیرندگان اشتباه است. داده کاوی در ایران وضعیت خوبی ندارد. که این موضوع بدلیل آگاه نبودن مدیران سازمان ها با فنآوری داده کاوی و همچنین عدم وجود زیرساخت های سخت افزاری و نرم افزاری لازم در این زمینه است. به همین دلایل، در ایران از داده کاوی به عنوان یک ابزار کمکی برای کمک به اتخاذ تصمیم گیری های استراتژیکی استفاده نمی کنند. 

فصل اول: مفهوم داده کاوی

1-1:مقدمه

2-1:تعريف داده کاوی

3-1:تاريخچه داده کاوی

4-1:ويژگی های داده کاوی

5-1: متدولوژی CRISP Data Mining

6-1:زيربنای داده کاوی

7-1: عمليات داده کاوی

8-1:گام های داده کاوی

9-1: کاربرد هاي داده كاوي

1-9-1:داده کاوی دربانکداری

2-9-1:داده کاوی در بیمه

3-9-1:داده کاوی درکتابخانه ومحیط های دانشگاهی

4-9-1:داده کاوی درشهرالکترونیک

 

فصل دوم:تصميم گيری استراتژيک ونقش داده کاوی در آن

1-2: مقدمه

2-2: تصميم گيري

1-2-2: فرآيند تصميم گيري

2-2-2: انواع تصميم گيري

3-2-2: الگوهاي تصميم گيري

4-2-2: سبك ها و محيط هاي تصميم گيري

3-2: تصميم گيري استراتژیک

1-3-2:ابعاد تصمیم گیری های استراتژیکی

2-3-2: سطوح تصميم گيري استراتژیک

4-2: سيستم اطلاعاتي

5-2: سيستم هاي اطلاعات مديريت

6-2: هوش تجاری

1-6-2: قابلیت های هوش تجاری

2-6-2: زمینه های استفاده هوش تجاری

3-6-2: بهره گیران هوش تجاری

7-2: اطلاعات و تصميم گيري

8-2: سيستم هاي پشتيبان تصميم گيري

9-2: داده کاوی و مديريت دانش

10-2: داده کاوی و تصميم گيری استراتژيک

فهرست منابع و مآخذ

 

دانلود فایل

یادگیری درخت های تصمیم

یادگیری درخت های تصمیم

یادگیری-درخت-های-تصمیم

یادگیری درخت های تصمیم
تعداد صفحات : 45 با فرمت ورد و قابل ویرایش
 
یادگیری درخت تصمیم یکی از رایج ترین تکنیک های یادگیری ماشین می باشد که به دلیل سادگی و کارامدی باعث شده است علی رغم مشکلاتی که در استفاده از آن همچون صفات دارای نویز و یا صفات فاقد مقدار یا … وجود دارد به شکل گسترده ای در مسائل مربوط به یادگیری ماشین استفاده شود. در این تحقیق سعی شده است به مسائل اصلی مطرح در زمینهء درخت طراحی مانند بازنمایی، طراحی، عام سازی و مشکلات و راه کارهای برخورد با آنها که توسعه یافته اند پرداخته شود و همچنین از برخی مسائل غیراصلی مانند درختان رگراسیون، نرم افزارهای آزمایشگاهی و تست آماری χ2  نیز ذکری به میان آید.   

 

– چکیده   

مقدمه

1-1- اهداف اصلي درخت‌هاي تصميم‌گيري دسته‌بندي كننده 

1-2- جذابیت درختان تصمیم  

1-3- انواع درختان تصمیم

1-3-1- درختان رگراسیون 

2- بازنمایی درخت تصمیم  

2-1- توسعهء درختان تصمیم با گراف های تصمیم 

3- مسائل مناسب برای یادگیری درخت تصمیم  

4- چه صفتی بهترین طبقه بندی کننده است؟

4-1-1- بی نظمی همگونی مثال ها را اندازه گیری می کند.

4-1-2- نفع اطلاعات، کاهش مورد انتظار در بی نظمی را اندازه گیری می کند.

4-2- یک مثال تشریحی

4-3- حالت خاصی از ساخت درخت تصمیم

5- جستجوی فضای فرضیه در یادگیری درخت تصمیم

5-1- قابلیت ها و محدودیت های الگوریتم ID3

6- بایاس قیاسی (استنتاجی) در یادگیری درخت تصمیم 

6-1- بایاس های محدودیت و بایاس های ارجحیت   

6-2- چرا فرضیات کوتاهتر را ترجیح می دهیم؟ 

7- مسائل در یادگیری درخت تصمیم 

7-1- اورفیتینگ داده ها  

7-2- روشهای موجود برای ممانعت از اورفیتینگ

7-2-1- انواع روش های هرس کردن

7-2-1-1- تست chi-Square  

7-2-2- هرس خطای کاهش یافته 

7-2-3- هرس بعدی قانون  

7-3- بکاربردن صفات با مقادیر پیوسته 

7-4- معیارهای دیگر برای انتخاب صفات 

7-5- بکاربردن مثال های آموزشی با صفات فاقد مقدار

7-6- بکاربردن صفات با هزینه های متفاوت  

8- عام سازی درخت

8-1- طراحی یک دسته بندی کنندهء درخت تصمیم  

8-2- روش‌هاي اصلی برای طراحی دسته بندی کنندهء درخت تصميم

9- انواع يادگيري در درخت تصميم گيري

10- مزایا و معایب درخت تصمیم 

10-1- مزایای درختان تصمیم نسبت به روش های دیگر داده کاوی 

10-2- معايب درختان تصمیم

11- نرم افزارهای مفید برای درخت تصمیم    

12- الگوریتم یادگیری درخت تصمیم پایه

13- جمع بندی      

14- لغت نامه 

15- مراجع   


دانلود فایل

داده کاوی پایگاه داده ها

داده کاوی پایگاه داده ها

داده-کاوی-پایگاه-داده-ها

داده کاوی پایگاه داده ها 

تعداد صفحات : 63 با فرمت وردو قابل ویرایش
 
داده کاوي يکي از مهمترين اين روشها است که به وسيله آن الگوهاي مفيد در داده ها با حداقل دخالت کاربران شناخته مي شوند و اطلاعاتي را در اختيار کاربران و تحليل گران قرار مي دهند تا براساس آنها تصميمات مهم و حياتي در سازمانها اتخاذ شوند.
در متون آکادميک تعاريف گوناگوني براي داده کاوي ارائه شده اند. در برخي از اين تعاريف داده کاوي در حد ابزاري که کاربران را قادر به ارتباط مستقيم با حجم عظيم داده ها مي سازد معرفي گرديده است و در برخي ديگر، تعاريف دقيقتر که درآنها به کاوش در داده ها توجه مي شود موجود است.
 
فهرست مطالب

فصل اول

تعاریف داده کاوی

1-1مقدمه

2-1تعاريف داده کاوي

3-1طبقه بندی روش های داده کاوی

4-1مراحل فرايند کشف دانش از پايگاه داده ها

5-1بیان مسئله و فرموله کردن فرضیه

6-1انتخاب و جمع آوری داده ها

7-1پیش پردازش ها یا تبديل داده ها

8-1ویژگی های مقیاس بندی، رمزگذاری و انتخاب

9-1برآورد مدل یا کاوش در داده ها

10-1تفسير نتيجه یا تفسیر مدل و رسیدن به نتایج

فصل دوم آماده سازی داده ها

1-2آماده سازی داده ها

2-2نرمال سازی

3-2تفاضل ها و نسبت ها

4-2داده های از دست رفته

5-2تحلیل داده های نامنطبق

فصل سوم کاهش داده ها

1-3مقدمه

2-3کاهش موارد

3-3شناختی اجمالی از دانش داده کاوی

4-3ابعاد داده کاوی

5-3دسته بندی

6-3 داده ای که ایجاد شده است

7-3توان محاسباتی بالایی که قابل دسترسی است

8-3پیچیده شدن محیط و نیاز و ضرورت انکارناپذیر به یافتن دانش پنهان

9-3داده کاوی چیست؟ چرا داده کاوی نیاز است؟

فصل چهارم ویژگیها

1-4مقدمه

2-4ویژگی‌ها

3-4چیستی

4-4محدودیت‌های داده کاوی

5-4ابزارهای داده کاوی

6-4داده كاوي چيست ؟

7-4تعريفي از داده كاوی

8-4داده كاوي آنالیز آماری

9-4داده كاوي به چه كار مي آيد؟

10-4يک تعريف تئوريک از داده کاوی

11-4جمع بندی و نتيجه گيری

فهرست منابع


دانلود فایل