معرفی و دانلود کتاب داده کاوی با رپیدماینر: مدلسازی داده - جلد دوم
برای دانلود قانونی کتاب داده کاوی با رپیدماینر: مدلسازی داده - جلد دوم و دسترسی به هزاران کتاب و کتاب صوتی دیگر، اپلیکیشن کتابراه را رایگان نصب کنید.
معرفی کتاب داده کاوی با رپیدماینر: مدلسازی داده - جلد دوم
کتاب داده کاوی با رپیدماینر: مدلسازی داده - جلد دوم که در ادامهی جلد اول به رشتهی تحریر در آمده، مدلسازی با این نرمافزار را گام به گام بررسی کرده و سپس داده کاوی با آن را مورد بررسی قرار میدهد.
در دنیای امروز با توجه به پیشرفت فناوری و حضور پر رنگ آن در زندگی بشر، کاربرد داده و اطلاعات به وضوح دیده میشود. دادهکاوی یا Data Mining یکی از چندین روش استخراج اطلاعات از دادههای خام محسوب میشود. داده کاوی به معنای فرایند تجزیه و تحلیل داده و کشف الگوهای مفید در یک مجموعهی داده است.
در اطراف شما دادههای بسیاری هست که به طور چشمگیری در حال رشد هستند. لذا شما نیاز به تصمیمگیریهای کاربردی و هوشمندانه در حوزههای گوناگون دارید تا الگوهایی که بدان نیازمند هستید را از این دادهها استخراج کنید. اگر با ابزارهای موجود در این حوزه آشنایی نداشته نباشید، این فرایند میتواند برایتان مشکلساز باشد.
تعداد بسیاری از این ابزارها وجود دارند که برای دادهکاوی میتوانید از آنها بهره ببرید. با استفاده از آنها قادر خواهید بود اعمالی مانند کشف رابطهی میان دادهها، خوشهبندی دادهها، طبقهبندی آنها و… را به راحتی انجام دهید.
یکی از بهترین و کاربردیترین نرمافزارها در زمینهی دادهکاوی، نرمافزار رپیدماینر است که با زبان جاوا نوشته شده است. از جمله مزایای این نرمافزار میتوان به عدم نیاز کاربران به کدنویسی اشاره کرد که کار را برای آنها آسان کرده است. ابزارهایی که در این نرمافزار وجود دارد به کاربر این قابلیت را میدهد تا بر روی مجموعه دادهی خود به دادهکاوی بپردازد. از دیگر کاربردهای مهم این نرمافزار این است که میتوان هم در امور تجاری و کسب و کار و هم در امور تحقیقاتی، آموزشی و یادگیری از آن بهره برد.
این نرمافزار به علاقهمندان حوزهی دادهکاوی و یادگیری ماشینی این امکان را میدهد تا با بهرهگیری از این برنامه همهی مراحل مورد نیاز را از آمادهسازی اطلاعات اولیه تا بصری کردن نتایج، ارزیابی و اعتبار سنجی و... را در یک محیط یکپارچه انجام دهند.
نقاط قوت نرمافزار رپیدماینر:
- نمای گرافیکی خوب
- ظاهر پرداخته و آراسته.
- امکان تصحیح و خطایابی بسیار سریع.
- ارائه گزارش و رونوشت از مراحل اجرای الگوریتم.
- مستندات شامل راهنمای بسیاری از عملگرها در نرمافزار.
- قابلیت تطابق با فایلهای خروجی بسیاری از نرمافزارها مانند Excel.
- وجود آموزشهای ویدیویی مناسب که برای این نرمافزار تهیه شده و در وب قرار داده شده است.
- امکان اجرای همزمان الگوریتمهای یادگیری متفاوت در نرمافزار و مقایسه آنها با یکدیگر در ابزار در نظر گرفته شده است.
امکانات ویژه در این نرمافزار:
- امکانات متنکاوی نیز در این نرمافزار پیشبینی شده است.
- کلیه الگوریتمهای یادگیری مدل در نرمافزار دادهکاوی وِکا (WEKA) پس از به هنگامسازی رپیدماینر به نرمافزار اضافه خواهند شد.
- به دلیل پیادهسازی و توسعه این نرمافزار با استفاده از زبان جاوا، امکان کار در سیستمهای عامل مختلف از جمله ویندوز، لینوکس و سیستمهای مکینتاش برای این نرمافزار وجود دارد.
در بخشی از کتاب داده کاوی با رپیدماینر: مدلسازی داده - جلد دوم میخوانیم:
رگرسیون تکنیکی است که برای پیشبینی عددی بکار میرود. رگرسیون یک واحد اندازه آماری است که تلاش میکند تا قدرت رابطه بین یک متغیر وابسته (یعنی صفت برچسب) و یک دنباله از دیگر متغیرهایی را که متغیرهای مستقل نامیده میشوند (صفات منظم) تعیین کند. همانطور که طبقهبندی برای پیشبینی برچسبهای دستهای بکار میرود، از رگرسیون برای پیشبینی یک مقدار پیوسته استفاده میشود.
برای مثال ممکن است بخواهیم حقوق فارغالتحصیلان دانشگاهی را با 5 سال سابقه کار، یا میزان فروش بالقوه محصول جدیدی را که قیمت آن اعلام شده است، پیشبینی کنیم. اغلب اوقات از رگرسیون استفاده میشود برای تعیین اینکه فاکتورها و عوامل مخصوصی مانند قیمت یک کالا، نرخهای بهره، صنایع یا حوزههای مخصوص چقدر بر حرکت قیمتی یک دارایی اثر میگذارد. رگرسیون خطی تلاش میکند تا با منطبق کردن یک معادله خطی بر دادههای مشاهده شده، رابطه بین یک متغیر اسکالر و یک یا چند متغیر تشریحی را مدلسازی کند.
برای مثال ممکن است کسی بخواهد وزن افراد را با استفاده از یک مدل رگرسیون خطی، به بلندی قدشان مرتبط کند. این اپراتور یک مدل رگرسیون خطی را محاسبه و از معیار Akaike برای انتخاب مدل استفاده میکند.
معیار اطلاعات Akaike یک واحد اندازهگیری برای شایستگی و صلاحیت نسبی یک مدل آماری است. این معیار بر اساس مفهوم آنتروپی اطلاعات شکل گرفته است و در حقیقت هنگامی که از یک مدل خاص برای توصیف واقعیت استفاده میشود، این معیار یک اندازه نسبی از اطلاعات گم شده به دست میدهد. میتوان گفت این معیار مصالحه و توازن بین بایاس و واریانس را در ساختمان مدل، یا به بیان سادهتر و نه چندان دقیق، بین دقت و پیچیدگی مدل را، توصیف میکند.
فهرست مطالب کتاب
4- مدلسازی
4- 1- پیشگویانه
Create Formula
4- 1- 1- تنبل (Lazy)
4- 1- 2- بیزی (Bayesian)
4- 1- 3- درختها
4- 1- 4- قوانین
4- 1- 5- شبکههای عصبی
4- 1- 6- توابع
4- 1- 7- رگرسیون لجستیک
4- 1- 8- ماشینهای بردار پشتیبانی
4- 1- 9- تحلیل تشخیصی
4- 1- 10- روشهای دستهجمعی
4- 2- قطعهبندی
Agglomerative Clustering
Cluster Model Visualizer
DBSCAN
Expectation Maximization Clustering
Extract Cluster Prototypes
Support Vector Clustering
Top Down Clustering
k-Means
K-Means (Kernel)
K-Medoids
4- 3- وابستگیها
Apply Association Rules
Create Association Rules
FP-Growth
Generalized Sequential Patterns
4- 4 همبستگیها
Mutual Information Matrix
4- 5- شباهتها
Cross Distances
Data to Similarity
Similarity to Data
4- 6- وزن صفات
Data to Weights
Weight by Chi Squared Statistic
Weight by Component Model
Weight by Deviation
Weight by Gini Index
Weight by Information Gain
Weight by PCA
Weight by Relief
Weight by Rule
Weight by SVM
Weight by Uncertainty
Weight by User Specification
Weight by Value Average
Weights to Data
4- 7- بهینهسازی
4- 7- 1- پارامترها
4- 7- 2- انتخاب صفات
4- 7- 3- تولید صفات
4- 7- 4- وزندهی صفات
مشخصات کتاب الکترونیک
نام کتاب | کتاب داده کاوی با رپیدماینر: مدلسازی داده - جلد دوم |
نویسنده | علی صدیقی منش، برسام سوری، محمد صدیقی منش، سارا فتحی پوردیمان، شهاب طارقیان |
ناشر چاپی | انتشارات الهام نور |
سال انتشار | ۱۳۹۸ |
فرمت کتاب | |
تعداد صفحات | 409 |
زبان | فارسی |
شابک | 978-600-6947-60-0 |
موضوع کتاب | کتابهای آموزش نرمافزارهای مدیریتی |