متن کاوی و تحلیل آماری در عمل؛ بهره برداری از متن بدون ساختار در کاربردها

Practical Text Mining & Statistical Analysis For Non-Structured Text Data Applications

نویسنده :
گری ماینر دارسون دلن جان الدر اندرو فست توماس هیل رابرت ا. نیسبت
مترجم :
احسان رئیسی محمد امینی ولاشانی
نوبت و سال چاپ : 1 / 1398 تعداد صفحات : 236
نوع جلد / قطع: شومیز / وزیری وزن: 370
ویرایش : 0 شابک 9786002051554
موضوع اصلی : کامپیوتر موضوع فرعی : مهندسی کامپیوتر IT

دریافت فایل:

افزودن به علاقه مندی ها
موجود در فروشگاه قیمت : 45,000تومان

متن کاوی از جدیدترین شاخه های علمی به شمار می رود که خاستگاه آن در علوم رایانه بوده است ولی امروزه می توان آن را حوزه ای بین رشته ای دانست که علومی مانند زبان شناسی، علم اطلاعات و دانش شناسی، روانشناسی و غیره نیز در شکل گیری و تکامل آن نقش به سزا داشته اند. بر این اساس متن کاوی را می توان به نوزادی تشبیه کرد که در خانواده ی علوم رایانه متولد شده است ولی افراد دیگری چون معلم و جامعه نیز در تربیت و ترشیح آن نقش داشته اند. در حال حاضر متن کاوی شاخه ی بسیار مهمی است که شرکت ها و سازمان های بزرگ جهان برای محقق ساختن اهداف علمی، سیاسی، اقتصادی، امنیتی و فرهنگی خود بدان روی آورده اند. در ایران نیز چند دانشگاه و مرکز علمی در زمینه ی متن کاوی مشغول به فعالیت هستند که البته این فعالیت ها در مقایسه با اقدامات جهانی در این زمینه فاصله دارد.

از موضوعات مهم در متن کاوی نسبت آن با رشته ی زبان و ادبیات فارسی است. متن کاوی «استخراج اطلاعات ارزشمند و الگوها از داده های غیر ساخت یافته» خوانده شده است. از آن سو یکی از مهم ترین اهداف رشته ی زبان و ادبیات فارسی نیز همین موضوع است یعنی به تعبیری «فهم متن و الگوهای موجود در متن». بر این اساس می توان گفت این دو شاخه ی علمی اهداف مشترک دارند. این نقطه ی مشترک می تواند نوید بخش زمینه جدیدی باشد که از پیوند روش ها و ابزارهای دو رشته ی مذکور زاده خواهد شد. در واقع متن کاوی و رشته ی زبان و ادبیات فارسی مکمل یکدیگرند:
1. در زمینه متن کاوی ابزارهای بسیار قدرتمندی تولید شده که می توانند در استخراج دانش از متن بسیار کارا باشند ولی - چنان که در متن کتاب پیش رو نیز آمده است - به رغم آن که دانش های زبانی و ادبی از ضروریات متن کاوی هستند، متخصصانی که در زمینه ی متن کاوی فعالند، معمولاً با مسائل زبانی و ادبی به شکلی عمیق و جدی آشنا نیستند.
2. در رشته ی زبان و ادبیات فارسی روش هایی برای فهم و استخراج دانش از متن در دست است که صدها سال ورزیده شده و به خوبی فهم متن را محقق می سازد ولی در مقایسه با علوم رایانه به ویژه شاخه ی متن کاوی، ابزارهای موجود در رشته ی زبان و ادبیات فارسی چندان قدرتمند و سریع نیستند تا بتوانند نیازهای جدید این رشته را مرتفع سازند.

این کتاب دو بخش دارد: بخش نخست در ۶ فصل، تاریخچه، مبانی، روش ها و برخی ابزارهای مهم متن کاوی را تبیین کرده است. در بخش دوم کتاب اصلی ۳ نمونه کاربردی در زمینه ی متن کاوی تشریح شده و در قالب سناریوهای مختلف ابزارها و روش های گوناگون و متنوع متن کاوی شرح و بیان شده است. توضیح آن که در متن کتاب اصلی ۲۸ نمونه کاربردی مختلف مطرح شده است. اما بدان دلیل که بخش زیادی از ابزارها یا مجموعه ی داده های مذکور در نمونه های کاربردی رایگان و در دسترس ایرانیان نبود یا از یک روش و ابزار در چند نمونه ی عملیاتی استفاده شده بود و به نظر می رسید چنین تفصیلی ممکن است برای مخاطبان متن ترجمه شده ملال آور باشد. به دلیل همین ساختار و البته بیان روشن، منطقی و مسلسل وار مطالب، کتاب حاضر برای گروه های مختلف مخاطبان در سطوح گوناگون، منبعی بسیار ارزشمند و کاربردی به شمار می رود.

تا کنون دیدگاهی برای این کالا ثبت نشده است، شما اولین نفر باشید...