فرمت مقاله : Word تعداد صفحات : 29 چکیده رشد فزاینده پایگاه دادهها در تقریبا هر ناحیه از فعالیت انسان باعث شده است که نیاز برای ابزارهای قدرتمند جدید برای تغییر دادن داده به دانش مفید افزایش یابد. برای برآوردن این نیاز محققان در ناحیههای مختلف مانند یادگیری ماشین[1]، شناسایی الگو، آنالیز داده آماری، بصری سازی داده[2]، شبکههای عصبی، اقتصاد سنجی، بازیابی اطلاعات، استخراج اطلاعات و..... روشها و ایدههایی را کاوش کردهاند. ذات غیرساخت یافته ی این متون، اعمال همان روشهایی را که ما در مورد پایگاه دادههای غیرمتنی بکار می بریم، غیر ممکن می سازد. بنابراین روشها و الگوریتمهای پردازش (پیش پردازش)خاصی برای استخراج الگوهای مفید موردنیاز است. متن کاوی اطلاعات متنی غیرساختیافته را استفاده میکند و آنرا برای کشف ساختار و معناهای ضمنی پنهان در متن بررسی میکند. در این مقاله ما به بررسی یکی از جدیدترین زمینههای مورد تحقیق در داده کاوی، متن کاوی میپردازیم. در این مقاله روشهای موجود برای پیش پردازش کردن، ...