Parsi Coders
text mining - نسخه قابل چاپ

+- Parsi Coders (http://parsicoders.com)
+-- انجمن: Software Development Programming (http://parsicoders.com/forumdisplay.php?fid=37)
+--- انجمن: Other (http://parsicoders.com/forumdisplay.php?fid=85)
+--- موضوع: text mining (/showthread.php?tid=1736)



text mining - bakhtiari - 01-30-2012

سلام خسته نباشيد

در مورد data mining , text mining اطلاعاتي ميخواستم


RE: text mining - Amin_Mansouri - 01-30-2012

سلام
data mining
تو اوراکل ؟
سوال واضح تر بپرس



RE: text mining - bakhtiari - 01-30-2012

در كل پرسيدم كه data mining , text mining چيه


RE: text mining - Amin_Mansouri - 01-30-2012

:-)
http://fa.wikipedia.org/wiki/%D8%AF%D8%A7%D8%AF%D9%87%E2%80%8C%DA%A9%D8%A7%D9%88%DB%8C

http://artificial.ir/intelligence/thread2066.html


RE: text mining - bakhtiari - 01-31-2012



http://artificial.ir/intelligence/thread2066.html
[/quote]

من هر كاري ميكنم نميتونم عضو اين سايته بشم . ميشه عضو بشيد مقاله رو بگيريد


RE: text mining - Amin_Mansouri - 01-31-2012


.rar   2006-08JanneLouw(www.parsicoders.com).rar (اندازه 102.56 KB / تعداد دانلود: 10)


RE: text mining - bakhtiari - 01-31-2012

شرمنده من فايل فارسي ميخوام وقت ترجمه ندارم


RE: text mining - Amin_Mansouri - 01-31-2012

شرمنده منم مترجم نیستم
از اینجا میتونید مطلب ها روترجمه کنید به صورت انلاین
http://translate.google.com/#
اینجا هم ببین

به نام خدا
سازمان ها حجم زیادی از داده ها را که گردش کاری آنها را نشان می دهد ذخیره می کنند.تحلیل این داده ها برای تحلیلگران و کسانی که نقش تصمیم گیری در سازمانها را برعهده دارند از اهمیت فوق العاده ای برخوردار است.
تحلیل داده ها از آن جهت اهمیت دارد که می توان با استفاده از نتایج آن در مورد ادامه فعالیت ها برنامه ریزی دقیقتر و آگاهانه تری انجام داد.داده کاوی می تواند ابزار کارآمدی برای این منظور باشد.
در این روش داده ها به صورت تفکیک شده از هم و دارای ساختمان می باشند.هر نوع داده برای خودش مشخص است.مانند بانکهای اطلاعاتی.در صورتی که این بانکهای اطلاعاتی دچار افزایش حجم و اطلاعات شود استخراج و تفکیک اطلاعات به کندی و به سختی انجام می پذیرد.داده کاوی روش هایی را پیش روی افراد متخصص نرم افزار قرار می دهد تا بتوانند به کمک فرموله کردن اطلاعات ذخیره شده دچار افزونگی و حجم بالای ذخیره سازی نشوند و همچنین سرعت استخراج بالا و به راحتی انجام پذیرد.بانکهای اطلاعاتی که دارای جداول فرموله شده باشند پایگاه دانش نامیده می شوند.
Web mining:
با افزایش آمار سایت های ایجاد شده در اینترنت سازماندهی سایت ها و صفحاتی که توسط کاربران اینترنت مورد جستجو قرار می گیرد نیز افزایش یافته است.بنابراین کاربران اینترنت دوست دارند که با یک بار جستجو توسط موتور جستجوگر به موضوع مورد نظرشان دست پیدا کنند.مشخص کردن این موضوع که صفحه یا سایت یافت شده نزدیک به مورد جستجو شده باشد کار بسیار سختی می باشد.روش های مختلفی برای این کار وجود دارد.مثلا برای پیدا کردن کلمه راک موتور باید تشخیض دهد که کلمه جستجو شده مربوط به موسیقی راک می باشد یا مربوط به صخره است.موتور در این موارد با نگاه به اطلاعات رنکی که در اختیارش است ترتیب قرار گرفتن صفحات یافت شده را مشخص می نماید.سایت هایی که دارای رنک بالاتری هستند بالاتر از بقیه صفحات دیگر قرار می گیرند.برای سازماندهی سایت ها و صفحات از روش های وب کاوی استفاده می کنند.اطلاعات مفید یک سایت از درون هزاران سایت استخراج می گردد.از جمله الگوریتم هایی که در وب کاوی استفاده می شود الگوریتم انکبوت ، خزنده و ... می باشد.همچنین بر روی الگوریتم classification در وب کاوی هم تحقیقاتی در حال انجام است.این روش اکنون برای مفهومی کردن جستجوها استفاده می شود.مانند موتور جستجوی گوگل.
Text mining:
در این روش همه چیز به صورت متن در نظر گرفته می شود.این روش کاربردی تر و بهتر از دو روش قبل است.داده ها بر خلاف داده کاوی دارای هیچ ساختار و ساختمانی نیستند.به وسیله متن کاوی اطلاعات مفیدتری را می توان استخراج کرد.به عنوان مثال اگر ما یک صفحه وب را به صورت متن در نظر بگیریم این فایل متنی دارای تگ ها و علائم خاص دیگر می باشد.به کمک متن کاوی می توان اطلاعاتی که فقط به صورت متن است و مورد استفاده است را استخراج کرد و اطلاعات پرت را در نطر نگرفت.حال اگر تعداد فایلهایی که بخواهیم از آنها اطلاعات مفید را استخراج کنیم زیاد باشند نمی توانیم به صورت دستی این کار تفکیک را انجام دهیم.چون زمان زیادی برای این کار نیاز است.به خاطر همین از الگوریتمهای خاصی برای این کار استفاده می کنند که به صورت اتوماتیک و هوشمند دنبال داده مورد نظر باشند.از جمله الگوریتمها برای متن کاوی ، الگوریتم ژنتیک و خوشه بندی می باشد.

و اطلاعات جزئی از کاربران (برگرفته از برنامه نویس)
چکیده: متن کاوی یکی از تکنیک هایی است که در بررسی مکانیزه اطلاعات غیر ساختار یافته مورد استفاده قرار می گیرد. مدیریت رابطه با مشتری نیز یکی از راهکارهای مبتنی بر فناوری اطلاعات است که سازمان ها برای حفظ مشتریان خود آن را مورد توجه قرا رداده اند. در این مقاله به معرفی متن کاوی و کاربرد آن د رمدیریت رابطه با مشتری پرداخته می شود . در انتهای مقاله نیز نرم افزار کاوشگر معرفی خواهد شد.

Text mining یعنی که شما از یک متن اطلاعات مفیدشو بکشی بیرون . مثلا یک متن سنگین

راجع به مکانیک هواپیما داریم که 100 صفحه می باشد .

شما باید بشینی از این 100 صفحه او چیزایی که مفیدن رو بکشی بیرون ، مثلا روابط حاکم بر

موتور هواپیما رو بکشی بیرون و یا نحوه مصرف سوختش ، کلا یعنی خلاصه کردن و آنالیز کردن متن . البته بعضا به parsing هم بر میگرده . parsing هم که یکی از کارای Compiler است .

موفق باشید


RE: text mining - bakhtiari - 01-31-2012

حالا ميشه نحوه پياده سازي اينها رو تو اوراكل توضيح بديد


RE: text mining - Amin_Mansouri - 01-31-2012

(01-31-2012، 07:06 PM)bakhtiari نوشته: حالا ميشه نحوه پياده سازي اينها رو تو اوراكل توضيح بديد

https://www.google.com/#q=text+mining+%D8%A7%D9%88%D8%B1%D8%A7%DA%A9%D9%84&hl=fa&gbv=2&prmd=imvns&tbs=clir:1,clirtl:en,clirt:en+Oracle+text+mining&sa=X&ei=ZhQoT-PeMYOtiQfPj5XlAg&ved=0CG0Q_wEwCg&bav=on.2,or.r_gc.r_pw.r_cp.,cf.osb&fp=7a61e184aa7966eb&biw=1306&bih=626