ساخت خطایاب فارسی"ویراست من" دستاورد آزمایشگاه پردازش متن و زبان‌های طبیعی

26 01 2022 05:11

کد خبر : 6407108

تعداد بازدید : 316

ویراستمن (ویراستار خوب من)

خطایاب املایی، معنایی زبان فارسی

 

در راستای صیانت از خط و زبان فارسی در فضای مجازی، بهتازگی، ابزاری با نام "ویراستمن" توسط آزمایشگاه پردازش هوشمند متن و زبان طبیعی دانشگاه تهران ارائه شده است. این ابزار به‌صورت یک افزونه روی محصولات Microsoft Word و همچنین در فضای وب به‌صورت یک ابزار CKEditor ارائه میشود. کاربران پس از نصب آن میتوانند به‌صورت کاملاً رایگان در محیط MsWord متون خود را از نظر ویژگیهای مختلف زبانی خطایابی و اصلاح نمایند.

همچنین این ابزار میتواند بسیاری از خطاها اعم از خطاهای املایی، سجاوندی، فاصله گذاری بین کلمات و همچنین برخی از خطاهای معنایی را به‌صورت کاملاً خودکار اصلاح نماید. برای حالتهای پیچیدهتر نیز از طریق ارائه پیشنهادها، کاربر را راهنمایی کند.

از قابلیتهای مهم ویراستمن میتواند موارد زیر را برشمرد:

  1. اصلاح خطالرسم بر اساس آیین نگارش فارسی و استاندارد سازی نگارشی: مانند رعایت فاصله، نیم فاصله، یکسان سازی کد کاراکترهایی چون "ی" و "ک"، فاصله گذاری مناسب بین علائم نگارشی و حروف،....
  2.  استاندارد کردن اعداد: شامل فارسی سازی آنها در صورت نیاز، پیشنهاد جداسازی 3 رقم 3 رقم، پیشنهاد حروفی برای اعداد، افزودن ریال یا تومان در صورت تشخیص آن بهعنوان مبلغ،....
  3. خطایابی املایی: با دقت بسیار بالا، کلماتی را که از نظر املایی اشتباه تایپ شدهاند مشخص میکند.
  4. پیشنهاد کلمات درست برای خطاهای تشخیص داده شده: لیستی از کلمات جهت جایگزینی پیشنهاد داده میشود. در 97% موارد گزینه درست در بین پیشنهادها وجود دارد و در 92% موارد گزینه درست همان پیشنهاد اول است.
  5. ارائه پیشنهادهای مناسب برای رفع خطاهای متداول: خطایی مانند کلمههای جمع نادرست (امورات یا امور)، استفاده از تنوین برای کلمات فارسی (گاها یا گاهی)، فرم صحیح نوشتن کلمات (پائیز یا پاییز)، فرم صحیح پیوسته نویسی کلمات (هیچگونه یا هیچگونه)، فرم صحیح اتصال حرف اضافه به (به‌صورت یا بهصورت)، فرم صحیح استفاده از گذار-گذر (شکرگزار یا شکرگذار).
  6. ارائه پیشنهادهای فرهنگستان زبان و ادب فارسی: در صورت فعال کردن این گزینه، پیشنهادهای فرهنگستان زبان و ادب فارسی در ابزار ارائه میگردد.
  7. تشخیص خطاهای تاریخ و پیشنهاد اصلاح آنها
  8. تصحیح خودکار (بدون دخالت کاربر) در موارد با اطمینان بالا.
  9. امکان افزودن کلمات جدید به لغتنامه خطایاب
  10. امکان اعمال یک اصلاح توسط کاربر به‌طور یکجا بر تمام خطاهای مشابه در یک متن.
  11. یادگیری خودکار سیستم از متنهایی که تا به حال ویرایش شده، برای متنهای جدید: احتمالات به کار رفته در مدل با کلمات متون جدید بهبود مییابد
  12. پس از مدتی سیستم نسبت به اصلاحات کاربران آموزش دیده و اولویتهای آنها را در ارائه پیشنهاد لحاظ میکند.

 

 

همه کاربران میتوانند از طریق سایت virastman.ir نسبت به دانلود و نصب آن ابزار اقدام نمایند. همچنین برای استفاده از ابزار در محیط CKEditor توسعه دهندگان وبسایتها میتوانند با تماس با آزمایشگاه نسبت به دریافت ابزار اقدام نمایند.

آزمایشگاه پردازش هوشمند متن و زبان طبیعی تحت سرپرستی دکتر هشام فیلی، استاد تمام دانشکده مهندسی برق و کامپیوتر دانشگاه تهران، بیش از یک دهه است که در زمینه توسعه ابزارهای مربوط به خط و زبان فارسی در محیط رایانهای فعالیت میکند. از جمله فعالیتهای قبلی این آزمایشگاه میتوان به توسعه مترجم هوشمند متون انگلیسی-فارسی که با نام فرازین (faraazin.ir) معرفی شده بود، اشاره کرد.