به گزارش ایکنا، حجتالاسلام والمسلمین مسیح توحیدی وحدت، مدیر پروژه قاموس نور، 11 اردیبهشت ماه در نشست خبری «رونمایی از نرمافزار، نسخه موبایلی و پایگاه قاموس نور»، گفت: ما یک پایگاه داده در موضوع فرهنگ واژگان عربی و فارسی طراحی کردهایم و از آن محصولات متنوعی استخراج میشود که خروجی آن در سه محصول نرمافزار رومیزی نسخه سه، پایگاه قاموس و نسخه موبایلی قاموس متبلور شده است.
وی با بیان اینکه قاموس نور 2، یک کتابخانه لغت است که 39 عنوان کتاب را در 200 جلد در خود جای داده بود، اظهار کرد: این کار، اولیه و ابتدایی بود و امکان نمایش متن کتاب و جستجو را داشت و محصول مشابه آن یعنی قاموس 3، 141 عنوان کتاب در 382 جلد کتاب را دارد که رشد خوبی محسوب میشود.
وی افزود: از این مجموعه کتب، یکسری کتب شامل فرهنگ واژگان است و به واژگان لغت در عربی و فارسی پرداخته است. این 141 کتاب در موضوع لغت و لغتپژوهی است ولی 33 عنوان کتاب، لغت در زبان عربی و 9 عنوان در فرهنگ واژگان فارسی داریم که در قاموس دو وجود نداشت و به این مجموعه افزوده شده است.
توحیدی وحدت با بیان اینکه از این تعداد کتاب، 54 عنوان مربوط به قرون اول تا 5 قمری و از قرن ششم تا دهم، 36 عنوان و از قرن 10 تا 15، 52 عنوان کتاب داریم، اضافه کرد: نکته دیگر، لغتنامه است و در این بخش از عناوین کتبی که به عنوان فرهنگ واژگان بودند مداخل و توصیفات مربوط به آن را استخراج و در بانک داده جداگانه قرار داده و هماهنگسازی کردیم تا فهرستی از مداخل و توصیفات مربوط به آن را داشته باشیم.
مدیر پروژه قاموس نور 3 گفت: قاموس نرمافزار 3 هوشمند است و از نرمافزارهای نوین در آن استفاده شده است. اولین کار در این زمینه برچسبگذاری لغات است یعنی یک کلمه را به عنوان مدخل، برچسب بزنیم و در ادامه توضیحات آن بیاید و البته در استخراج کلمات هم به صورت هوشمند عمل شده است یعنی صرفا از علائم ویرایشی که به کار رفته است الگو گرفتهایم و ماشین هم الگوهای ما را یاد گرفته و مداخل و الگوها را استخراج کرده است.
وی افزود: ما با این روش بالغ بر دو میلیون مدخل و توصیف را از حدود 34 عنوان کتاب داشتهایم. وقتی ما دو میلیون مدخل و توصیف داریم چون مخاطب دنبال رسیدن سریع به معنای یک لغت است بنابراین ناگزیر بودیم مداخل استخراجشده از کتب را هماهنگ کنیم لذا از مجموعه مداخل و توصیفات، آنها را در ذیل 135هزار مدخل نماینده قرار دادیم. برای تقریب به ذهن، یک مؤلف برای ارائه مدخل و توصیفات آن ممکن است از یک توصیفی استفاده کند که دیگری استفاده نکند به عنوان مثال، در استعمال واژه ذهب یکی آن را به معنای رفتن از یک شهر و دیگری از خانه معنا کرده است به همین دلیل دو میلیون مدخل استخراجی را ذیل مداخل نماینده قرار دادیم.
مدیر پروژه قاموس نور 3 اظهار کرد: در لغات به خصوص عرب ما فرهنگ مترادف را داریم یعنی دو لغت از جهت لفظ یکی هستند ولی از جهت معنا متفاوت یا رابطه تضاد که نشان میدهد یک مدخل مفهومی متضاد با مدخل دیگر دارد بنابراین ما شبکه ارتباطی میان مداخل را شکل دادیم تا کاربران شواهدی از آیات قرآن را در زیر هر مدخل مشاهده کنند یا در غریب الحدیث، شواهدی برای مداخل آمده است.
توحیدی وحدت بیان کرد: مسئله دیگر هوشمندی لغتنامه در ارائه سرویس و خدمت به مخاطب است؛ برای تقریب به ذهن، مراجعه ما به واژهنامهها و فرهنگ لغات اینطور است که وقتی به متنی برسیم و با معنای آن آشنا نباشیم سراغ این کتب میرویم و اولین کار ما این است که بداینم ریشه این کلمه عربی چیست. مثلا اگر ذهبنا است ریشه آن ذهب است و نباید انتظار داشته باشیم که «نا» معنا شده باشد لذا از طریق این ریشه به معنای ذهب پی میبریم و این کار در نرمافزار قاموس به صورت هوشمند و بدون اینکه مخاطب آن را انجام دهد تحقق مییابد.
وی افزود: در تمامی محصولات مرکز، نورلایب، نورمگز، پایگاه قرآن و حدیث و ... همه متون میتوانند با لغتنامه مرتبط شوند و این کار شده است، یعنی وقتی مخاطب حدیثی را میخواند و به کلمهای برسد که معنای آن را نمیداند واژه را در لغتنامه انتخاب میکند و آن هم به پایگاه داده، ارجاع داده میشود.
توحیدی وحدت با بیان اینکه برای ریشهیابی کلمات عربی، 5 سال زمان صرف شده است، تصریح کرد: البته چون این کار کافی نبوده است کلمه را ویراست کردیم تا به مدخل نماینده برسیم مثلا برای تبدیل «ذهبنا» به «ذهب» موتور هوشمندی طراحی شده است که لغات عربی را پیراسته کرده و ریشه کلمه را مییابد.
وی با اشاره به تفاوت میان این سه نسخه یعنی رومیزی، موبایلی و پایگاه قاموس، اظهار کرد: در نرمافزار قاموس 3، چون کتابخانه داریم اصل بیش از 300 کتاب موجود است ولی در پایگاه قاموس که به صورت وب است این کتب وجود ندارند و صرفا مداخل و توصیفات وجود دارند.
وی افزود: اپ موبایلی نوعی محدودیت در حجم دارد لذا نمیتوانستیم همه محتوای قاموس 3 را در آن بارگذاری کنیم به همین دلیل در عربی، سه کتاب و در فارسی لغتنامه دهخدا را داریم ولی امکان جستجوی برخط که همان سرویسی است که از پایگاه وب میگیرد در نسخه موبایلی هم وجود دارد.
مدیر پروژه قاموس 3 اضافه کرد: دو ویژگی در نسخه اپ و قاموس 3 این است که لیست فهرست 135 هزار مدخل عربی و 360 هزار مدخل فارسی در آن وجود دارد ولی در نسخه موبایلی به خاطر محدودیت این امکان را نداریم.
انتهای پیام