اهمیت بازیابی معنایی اشیای محتوایی وبی
کد خبر: 4079886
تاریخ انتشار : ۰۵ شهريور ۱۴۰۱ - ۰۹:۴۲
برگزیده سیزدهمین جشنواره فارابی تشریح کرد:

اهمیت بازیابی معنایی اشیای محتوایی وبی

الهه حسینی، برگزیده سیزدهمین جشنواره فارابی گفت: از کاربردهای اصلی پژوهش بنده این است که می‌توانیم فناوری‌های معنایی را تقویت و آنها را در کتابخانه‌های دیجیتال و پایگاه‌های اطلاعاتی به کار ببریم تا معنای بین داده‌ها را جست‌وجو و بازیابی کنیم.

الهه حسینی

آئین اختتامیه سیزدهمین جشنواره بین‌المللی فارابی ویژه تحقیقات علوم انسانی اسلامی تیرماه گذشته در سالن اجلاس سران کشورهای اسلامی برگزار شد و برگزیدگان این دوره معرفی شدند.
 
رساله دکتری «چارچوب معنایی برای یکپارچه‌سازی و بازیابی معنایی اشیای محتوایی وبی: رویکرد داده‌های پیوندی در بافت سرطان» اثر الهه حسینی، دانش‌آموخته دکترای علم اطلاعات و دانش‌شناسی دانشگاه الزهرا(س)، به عنوان اثر برگزیده سوم در بخش بزرگسال گروه فناوری اطلاعات، اطلاع‌رسانی و کتابداری تقدیر شد.
 
الهه حسینی درباره این اثر به ایکنا گفت: بنده به عنوان مدرس مدعو دانشگاه الزهرا مشغول به کار هستم و در دوره ارشد و دکتری به عنوان دانشجوی نمونه دانشگاه الزهرا(س) و دانشجوی برتر دکتری در پنجمین جشنواره ملی ادکا (اتحادیه انجمن‌های علمی-دانشجویی کتابداری و اطلاع‌رسانی ایران) در سال 1396 معرفی شدم. به غیر از جشنواره فارابی، رساله بنده برنده جوایز دیگری هم شده است؛ از جمله به عنوان یکی از ده رساله برتر در انجمن دکتری دابلین‌کور در سال 2019 معرفی شد. انجمن دکتری دابلین‌کور به عنوان یکی از زیرشاخه‌های انجمن آمریکایی علم اطلاعات و فناوری (ASIS & T) فعالیت می‌‌کند. همچنین به عنوان رساله برتر دکتری در یازدهمین جشنواره پژوهش و فناوری کتابخانه ملی ایران در سال 1399 معرفی شد.
بیشتر بخوانید:

اهمیت بازیابی معنایی اشیای محتوایی وبی

وی در ادامه با اشاره به اینکه رساله‌اش به راهنمایی امیر غائبی و مشاوره رویا برادر، در گروه علم اطلاعات و دانش‌شناسی دانشگاه الزهرا، انجام شد، افزود: هدف از این پژوهش ارائه چارچوب معنایی برای یکپارچه‌سازی و بازیابی معنایی اشیای محتوایی وبی در بافت سرطان بود. این پژوهش از نوع پژوهش کاربردی است که در مرحله اول یک پروفایل کاربردی را که مبتنی بر چارچوب سنگاپور بود، توسعه دادیم و در مرحله دوم آن را از منظر یکپارچه‌سازی و بازیابی معنایی آزمودیم.
 
حسینی یادآور شد: این پروفایل کاربردی دارای سه سطح و چارچوب معنایی ارائه‌شده است و چهار بُعد و هفت لایه دارد. به طور کلی نتایج این پژوهش نشان داد روشی که از طریق این چارچوب معنایی پیشنهاد شده می‌تواند به عنوان یک روش استاندارد و معتبر، شکاف بین نظر و عمل را از بین ببرد و نیز مدل‌سازی معناییِ داده را تقویت کند و با اصول داده‌ای فیر (FAIR) سازگار باشد. همچنین از طریق این روش توسعه پایگاه‌های داده‌ای از نوع نو. اس. کیو. ال (NOSQL) محقق می‌شود.
 
مدرس مدعو دانشگاه الزهرا ادامه داد: نتایج جزئی‌تر نشان داد که به واسطه این روش، بازیابی دانش محقق می‌شود و استدلال معنایی تقویت می‌شود و قابلیت استنتاج داده‌ها رخ می‌دهد. همچنین قابلیت کشف‌پذیری در سطح رابطه کلاس و زیرکلاس و نمونه و گراف رخ می‌دهد. قبل از این روش، چنین موجودیت‌هایی در جست‌وجو بازیابی نمی‌شدند، اما این مطالعه با رویکرد هستان‌شناسانه و دانش‌مدار و روشی که پیشنهاد کرد توانست ثابت کند که این حجم از داده در این سطوح هم قابلیت جست‌وجو و بازیابی پیدا می‌کند. بنابراین می‌‌تواند به عنوان یک مکمل در کنار بازیابی‌های مبتنی بر اس. کیو. ال. (SQL) به کار برود.

کاربردهای پژوهش

برگزیده سیزدهمین جشنواره فارابی تصریح کرد: از کاربردهای اصلی این مطالعه این است که می‌توانیم بازیابی معنایی را در کتابخانه‌های دیجیتال و پایگاه‌های اطلاعاتی محقق کنیم، چون رویکرد اصلی این مطالعه داده‌های پیوندی است؛ یعنی می‌توانیم بین داده‌های موجود در وب پیوند ایجاد کنیم. منظور از پیوند نیز ایجاد ارتباط معنایی بین داده‌ها است، چراکه وقتی ارتباط بین داده‌ها برقرار شود، معنا ایجاد می‌شود. علاوه بر این، معنا باید مورد بازیابی و جست‌وجو قرار گیرد. 
 
حسینی تأکید کرد: کتابخانه‌های دیجیتالی امروزی و پایگاه‌های اطلاعاتی فاقد این نوع جست‌وجو هستند و به جای اینکه جست‌و‌جو مبتنی بر مفهوم باشد مبتنی بر کلمه است، اما اگر بتوانیم فضای توصیف داده‌ها را به سمت توصیف معنایی پیش ببریم، می‌توانیم بین داده‌ها ارتباط برقرار کنیم و با استفاده از توصیف معنایی و غنی‌سازی بین داده‌ها، معنا را جست‌‌وجو کنیم.
 
وی ادامه داد: بنابراین از کاربردهای اصلی این مطالعه این است که می‌توانیم فناوری‌های معنایی را تقویت کنیم و آنها را در کتابخانه‌های دیجیتالی و پایگاه‌های اطلاعاتی به کار ببریم تا بتوانیم معنای بین داده‌ها را جست‌و جو و بازیابی کنیم، یعنی دانش را بین داده‌ها بازیابی کنیم نه صرفا کلمه‌هایی که بین اشیای محتوایی وجود دارد. در واقع بازیابی را دقیق‌تر و حرفه‌ای‌تر می‌کنیم تا بتوانیم جست‌وجو را مبتنی بر مفهوم پیش ببریم و معنا را بازیابی کنیم.
 
این پژوهشگر یادآور شد: در این مطالعه تلاش کردم که با استفاده از اجرای عملی و استفاده از رویکردهای هستان‌شناسانه و دانش‌مدار، بتوانم توصیف معنایی را بهبود ببخشم و ثابت کنم که می‌توانیم از این طریق بین داده‌ها معنا ایجاد کنیم و آنها را مورد بازیابی و جست‌وجو قرار دهیم. لذا امیدوارم بتوانیم نتایج این مطالعه را در کتابخانه‌های دیجیتالی در ایران برای موجودیت‌های فارسی به کار ببریم. البته چالش‌های زیادی داریم، چون آنچه بنده بر روی آن کار کردم بر روی موجودیت‌های داده‌ای زبان انگلیسی بود، زیرا ابزارهای ضروری پژوهش همانند هستان‌شناسی به زبان انگلیسی هستند، اما اگر بخواهیم چنین چیزی را برای داده‌های فارسی به کار ببریم، با چالش‌های زیادی مواجه هستیم و زیرساخت‌های اولیه فراهم نیست تا چنین چیزی را اجرا کنیم.

نیازمند آنتولوژی‌های فارسی هستیم

وی بیان کرد: ما به ابزارهایی همانند آنتولوژی‌های فارسی نیاز داریم که چنین چیزی به شکل چاپی و آنلاین در دسترس ما قرار ندارد، چون آنتولوژی‌ها در بافت‌های مختلف با هم فرق می‌کنند و باید آنها را طراحی کنیم و توسعه دهیم و رابطه بین داده‌ها را در بافت‌های مختلف پیدا و توصیف کنیم. متأسفانه در زبان فارسی چنین ابزارهایی طراحی نشده و توسعه داده نشده‌اند. دهه هفتاد در ایران، دهه توسعه اصطلاح‌نامه‌ها بود که ما چند اصطلاح‌نامه بسیار ارزشمند در موضوعات مختلف داریم، اما اصطلاح‌نامه‌ها سطوح پایین‌تری از آنتولوژی‌ها هستند.
 
حسینی در پایان گفت: ما نیاز داریم که به سمت آنتولوژی‌ها حرکت کنیم تا بتوانیم آنها را در بافت‌های مختلف به وجود بیاوریم و آنها را برای اهداف بازیابی معنایی استفاده کنیم. امیدواریم با برنامه‌ریزی‌ در سازمان‌های مادر همانند ایرانداک و کتابخانه ملی بتوانیم آنتولوژی‌ها را توسعه دهیم و برای چنین اهدافی استفاده کنیم تا کتابخانه‌های دیجیتالی زبان فارسی را برای جست‌وجوی معنایی تقویت کنیم. باید از همکاری‌ استاد راهنما و مشاورم و نیز از دست‌اندرکاران سیزدهمین جشنواره بین‌المللی فارابی و هیئت داوران تشکر کنم که رساله بنده را با دقت بررسی کردند.
انتهای پیام
captcha