مقاله رایگان درباره سلسله مراتب، پردازش اطلاعات

بر و کامل برای تولید هستی شناسی است .
2-4- استفاده از تکنولوژی معنایی برای استخراج و یکپارچه سازی محتوا
فرایند استخراج اطلاعات 35(IE) بخش کلیدی تکنولوژی های پردازش زبان طبیعی برای استخراج خودکار انواع خاصی از اطلاعات از مستندات و دیگر منابع و تبدیل آنها به رکوردهای پایگاه داده یا فیلدهای اشیاء در پایگاه دانش هستند. بدون فرایند استخراج اطلاعات باید استخراج و مطالعه هزاران سند متنی، وب سایت و داده های جدولی که حاوی اطلاعات مورد نیاز مدل ها و ابزارهای آموزش الکترونیکی است، بصورت دستی انجام شود.
یکی از تکیک های متداول و پرطرفدار استخراج اطلاعات، که در این پژوهش نیز مورد توجه قرار گرفته است استخراج اطلاعات مبتنی بر آنتولوژی (OBIE)36 است. OBIE فرایند شناسایی مفاهیم مناسب، ویژگی ها و روابط بین آنها )که در آنتولوژی بیان شده است( از متون و سایر منابع مشابه می باشد. تحلیل و کشف نام ها و مفاهیم هم مرجع در بین مستندات متعدد نیز همواره مورد توجه محققان این زمینه بوده است[Bag98] [Bag00] [Goo04]. فانک موفق به طراحی یک روش معنایی شد که در آن با بهره گیری از آنتولوژی، مفاهیم و نام های هم مرجع در یک مجموعه مستندات37 تا حد قابل توجهی کشف شدند [Fun07].
سایگون سعی در خلاصه سازی و ادغام مفاهیم و اسامی هم مرجع در بین چند سند، بوسیله خوشه بندی معنایی نمود[Sag08]. در همین زمینه، مان و یاروسکی از اطلاعات معنایی 38افراد که در مستندات مختلف موجود می باشد، برای الگوریتم های خوشه بندی سلسله مراتبی جهت استخراج و خلاصه سازی مفاهیم، استفاده کرده اند[Man03]. اصطلاح “اطلاعات معنایی” به کار برده شده توسط آنها به اطلاعات واقعی یک فرد از قبیل تاریخ تولد، اطلاعات شغلی یا تحصیلی فرد که در مستندات و منابع مختلف وجود دارد، اشاره می کند. در سیستم پیشنهاد شده در [Asw06]که برای یکسان سازی اشیاء و مفاهیم طراحی شده است، بطور مشابه از اطلاعات مختلفی که صفحات وب درباره دو فرد وجود دارد، شباهت یا ارتباط آنها کشف می شود. در پایگاه داده این مسئله با عنوان هایی مانند مشکلات “ارتباط رکوردی”39 یا “رفع تکرار” 40شناخته می شود که در واقع همان مسئله کشف رکوردهای اطلاعاتی )داده های( تکراری در حین ادغام پایگاه های داده مختلف می باشد. درباره این موضوع بررسی جامعی از روش های مختلف در [Elm07] انجام شده است. البته در حوزه وب معنایی بیشتر از اینکه به ارتباط و همکاری فیلدهای عددی در رکوردهای پایگاه داده پرداخته شود، شباهت معنایی فیلدهای رشته ای با استفاده از آنتولوژی های مختلف مورد توجه می گیرد[Yan08]. در [Yan08] یک چارچوب برای تشخیص دقت استخراج اطلاعات با استفاده از چند آنتولوژی مطرح شد؛ که این چارچوب را می توان برای روش های مختلف استخراج اطلاعات با آنتولوژی های متفاوت و یا برنامه های کاربردی که با چند آنتولوژی در ارتباط هستند، به کار برد.
واچ در تحقیقی جامع، روش های مختلفی که جهت یکپارچه سازی منابع اطلاعاتی مختلف از آنتولوژی ها استفاده می کردند را جمع آوری و دسته بندی نمود .[Wac01]شکل 2-3 رویکردهای متفاوتی که برای تشریح معنایی منابع اطلاعاتی مختلف بکار گرفته می شود[Wac01] را نشان می دهد.

شکل 2-3- رویکردهای مختلف برای استفاده آنتولوژی در تشریح مفاهیم
برای طراحی آنتولوژی های بکار برده شده در سیستم پیشنهادی از 41Protégé و برای تشریح آنتولوژی از زبان OWL42 استفاده می شود. به وسیله آنتولوژی بر اساس میزان کیفیت، رتبه بندی را انجام می دهد. سپس اطلاعات در قالب RDF در پایگاه دانش ذخیره می شود. علاوه بر این، با ذخیره سازی اطلاعات بوسیله
روش های معنایی، امکان ادغام و یکپارچه سازی اطلاعات مختلف در کمترین زمان امکان پذیر خواهد بود. یکی از تصمیمات مهم در فرآیند ساخت هستی شناسی، انتخاب ابزار ویرایش و زبان نمایش هستی شناسی است . این دو پارامتر روی چرخه حیات هستی شناسی، کیفیت و استاندارد سازی آن تاثیر مستقیم دارند . از نرم افزار Protégé به سادگی می توان بعنوان محیط ویرایش و توسعه هستی شناسی استفاده نمود. محیط Protégé با تعیین کلاسها، سلسله مراتب آنها و نمونه های عضو هر یک، هستی شناسی را بهتر توصیف میکند[Dui00]. این محیط امکان توسعه هستی شناسی یک حوزه را از طریق ابزارهای متعدد مدلسازی بسهولت فراهم میکند و میتوان به شیوه کاملا بصری و بدون نیاز به درگیری با جزئیات قالبهای فوق الذکر، به ساخت، دستکاری اجزاء و پشتیبانی هستی شناسی پرداخت. از 43OWL میتوان بعنوان زبان نمایش و توصیف رسمی مفاهیم در هستی شناسی استفاده نمود. این زبان علاوه بر نمایش سمبلیک معانی، روشهای رسمی را برای بکارگیری و پردازش آنها تعریف میکند. در این زبان جستجو و کشف روابط بین مفاهیم، یافتن ناسازگاریها در هستی شناسی، پردازش اطلاعات داخل مستندات بسادگی انجام می شوند. از این زبان می توان برای نمایش صریح معنی واژه ها در لغت نامه و ارتباط بین آنها استفاده نمود. زبان هستی‌شناسی وب(OWL) زبانی است نشانه‌ای44 جهت نشر و تبادل دانش در فضای اینترنت، این زبان هستی‌شناسی را مورد استفاده قرار می‌دهد[Wik12].
نرم افزارهای متعددی جهت ایجاد، توسعه و نگهداری هستی شناسی وجود دارد. این ابزارها غالباً قابلیت استفاده از متدولوژی های مختلف را دارند. در کنار ابزار مناسب، داشتن متدولوژی مناسب جهت ساخت موفقیت آمیز یک هستی شناسی از اهمیت بسیاری برخوردار است.
2-5- متدولوژی های متداول ساخت هستی شناسی
جهت ساخت هستی شناسی از متدولوژی های مخ
ت
لفی استفاده می شود که عبارتند از:
2-5-1- متدولوژی SENSUS-Based
این متدولوژی از هستی شناسی SENSUS که به منظور استفاده در پردازش زبان های طبیعی توسعه یافته است الگو گرفته است[Kni94]. محتوای این هستی شناسی از استخراج و ادغام اطلاعات موجود در منابع الکترونیکی بدست آمده است. هم اکنون این هستی شناسی دارای واژه هایی در سطح بالا و متوسط تجرید بوده و در حالت عمومی شامل واژه های مربوط به یک دامنه خاص نمی باشد. واژه های مربوط به یک حیطه خاص توسط الگوریتمی که در بیان شده است به این ساختار سلسله مراتبی متصل می گردند و مفاهیم اضافی حذف می گردند[Swa97].
2-5-2- متدولوژی METHODOLOGY
این متدولوژی در آزمایشگاه دانشگاه صنعتی مادرید توسعه داده شده است[Fer98]. این متدولوژی امکان این را دارد که هستی شناسی را در سطح دانش تولید نماید و شامل مراحل زیر می باشد:
* فعالیت های مدیریت پروژه: شامل طرح، کنترل و اطمینان از کیفیت می باشد. این امر شامل نحوه انجام کار، نحوه سازماندهی، زمان و منابع مورد نیاز می باشد.
* فعالیت های توسعه گرا: شامل مشخصه سازی به معنای اینک چرا هستی شناسی ساخته می شود و استفاده کنندگان چه کسانی هستند. مفهوم سازی به معنای ساختمند کردن اطلاعات یک محدوده در سطح دانش و پیاده سازی به معنای ساخت مدل با یک زبان رسمی و در نهایت نگهداری می باشد.
* فعالیت های پشتیبانی: مجموعه دیگر از فعالیت ها شامل بدست آوردن دانش، ارزیابی و یکپارچه سازی است که حین انجام فعالیت های توسعه گرا انجام می پذیرد.
2-5-3- متدولوژی Uschold and King
این متدولوژی بر اساس توسعه هستی شناسی Enterprise معرفی گردیده است[Usc95] و شامل مراحل زیر می باشد:
* شناسایی هدف: در این مرحله به یان سئوال که چرا هستی شناسی باید ساخته شود و هدف از ساخت آن چیست پاسخ داده می شود.
* ساخت هستی شناسی: شامل سه مرحله است:
o تسخیر: شامل شناسایی مفاهیم کلیدی بجای کلمات نمایش دهنده آنها، تولید تعریف بدون ابهام از مفاهیم، شناسایی واژه ها جهت توصیف مفاهیم و رابطه ها
o کد کردن: بدست آوردن نمایش دقیقی از دانش بدست آمده در مرحله تسخیر
o یک پارچه سازی هستی شناسی های موجود: شامل استفاده از هستی شناسی هایی است که تاکنون ساخته شده اند.
* ارزیابی: شامل داوری بر اساس آنچه در آمده است.
* مستند سازی: در این مرحله، روشی جهت تهیه مستندات ساخت ارائه می شود.
2-5-4- متدولوژی Gruninger and Fox
این متدولوژی بر اساس آنچه که در توسعه TOVE آمده مطرح گردیده است[Gru94]. این روش در واقع یک مدل منطقی از دانش تحت عنوان هستی شناسی ارائه می دهد. پروسه ساخت با توصیف غیر رسمی از مشخصات برآورد کننده نیازها و سپس تبدیل آنها به شکل رسمی صورت می پذیرد. مراحل این متدولوژی بصورت ذیل می باشد:
* تسخیر سناریوهای انگیزه بخشی: بر اساس آنچه در این متدولوژی آمده است، انگیزه توسعه هستی شناسی از سناریو های مختلف نشات می گیرد. این سناریو می تواند احتیاجات مورد نظر در یک نرم افزار یا مسائلی که در هستی شناسی های موجود مورد ملاحظه قرار نگرفته اند را در برگیرد. پاسخ به این نیازها می تواند بعنوان توصیفی غیررسمی از مفاهیم و روابط بین آنها مورد استفاده قرار گیرد.
* فرموله کردن سئوالات شایستگی: در این مرحله سئوالاتی بر اساس سناریوهای مرحله قبل تدوین می گردد. هستی شناسی می بایست قادر به پاسخ گویی به این سئوالات بر مفاهیم درون خود باشد. پاسخ به یک سئوال از یک سو می تواند منجر به پاسخ به سئوالی عمومی تر گردد و از سوی دیگر می توانند تعیین کننده محدودیت های یک هستی شناسی نیزباشد.
* توصیف واژگان یک هستی شناسی با یک زبان غیررسمی: این مرحله خود شامل دو زیر مرحله است:
* بدست آوردن واژگان غیررسمی: واژگان غیررسمی می توانند از سئوالات شایستگی استخراج گردند.
* مشخصات واژگان رسمی: در این مرحله واژگان بر اساس یک زبان رسمی مانند KIF تعریف می گردند.
* فرموله کردن سئوالات شایستگی با استفاده از واژگان هستی شناسی: بر اساس سئوالات شایستگی غیرفرمال و واژگان تعریف شده در هستی شناسی، سئوالات شایستگی فرموله می شوند.
* تعیین شرایط برای تعیین کامل بودن: شرایطی جهت تعیین این که آیا پاسخ به سئوالات شایستگی کامل هستند یا خیر استخراج می گردند.
2-5-5- متدولوژی Amaya Berneras
این متدولوژی تحت تاثیر روش مورد استفاده در پروژه KACTUS توسعه یافته است[Kac96]. یکی از اهداف این پروژه امکان سنجی استفاده مجدد از دانش در یک سیستم پیچیده و تعیین نقش هستی شناسی در این زمینه بوده است. یکی از مشخصه های این متدولوژی ساخت هستی شناسی مورد نیاز یک برنامه کاربردی در حین ساخت آن می باشد. مراحل این متدولوژی بصورت ذیل می باشد:
* مشخصات کابرد: زمینه کاربرد و مولفه هایی که قرار است مدل سازی گردد مشخص می گردد.
* طراحی مقدماتی بر اساس گروه های سطح بالای هستی شناسی: لیست واژگان و وظایفی که در مرحله قبل تعیین گردیده است جهت بدست آوردن یک دید کلی از هستی شناسی استفاده می گردد. این مرحله همچنین شامل بررسی و جستجوی هستی شناسی های موجود در دیگر کاربردها نیز می شود.
* پالایش و ساختمند کردن هستی شناسی: در مرحله پالایش بستگی های غیر ضروری به دیگر هستی شناسی ها حذف می گردد ت بیشترین همگنی در هستی شناسی حاصل گردد.
2-6- معرفی نرم افزار PROTEGE در ساخت هستی شناسی:
Protege یک ویراستار دانش و هستی شناسی است که در دانشگاه استنفورد طراحی شده است[Pro08]. از این ابزار می توان جهت تولید هستی شناسی یک دامنه و سفارشی
سازی ورود داده ها از طریق فرم استفاده نمود. این نرم قابلیت تعریف کلاس ها، سلسله مراتب کلاس ها، متغیرها، محدودیت مقادیر، رابطه بین کلا س ها و ویژگی های رابطه ها را دارد. علاوه بر آن این ابزار بصورت رایگان قابل دسترس می باشد. Protege با بسته های بصری ساز چون OntoVis و EZPAL ارائه می گردد. این بسته ها این اجازه را به توسعه دهنده هستی شناسی می دهند که هستی شناسی را در قالب یک نمودار مشاهده نمایند.آخرین نسخه برنامه Protege نرم افزار واسطی تحت عنوان (Semantic Web Rule Language) SWRL جهت قرار گیری بر روی OWL ارائه می دهد. با این کار که قابلیت استنتاج، بوسیله فراهم کردن قوانین شبیه پرولوگ فراهم می گردد. نقطه قوت Protege در این است که همزمان از سازندگان نرم افزار، مهندسان دانش و متخصصان حیطه های مختلف پشتیبانی می کند. این امر Protege را از دیگر ابزارهای موجود که تنها قابل استفاده توسط مهندسان دانش هستند متمایز می نماید. این ابزار همچنین امکان کسب، سازماندهی و بصری سازی دانش را قبل و در حین ساخت هستی شناسی رسمی فراهم می آورد.
2-6-1- مراحل ساخت هستی شناسی
برای ایجاد هستی شناسی دو روش خودکار و دستی وجود دارد. در روش خودکار از تکنیک های پردازش زبان طبیعی استفاده می کنندکه تا کنون روش خودکار قابل قبول ارائه نشده است. بنابر این از روشهای دستی و یا نیمه خودکار استفاده می شود[Mae04] [Lae02]. به اختصار می توان گفت ایجاد هستی شناسی جهت مشخص کردن واژه های مورد استفاده در دامنه ای خاص و روابط بین آنهاست. لازم به ذکر است که متدولوژی استانداردی برای تولید هستی شناسی وجود ندارد و بسته به کاربرد هستی شناسی از متدولوژی مورد نظری که کاربرد دارد استفاده می شود[Pop03] [Lae02]. همچنین در ایجاد هستی شناسیها به صورت بازگشتی عمل شده و می بایست اشیاء و مشخصات آنها را در حد نیاز مشخص کرد، در زیر روند استفاده از متدولوژی برای ایجاد هستی شناسی شرح داده شده است[Joh03].
2-6-2- برای ساخت هستی شناسی مراحل زیر را دنبال می کنیم:
2-6-2-1- مشخص کردن دامنه و محدوده هستی شناسی
هستی شناسی چه دامنه ای را می بایست پوشش دهد؟
برای چه استفاده ای نیاز به هستی شناسی داریم؟
برای چه نوع سوالاتی باید با هستی شناسی پاسخ را یافت؟
* می توان لیستی از سوالاتی که باید با استفاده هستی شناسی پاسخ داد، تهیه کرد و بررسی کرد که آیا هستی شناسی صلاحیت کافی را دارد.
* ضمناً باید به این نکته توجه داشت که پاسخ به این سوالات در فرآیند طراحی هستی شناسی ممکن است تغییر کند.
* همچنین اگر هستی شناسی برای افرادی باز بان دیگری به غیر از زبانی که هستی شناسی بر مبنای آن طراحی شده است مورد استفاده قرار گیرد، باید نگاشتی میان این زبان ها ایجاد کرد.
* یکی از روش های تعیین حوزه یک هستی شناسی تهیه لیستی از پرسش هایی است که سیستم KB مبتنی بر آن هستی شناسی باید قادر به پاسخ گویی به آن ها باشد، این پرسش ها را پرسش های توانش گویند که گزینشی هستند و نه فراگیر. برخی از پرسش هاش توانش می توانند به شرح زیر باشد:
الف)آیا هستی شناسی اطلاعات کافی جهت پاسخگویی به این نوع سوالات را دارا می باشد؟
ب)آیا پاسخ ها نیاز به سطح معینی از جزئیات و یا نمایش از یک حوزه خاص را دارا می باشند؟
2 -6-2-2-

Be the first to comment

Leave a Reply

ایمیل شما نمایش داده نخواهد شد


*