مقاله ساپورت بازیابی اطلاعات درمورد ساخت و استفاده آنتولوژی

در 23 صفحه ورد قابل ویرایش ساپورت بازیابی اطلاعات در مورد استفاده وساخت آنتولوژی (antology) چكیده: بازیابی اطلاعات میتواند به ساخت آنتولوژیها و كاربرد مؤثر و مفمقاله ساپورت بازیابی اطلاعات درمورد ساخت و استفاده آنتولوژی|40089905|arshad100|تحقیق ساپورت بازیابی اطلاعات درمورد ساخت و استفاده آنتولوژی,پژوهش ساپورت بازیابی اطلاعات درمورد ساخت و استفاده آنتولوژی,مقاله ساپورت بازیابی اطلاعات درمورد ساخت و استفاده آنتولوژی,دانلود تحقیق ساپورت بازیابی اطلاعات درمورد ساخت و استفاده آنتولوژی,ساپورت بازیابی اطلاعات درمورد ساخت و استفاده آنتولوژی,ساپورت, بازیابی اطلاعات ,ساخت , آنتولوژی
با سلام و درود خدمت خدمت شما پژوهشگر عزیز در این مطلب از سایت فایل با عنوان مقاله ساپورت بازیابی اطلاعات درمورد ساخت و استفاده آنتولوژی هم اکنون آماده دریافت می باشد برای مشاهده جزئیات فایل به ادامه مطلب مراجعه نمایید .

در 23 صفحه ورد قابل ویرایش

ساپورت بازیابی اطلاعات در مورد استفاده وساخت آنتولوژی (antology)

چكیده:

بازیابی اطلاعات می‌تواند به ساخت آنتولوژیها و كاربرد مؤثر و مفید آنها، كمك كند. ما از استخراج واژة اصلی مبتنی بر تركیب و تجانس (Collocation)، جهت ارائه مفاهیم جدید، استفاده و در مورد ارائة ارتباط وسیع جهت اتوماتیك سازی جمعیت آنتولوژی با مثال، مطالعه می‌كنیم. ما، متدهای خود را در تنظیم پروژة كتابخانة دیجیتال، با استفاده از متدولوژی ارزیابی اطلاعات، ارزیابی می‌كنیم. در یك تنظیم مشابه، در مورد متدهای بازیابی مطالعه می‌كنیم كه ساپورت جهت‌یابی ارائه شده توسط روابط معنایی و لغوی موجود در اغلب آنتولوژیها را جهت كمك به كاربران در بررسی آنتولوژی تكمیل می‌كنند.

مقدمه:

متدهای جستجو، جهت یابی و سازماندهی اطلاعات اینترنت رایج امروز، دهه‌های تحقیق دوره بازیابی اطلاعات را پایه و مبنا قرار می‌دهند. این متدها مبنی بر قوانین آماری كنترل كنندة استفاده انسان از زبان، نه تنها در بازیابی سند و مدرك، بلكه در امورغنی‌تر به لحاظ معنایی مثل پاسخگویی به پرسش، مورد استفاده قرار می‌گیرند. یك شكل Semantic Web این است كه بسیار شبیه به Web است كه ما امروزه می‌شناسیم و انتظار داریم كه اسناد مدارك، سرشار از منافع قابل فهم باشند. این تفسیرها را در مورد اسناد وعبارات قابل توجیهی كه در جستجوی معانی مضمون اسناد ومدارك هستند، ارائه خواهند داد. ما توضیح می‌دهیم كه صورتهای صرفی IR چگونه می‌توانند در این امر، با كمك آرشیتكت‌های آنتولوژی غیرمعمولی، مؤثر باشند. تكنیكهای IR می‌توانند به تعریف، تشخیص و بررسی ثبات و تداوم آنتولوژی كمك كنند. هشت مرحله می‌توانند در پروسه ایجاد آنتولوژی متمایز شوند.

1- تعیین محدودة آنتولوژی

2- توجه به استفادة مجدد از قسمتهای مربوط به آنتولوژی موجود

3- بر شماری و ذكر كلیة مفاهیمی كه می‌خواهید

4- تعریف و تشخیص تاكونومی این مفاهیم

5- تعریف و تشخیص ویژگیهای مفاهیم

6- تعریف و تشخیص جنبه‌هایی از مفاهیم مثل اصول و ارزش‌های مورد نیاز وغیره

7- تعریف و تشخیص نمونه‌ها

8- بررسی ثبات و تداوم آنتولوژی

ما، از میان این مراحل، مراحل 3 و7 را با تكنیكهای مبتنی بر IR بررسی كرده و معتقدیم كه این مراحل می‌توانند به طور مفیدی با استفاده از تكنولوژی بازیابی قابل دسترس امروزی، انجام شوند. مرحلة 4 برای اتوماتیك سازی، مناسب است، در عین حال، مسئله حل‌شده‌ای به شمار نمی رود و مرحله 8 در مورد متدهای استدلال سمبولیك به گونه‌ای كه مثلاً در PACER و FACT اجرا می‌شوند، بهترین گزینه است. تكنیكهای IR ، علاوه بر اینكه جهت كمك به سازندگان آنتولوژی مورد استفاده قرار می‌گیرند، می‌توانند در جستجو، مرورگری و ارائه موارد غیرمترقبه نیز به كاربران كمك كنند. مردم تمایل دارند كه از Semantic Web شركتها جهت جستجوی اسناد و مدارك، بلكه جهت جستجوی اطلاعاتی در مورد روابط معنایی خاص، مثلاً در تنظیم كتابخانه های دیجیتال، استفاده كنند. بنابراین، روش‌هایی را جهت «بازیابی در یك سلسله مراتب مفهومی» ارائه می‌دهیم، كه در آن‌ها به جستجوی واقعی هماهنگی به نحوییكه توسط اغلب ابزارهای جهت‌یابی و ویراستارهای آنتولوژی ارائه می‌شود. ممكن است مناسب و كافی نباشد. پیشرفتهای گذشته، با ایجاد آلگوریتم‌های بازیابی سند و مدرك مفید امروزی جهت ایجاد و به‌كارگیری زیرساختار Semantic web، مستقیماً منجر به ایجاد پیشرفتهایی در آینده می‌شوند. اما دلیل متدولوژیكی بیشتری برای نزدیك تر كه من اقدامات Semantic web در IR به هم داریم، جامعه IR بر اهمیت ارزیابی، تأكید كرده است. با ظهور كنفرانس‌های بازیافت متن (IRC)، ارزیابی آزمایشی امور مربوطه به بازیابی، به پیشرفت چشمگیری رسیده كه منجر به پیشرفت سریع در امور ارزیابی شده، شده است. منافع مشابهی با اقدامات ارزیابی مربوط به بازیایب و اقدامات مربوط به امور پردازش زبان غنی‌تر به لحاظ معنایی، وجود دارند. جامعه Semantic web، از تأكید شدیدتر بر ارزیابی و اموری كه می‌توانند ارزیابی شوند، سود می‌برد. با خوردن غذای سگ خود، ارزیابی تجربی در مورد كلیه امور مورد بررسی در این مقاله انجام می‌دهیم.

بخش 2، تنظیمی را بررسی می‌كند كه كلیة امور در آن رخ می‌دهند. پروژه Language Links و (Lolali )Logic ، به هدف فراهم آوری امكان دستیابی مبتنی بر آنتولوژی به یك كتاب راهنمای الكترونیكی در فصل مشترك و واسط زبانشناسی و منطق. در بخش 3، اتوماتیك سازی مرحله 3 و ارزیابی آنرا، توصیف می‌كنیم. در بخش 4، در مورد اتوماتیك سازی مرحله 7 و ارزیابی آن، صحبت می‌كنیم در بخش 5، جستجو در سلسله مراتب مفهوم LaLaLi را ارزیابی می‌كنیم. در بخش 6، نتیجه گیری می‌كنیم.

2- LoLaLi:

كارما، و آزمایشات مربوط به آن، در تنظیم پرونده كتابخانه دیجیتال، انجام شدند. پروژه LoLaLi ، متدهایی را جهت گسترش مزمت قدیمی كتابهای راهنمایی علمی با ابزارهای الكترونیكی ، ارائه می‌دهد. این ابزارها به خوانندگان كمك می كنند كه به مضمون و محتوای كتاب راهنما دست یابند و این ابزارها، یافتن اطلاعات مربوطه را آسانتر می‌سازند.

طبق این مطالعه ، پروژه Handbook of Logic and Language در فصل 20 ص 1200 تمركز دارد، مانند آزمایشات از منابع Latex استفاده كردیم. پروژه LoLaLi، از سلسله مراتب مهم word net جهت فراهم آوری امكان دستیابی به كتاب راهنما استفاده می‌كند. سلسله مراتب مفهوم، غالباً جهت جهت یابی از طریق تركیب‌ها و تجانس‌ها اسناد در مدارك، مورد استفاده قرار می‌گیرند. آنها برای سازماندهی، نمایش دهی و ارائه اطلاعات متعدد،مفید واقع می‌شوند، و كاربرانی در جستجوی یك hypertext هستند و دارای الگوهای مرورگری سلسله مراتبی هستند، بهتر از كاربران دارای مسیرهای مرورگری متوالی، این كار را انجام می‌دهند. از اینرو، معماریهای مربوط به كتاب‌های راهنمای الكترونیكی باید الگوهای سلسله مراتبی را توجیه كننده یك سلسله مراتب مفهومی، روش مناسبی برای انجام این كار باشد. سلسله مراتب مهم LoLaLi با دست و توسط متخصصین این رشته كه اخیراً حدود 600 مفهوم را جمع آوری، سازماندهی و مرتبط ساخته‌اند، ایجاد می‌شود و یك سرویس دهنده مبتنی بر secame ، اطلاعات سلسله مراتبی را ذخیره می‌كند كه از طریق یك مجموعه از نوشته‌جات و Protégé هدفمند، ویرایش و به روز رسانی می‌شود. ما در بخش 3، توضیح می‌دهیم كه تكنیكهای اصلی IR، چگونه می‌توانند به نویسندگان در تعیین و انتخاب مفاهیمی جهت تحول در سلسله مراتب، كمك كنند.

هر مفهوم در سلسله مراتب LoLaLi، با یك توضیح و تفسیر، حاشیه نویسی می‌شود كه به طور خلاصه، آنرا توصیف می‌كنند. بعلاوه، مفاهیم دارای توصیفات طولانی‌تری هستند و آنها هم توسط نویسندگان، ارائه می‌شوند. سلسله مراتب، از یك مفهوم TOP با چهار شعبة اصلی در زیر آن تشكیل می‌شود : علم كامپیوتر، ریاضیات، زبانشناسی و فلسفه كه توسط روابط زیر موضوع، فوق موضوع (Subtopic-supertopic) ، سازماندهی و تنظیم می‌شوند. این روابط، تایپ می شوند و تایپها عبارتند از “per-of” ”is-a” هستند. سلسله مراتب در LoLaLi، بیشتر یك نمودار است یا یك قالب دقیق و واضح شكل 1 . روابط غیرسلسله مراتبی نیز در نظر گرفته شده و به منظور اهداف جهت یابی مورد استفاده قرار می‌گیرند؛ این روابط مشتمل بر Sibing(همشیره و خواهر)، “معانی دیگر” و “مفاهیم مربوطه” می باشند. مفاهیم موجود در سلسله مراتب LoLaLi نیز به منابع خارجی ارتباط دارند. مورد اصلی در میان این روابطHand book of Logicians lenguage می‌باشد، مثال‌های دیگر مشتمل بر روابط با ابزارهای مستقیم (on line) مربوطه می‌باشند روابط با Handbook ، مفهومی را در سلسله مراتب، به عنوان منبع وبخش‌های مربوطه موجود در Hand bookرا به عنوان هدف، اتخاذ می‌كنند. در بخش 4، ما توضیح‌می‌دهیم كه چگونه تكنیكهای IR به بررسی این امر كمك می‌كنند.

در حال حاضر ، كابران می‌توانند به شكل “آسانی”سلسله مراتب دست یابند از نتایج مطالعة یك كاربر، جهت یابی در راستای روابط معنایی فوق اینكه، با تسهیلات جستجوی كامل شده است كه كاربران را مجاز می‌سازد مفاهیم موجود در سلسله مراتب را به شیوه‌ای اختیاری، بیابند. دربخش 5، ما تكنیكهای اصلی IR را ارزیابی و توصیف
می‌كنیم.

5- جستجو در آنتولوژی

پس از بخش 3 و4 ، كه هدفشان، ساپورت IR در مورد ساخت آنتولوژی بود، مسیر را عوض كرده وبه بررسی ساپورت كاربران نهایی می پردازیم كه به منظور اهداف جهت یابی به آنتولوژی ها دستیابی دارند. پروسه مرورگری از طریق آنتولوژی جهت یافتن یك مفهوم ، می تواند تصور مناسبی در مورد چگونگی سازماندهی آنتولوژی و چگونگی ارتباط مفاهیم، به كاربر ارائه دهد، اما این پروسه همچنین می‌تواند پروسه مشكل و سختی باشد. مثال‌های مربوط به عدم موفقیت مرورگری در پروسه دستیابی به اطلاعات، مشخص هستند. و مشتمل بر مواردی می باشند كه ممكن است در سلسله مراتب موجود نباشند. در چنین مواردی، تكنیكهای IR می‌توانند این نیاز به اطلاعات را بررسی كنند. IR به جای تبعیت زا روابط معنایی در یك آنتولوژی به دستیابی تصادفی بر یك آنتولوژی و تفسیر انعطاف پذیر نیاز اطلاعاتی كاربر اشاره می‌كند.

امری كه ما در این بخش بررسی می كنیم به شرح زیر است، یافتن مفاهیم مربوط به یك پرسش معین در سلسله مراتب مفهومی، به عبارت دیگر، نیازهای اطلاعاتی كاربران، با استفاده از واژه‌های اصلی اختیاری و انتخابی تنظیم می‌شوند، در حالیكه “اسناد و مدارك” ،مفاهیم موجود در سلسله مراتب LoLaLi می‌باشند.

1-5- تحت یك سرپوش (Under the Hand)

ما در زمان سعی جهت بازیافت مفاهیم مربوط از یك آنتولوژی ، باید با چند مسئله سروكار داشته باشیم، از پرسش‌های تمایل دارند كه بسیار كوتاه باشند. تعداد واژه‌های اصلی درهر موضوع ، می توانند برابر با تعداد پرسش‌های محرك جستجوی وب، به طور میانگین دو واژه اصلی در هر موضوع، باشند.2/ اسناد ومدارك نیز بسیار كوتاه هستند. حتی اگر توصیف وسیعی در مورد مفاهیم داشته باشیم، اسناد و مدارك بازیافت شده، در مقایسه با مجموعه‌های آزمایش استاندارد، كوتاه هستند. 3/ مجموعه اسناد و مدارك كوچك می‌باشد. این امر، بدین معناست كه ممكن است یادآوری ،مسئله مهمی باشد. بازیابی در برابر سلسله مراتب LoLaLi ، یك كار بسیار دقیق است اما دارای شرایط و نیازهای یادآوری می باشد.