پشته وب معنایی
با توجه به گسترش روز افزون اطلاعات در وب و نیازهای جدید به وجود آمده، محققان به این نتیجه رسیدهاند که با استفاده از تکنیکهای کنونی مورد استفاده در وب، نیازهای انسانها بهطور کامل پاسخ داده نمیشود و در حقیقت وب راه زیادی را تا رسیدن به پتانسیل کامل خود داراست. ساده و قابل فهم بودن وب کنونی این امکان را فراهم کرده تا سازمانها و گروههای مختلف بتوانند اطلاعات خود را در آن قرار دهند و این امر باعث توسعه شگفت انگیز وب گشتهاست. هدف اول توسعه دهندگان وب نیز این بود که وب را فراگیر کنند. اکنون ذخیرهسازی و انتشار اطلاعات با سهولت انجام میشود اما این نوع ذخیرهسازی مشکلات زیادی را برای بازیابی و استفادههای بعدی از اطلاعات به وجود آوردهاست. این مشکلات در مواردی مانند جست و جو، بازیابی، ترکیب و مبادله اطلاعات در وب وجود دارد. راه حل این موضوع تغییر تفکر نسبت به دادهها و پیشرفت آنها در جهت هوشمندی و همچنین بیان آنها در ساختار معماری وب معنایی قبل از انتشارشان است. هدف وب معنایی این است که وب را بیش از آن که به شبکهای از مدارک تبدیل کند به شبکهای از دادهها تبدیل نماید. منابع وبی نباید شامل رشتههای یکپارچه متنی باشند بلکه آنها باید قادر باشند که معنای موجود در متن خود را نیز آشکار سازند. البته منظور از معنا عبارت است از معنایی که توسط ماشین قابل پردازش باشد. برای نیل به هدف فوق وب معنایی باید بین تصورات و واقعیتهای موجود در منابع وبی تعامل برقرار نماید در واقع همانطور که ما در دنیای حقیقی نیاز به زبان مشترک برای انتقال مفاهیم و معانی داریم در دنیای مجازی نیز نیاز به آن احساس میشود. وب معنایی به عنوان یک راه حل برای این مشکلات به وجود آمدهاست که هدف از آن به اشتراک گذاشتن اطلاعات در وب به صورتی هوشمند تر است به صورتی که نه تنها قابل فهم برای انسان باشند، بلکه ماشینها نیز توانایی فهم آن را داشته باشند. متأسفانه وب معنایی به آن سرعت که انتظارش میرفت به منصه ظهور نرسید. فعالیتهای استانداردسازی قابل توجهی در کنسرسیوم وب جهانگستر در حال ظهور است اما استفاده واقعی از تکنیک وب معنایی اندک است. بخشی از این مسئله به پیچیدگی مدل زیربنایی و این حقیقت که هنوز ما فاقد برنامههای کاربردی ای هستیم که به اندازه کافی این نوع پیچیدگی را پنهان نمایند بر میگردد.
سطوح هوشمندی داده
قدم اول در ایجاد وب معنایی تغییر تفکر نسبت به داده هاست. دادهها در وب معنایی میبایست هوشمند تر باشند تا توسط ماشینها قابل درک باشند. به این معنی که میبایست مفاهیم بیشتری همراه با دادهها ذخیره کرد که ماشینها توانایی درک آنها را داشته باشند. در شکل مقابل سطوح مختلف داده هوشمند نشان داده شدهاست. این روند به دادههایی که مفاهیم کافی برای درک توسط ماشینها در خود دارند ختم میشود.
- متن و پایگاه داده
- اسناد XML جهت دامنهای خاص
- طبقهبندی و اسناد با واژگان آمیخته
- آنتولوژی و قواعد
معماری وب معنایی
به منظور ایجاد یک محیط معنایی برای وب و همچنین رسیدن به اهداف در نظر گرفته شده و رفع مشکلات مانند جست و جو، بازیابی، ترکیب و مبادله اطلاعات در محیط کنونی وب، «معماری هفت لایه وب معنایی» توسط W3C(کنسرسیوم جهانی وب) مطرح شدهاست.
ایکسامال
ایکسامال یک استاندارد صنعتی قدرتمند و انعطافپذیر برای انتقال اطلاعات ساخت یافتهاست. به این معنی که مثلا در شرح یک کتاب میتوان عنوان را به عنوان یک بخش اطلاعاتی عنوان کرد، روشن است این نام در خارج از متن کتاب فاقد معنا و مفهوم است. این نام میتواند عنوان کتاب، شخصیت اول، بخشی از بیوگرافی یا نام نویسنده باشد، که فقط با بررسی ساختار نوشتار کتاب میتوان معنی دقیق آن را تعیین کرد. این زبان توسط کنسرسیوم شبکه جهانی به عنوان ابزاری برای به اشتراک گذاردن اطلاعات از طریق اینترنت ارائه شدهاست. ایکس ام ال به طراحان و تولیدکنندگان وب امکان میدهد تا برچسبهایی ایجاد نمایند که انعطافپذیری آنها در سازماندهی و نمایش اطلاعات بیشتر از سیستمهایی است که با اچ تی ام ال تهیه میشوند. این زبان همانند اچ تی ام ال یک زبان نشانه گذاری عمومی استاندارد است که به صورت ویژه برای ایجاد صفحات وب طراحی شده، با این تفاوت که ایکس ام ال بر خلاف اچ تی ام ال که تنها به قالب بندی سند یعنی تعیین ساختار و ظاهر آن میپردازد، امکان توصیف محتوای صفحات وب را با استفاده از ابردادهها فراهم میکند و نیز به کاربر اجازه میدهد تا بنابر نیاز، علائم نشانه گذاری جدیدی تعریف کند. تکامل زبانهای نشانه گذاری و ترویج استفاده از ایکس ام ال در خلق صفحات وب به تدریج زمینه ارتقای کیفی خدمات وب معنایی را فراهم میکند. در حقیقت تیم برنرزلی با تکیه بر ایکس.ام.ال و برخی فناوریهای دیگر که تحت هدایت کنسرسیوم وب در حال توسعه هستند، ایده وب معنایی را به عنوان نسل آینده وب مطرح کردهاست. عناصر ایکس.ام.ال گسترش پذیر و مرتبط هستند که قواعد نامگذاری سادهای دارند. همچنین اسناد ایکس.ام.ال برای انتقال اطلاعات بیشتر میتوانند گسترش داده شوند. عناصر ایکس.ام.ال به صورت والدین و فرزند با هم مرتبط هستند. برای درک ایکس.ام.ال باید بدانیم چگونه ارتباط ما بین عناصر ایکس.ام.ال نامگذاری و چگونه مندرجات عناصر توصیف میشوند. همچنین عناصر میبایست برچسب پایانی داشته باشند و بهطور مناسبی جاگذاری شوند.
آردیاف
RDF زبانی است بر اساس XML، که جهت تشریح مفاهیم و ایجاد اسناد در وب معنایی به وجود آمدهاست. اسناد RDF در واقع حاوی توضیحاتی در مورد اطلاعات در وب معنایی هستند به نحوی که آنها را قابل درک برای ماشینها میکند. اما آنچه که آن را با XML متفاوت میکند آن است که بجای برچسب گذاری بخش داخلی یک سند اطلاعات خارجی دربارهٔ آن سند نیز میتواند برچسب گذاری شود. مثلا در مورد کتاب: نویسنده، تاریخ نشر، دستهبندی موضوعی و...قابل انجام است. و همچنین یکی از موارد استفاده از RDF توضیح منابع غیر شفاهی( Opaque )مانند عکس و صداست.
عبارات آردیاف
هر عبارت RDF به صورت سه قسمت فاعل، گزاره و مفعول یا بسته به فعل مورد استفاده، گزرا به مسند بیان میشود. گزاره و فاعل خود از نوع منبع هستند و مغعول یا مسند نیز میتواند از نوع منبع یا رشتهای ثابت باشد. گاهی به عبارات Rdf سهگانه (Triple) نیز گفته میشود.علت این است که هر عبارت rdf شامل سه قسمت است.
در شکل فوق فاعل و مفعول به صورت بیضی و مسند به صورت مستطیل نمایش داده شدهاست.و ارتباطها به وسیله فلش نمایش داده میشوند. گزاره و فاعل خود از نوع منبع و مغعول نیز میتواند از نوع منبع یا رشتهای ثابت باشد. برای مثال به جمله زیر توجه کنید:
- Buddy Belden owns a business
- The business has a web site
- Buddy is the father of Lynne
این جملات ممکن است در اسناد یا نامههای یک شرکت موجود باشد و در صورت بیان آنها به صورتی استاندارد میتوان از آنها به عنوان دانش در شرکت استفاده کرد. این روش مدیریت دانش به صورت پایین به بالا است. جملات بالا را میتوان به صورت سه تاییهای زیر مطرح کرد:
/<#buddy><#owns><#business>
/<#business><#has-website>
/<#buddy><#father-of><#Lynne>
سه تاییهای بالا به زبان N3 مطرح شدهاند و علامت # نشان میدهد که شناساگر یکنواخت منبع مفهوم مربوطه، سند جاری است. ابزارهایی برای تبدیل N# به RDF نیز وجود دارد. برای مثال میتوان ابزار ینا که توسط شرکت اچپی ارائه شدهاست را نام برد. همچنین ابزارهایی جهت نمایش اسناد RDF به صورت گرافی وجود دارد. از این قبیل ابزارها میتوان به IsaViz ارائه شده توسط w3c اشاره کرد.
هستیشناسی
آنتولوژی ریشه در فلسفه دارد و مبدأ آن را ارسطو میدانند. در فلسفه آنتولوژیشاخهای از علم است که به بررسی موجودات و روابط میان آنها میپردازد. مفهوم آنتولوژی در وب معنایی کمی متفاوت از فلسفه است. یک آنتولوژی لغات و مفاهیم(معانی)که در تعریف و نمایش یک محدودهای از دانش به کار میروند را تعیین میکند و بنابراین معانی را استاندارد میکند. آنتولوژی توسط مردم، پایگاهای داده و برنامههای کاربردی که نیاز به اشتراک گذاری اطلاعات یک دامنه خاص را دارند استفاده میشود. آنتولوژِی از دو واژه onto به معنای هستی و logia به معنای مطالعه به وجود آمدهاست و در کل معنی هستی شناسی دارد. آنتولوژِی در وب معنایی واژهها و ارتباط بین آنها در دامنهای که استفاده میشوند را نشان میدهند. عناصر اصلی تشکیل دهنده آنتولوژِی عبارتند از: #مفاهیم
- ارتباط بین آنها
- خصوصیات آنها
به عبارت دیگر آنتولوژی ارتباط بین مفاهیم در اسناد وب و دنیای واقعی را مشخص میکند که با این کار اسناد مربوطه توسط ماشینها قابل پردازش و فهم میشود و به اشتراک گذاری بین عاملها را تسهیل میکند. در واقع میتوان گفت:
- Vocabulary+structure=taxonomy
- Taxonomy+relationship,constraints&rules=ontology
- Ontology+instance=knowledge
در زمینه وب آنتولوژیها یک مفهوم مشترکی از یک دامنه را تأمین میکنند. چنین فهم مشترکی برای حل مشکل چند معنایی لازم است زیرا دوبرنامه کاربردی ممکن است از دو لغت متفاوت برای یک معنی واحد استفاده کنند یا بالعکس از یک لغت واحد برای دو مفهوم متفاوت استفاده کنند. در واقع آنتولوژیها همکنشپذیری معنایی را فراهم میکنند.
زبان OWL
پروژههای وب معنایی زیادی در اتحادیه اروپا انجام شد که در آنها از تکنیکهای مختلفی جهت بیان آتنولوژی استفاده میشد. بر اساس همین پروژهها، زبانی استاندارد به نام OIL به وجود آمد که از آن جهت بیان آنتولوژی در اتحادیه اروپا استفاده میشد. کمی زودتر از اتحادیه اروپا، در آمریکا با پشتیبانی DARPA زبان آنتولوژی DAML جهت استفاده در وب معنایی به وجود آمد. در نهایت نقاط قوت و ضعف این دو زبان توسط W3C بررسی شد و بر اساس DAML و OIL زبان استانداردی به نام OWL به وجود آمد که بر اساس مدل شی گرا عمل میکند.
اهداف ایجاد این زبان شامل: اشتراک آنتولوژی، تکامل آنتولوژی، تعامل و ارتباط با آنتولوژیها، تشخیص ناسازگاری، قدرت بیان و انعطافپذیری، سهولت در استفاده، سازگاری با دیگر زبانها و استفاده بینالمللی است. همان طور که گفته شد، برای ایجاد آنتولوژی زبانهای مختلفی وجود دارد اما OWL قابلیتهای بیشتری دارد. برای مثال نسبت به زبان RDFS امکان استنتاج و استدلال قوی تری را به ما میدهد. این زبان خود دارای سه نسخه مختلف OWL Litte,OWL DL,OWL Full است که به ترتیب دارای سادگی بیشتر اما قدرت بیان کمتر هستند. البته در انتخاب و طراحی زبان آنتولوژی باید این اصل را در نظر گرفت که هر چه ابزارهای نمایش دانش پیچیده شوند و قدرت بیان بیشتری پیدا کنند توانایی آنها در پاسخگویی به سوالات به شکل قابل اعتماد کاهش مییابد. هرسیستمی که به میزان کافی پیچیدهاست تا مفید باشد، در ضمن شامل سوالات غیرقابل پاسخ نیز است. مانند نمونههای پیچیدهای از تناقضهای پایه مانند عبارت «این جمله غلط است.». در نتیجه ما نیاز به یک مصالحه میان قدرت بیان و توانایی استدلال داریم. انتخاب یکی از این زبانها به عنوان زبان آنتولوژی بسته به قدرت بیان و قدرت استدلال مورد نیاز ما در دامنه مورد نظر دارد.
منطق
یک قانون امکان یکسری از نتایج را از فرضیات قبلی فراهم میکند. شکل کلی آن به صورت زیر است:
If p is True Then q I True
در کل یک قانون یک عملی را از یکسری از شرایط برقرار تعیین میکند. منطق نیز رشتهای است که اصول استدلال را مطالعه میکند. با استفاده از منطق میتوان دانش غیر صریح در آنتولوژیها را به دانش صریح تبدیل کرد. البته میبایست توجه شود که منطق هیچ پیش فرضی را در ارتباط با صحت گذارهها نمیسازد. بدین معنا که اگر ورودیهای غلطی را وارد منطق کنیم خروجی ما نیز غلط خواهد بود.
برهان
در بحث برهان سیستمهای proof میبایست عمیق و کامل باشند. عمیق بودن بدین معناست که تمامی عبارات استخراج شده از فرضیات منطقی دنبال شده باشند و کامل بودن یعنی تمامی نتایج منطقی از فرضیات را بتوان در سیستمهای proof استخراج کرد. منطق گذارهای از لحاظ عمیق و کامل بودن سیستم proof یگانهاست. منطقهایی با قدرت بیان بیشتر چنین سیستم proof ای ندارند. زبانهای "rdf" و «owl lite» و «owl dl» را میتوان مختص منطق گذارهای دانست. زیرا آنها یک زیر مجموعهای از منطق گذارهای را شامل میشوند که هم قدرت بیان و هم قدرت استدلال مناسبی دارند، در واقع owl lite و owl dl تقریباً متناسب با منطق توصیفی که یک زیر مجموعهای از منطق گذارهای است میباشند و سیستمهای proof کارآمدی دارند.
اعتماد
لایه آخر اعتماد است که با استفاده از امضای الکترونیکی پدیدار میشود. وب تنها زمانی به پتانسیل کامل خود خواهد رسید که کاربران به ایمنی عملیات و کیفیت اطلاعات آن اعتماد داشته باشند. و در واقع با وجود اجازه برای هر شخص که عبارات منطقی را دربارهٔ منابع بیان میکند، برنامهها میخواهند که تنها استنتاج را براساس عباراتی که به آن اطمینان دارند انجام دهد در نتیجه بررسی کردن منبع عبارت جز کلیدی از وب معنایی است. در اینجا سوالاتی مانند سوالات زیر مطرح است.
- نویسنده چه کسی است؟
- آیا نویسنده واقعا آن کسی که ادعا میکند هست؟
- در مورد موتور استنتاج چه؟ آیا میتوان به آن اعتماد کرد؟
منابع
- مقدمهای بر وب معنایی، ابوالفضل آل احمد، دانشگاه تهران، دانشکده برق و کامپیوتر
- وب معنایی: راهنمایی در مورد آیندهٔ اکسامال، خدمات وب و مدیریت دانش (انگلیسی)
- نقش وب معنایی در ارتقا سیستمهای اطلاعات مکانی، کنفرانس سازمان نقش برداری، سال 1387
- John Wiley&Sons–The Semantic Web a Guide to the future of XML,Web Services,And Knowledge Management