الأحد 23 ,ذو الحجة 1429

Sunday  21/12/2008

مجلة الاتصالات والعالم الرقمي العدد 271

Telecom & Digital World Magazine Issue 271

 
موقع الجزيرة بريدنا الإلكتروني الإعلانات أرشيف الصفحة الرئيسية

رؤى

البحث عن الجودة على شبكة الإنترنت!

 

 

رضا سي. بركان(*)

في المستقبل غير البعيد سوف يتمكن الطلاب من التخرج من المدارس الثانوية دون حتى أن يمسوا كتاباً واحداً. ومنذ عشرين عاماً كان بوسعهم أن يتخرجوا من المدرسة الثانوية دون استخدام الحاسوب الآلي على الإطلاق. في غضون بضعة عقود من الزمان أسهمت تكنولوجيا الحاسب الآلي والإنترنت في تبديل المبادئ الأساسية التي يقوم عليها التعليم والمعرفة والمعلومات.

لقد بات بوسعنا اليوم أن نسجل على القرص الثابت لجهاز كمبيوتر محمول عدد من الكتب يتجاوز ما تحتويه مكتبة تضم أكثر من ستين ألف عنوان. ويقال: إن عدد الصفحات على شبكة الإنترنت تجاوزت الخمسمائة مليار، وهو ما يكفي لملء عشر من حاملات الطائرات الحديثة بعدد مماثل من الكتب ذات الخمسمائة صفحة التي يزن كل منها رطلاً واحداً.

إن مثل هذا القياس يساعدنا في تصور ضخامة الانفجار المعلوماتي وإدراك الهموم والمخاوف المصاحبة له. إن محركات البحث تشكل الآلية الوحيدة للإبحار وسط هذا الطوفان الهائل من المعلومات. لذا لا ينبغي لنا أن نعتبرها مجرد أداة تكميلية اختيارية لتحديد موقع أقرب محل بيتزا. إن محركات البحث تشكل إحدى أقوى نقاط توزيع المعرفة والثروة، وبطبيعة الحال المعلومات المغلوطة المضللة.

حين نتحدث عن البحث على شبكة الإنترنت فإن أول اسم يتبادر إلى الذهن بالطبع هو (غوغل). وليس من قبيل المبالغة أن نقول: إن غوغل هي التي جعلت شبكة الإنترنت على ما هي عليه اليوم. فقد أسهمت في صياغة جيل جديد من الناس المختلفين اختلافاً بيناً عن آبائهم. والأفراد الذين ولدوا أثناء موجة ازدهار المواليد ربما كانوا الأكثر قدرة على فهم وتقدير هذه الحقيقة، وذلك لأنهم عاصروا موسيقى الروك آند رول في صباهم وعاصروا غوغل كآباء.

إن تصميم محرك البحث غوغل مبني على نظام الحلول الحسابية الإحصائية (الخوارزمية). بيد أن تقنيات البحث القائمة على هذا النظام غير قادرة على معالجة جودة المعلومات، وذلك لأن المعلومات عالية الجودة ببساطة لا تتسم بالشعبية دائماً، والمعلومات الشعبية لا تتسم بالجودة دوماً. فيمكنك أن تجمع المعلومات والإحصائيات لأيام وأسابيع أو إلى الأبد، ولكن ليس لك أن تتوقع من هذه الإحصائيات أن تحدث أثراً يتجاوز ما هي صالحة له. فضلاً عن ذلك فإن أنظمة جمع الإحصائيات تبدو رجعية أو متخلفة في مظهرها. فهي تفرض على الناس قضاء بعض الوقت لإعادة التوجيه، وبعض الوقت لجمع الإحصائيات. وعلى هذا فإن المطبوعات الجديدة والصفحات الديناميكية التي تغير مضمونها على نحو متكرر تقع بالفعل خارج نطاق الأساليب التي تعتمد على الشعبية، والبحث في هذه المواد عُرضة لأساليب التلاعب البدائية.

على سبيل المثال كان عدم كفاءة محركات البحث اليوم سبباً في خلق صناعة جديدة تسمى (تحسين محركات البحث»، والتي تركز على الاستراتيجيات اللازمة لجعل بعض صفحات الويب تأتي في مرتبة أعلى في مقابل معايير الشعبية التي تستخدمها محركات البحث على غرار غوغل. وهي صناعة تبلغ قيمتها مليار دولار. فإن كنت تملك من المال ما يكفي فيمكنك أن تجعل صفحتك على شبكة الإنترنت تأتي في مرتبة أعلى من العديد من الصفحات الأخرى التي تتسم بقدر أعظم من المصداقية أو الجودة. ومنذ ظهور غوغل لم تكن جودة المعلومات قط على هذا القدر من الخضوع للسلطة التجارية، كما هي الحال الآن.

إن جودة المعلومات المسبوكة في ظل البحث على الشبكة العالمية سوف تحدد مستقبل البشرية. بيد أن ضمان الجودة سوف يتطلب توجهاً ثورياً يتمثل في تطور تكنولوجي خارق يتجاوز الإحصائيات. والحقيقة أن هذه الثورة جارية الآن، ويطلق عليها التكنولوجيا الدلالية (semantic technology).

إن الفكرة التي تقوم عليها التكنولوجيا الدلالية تتلخص في تعليم الحواسيب الآلية كيف يعمل العالم. على سبيل المثال حين يصادف الحاسوب كلمة bill، فسوف يدرك أن هذه الكلمة لها خمسة عشر معنى مختلفاً في اللغة الإنجليزية. وحين يصادف الحاسوب عبارة killed the bill، فسوف يستنتج أن كلمة bill هنا ليس من الممكن أن تعني غير (مشروع قانون) مقدم إلى هيئة تشريعية، وأن كلمة kill لن تعني هنا إلا (وقف) أو (منع) ذلك القانون.

وفي المقابل فإن kill bill لن تعني إلا عنوان فيلم بهذا الاسم. وفي النهاية فإن سلسلة من هذه الاستدلالات المنطقية من شأنها أن تتعامل مع جُمَل وفقرات كاملة لتسفر في النهاية عن نص دقيق ذي معنى.

وللوصول إلى هذا المستوى من البراعة في التعامل مع اللغات عن طريق الحلول الحسابية (الخوارزمية) فلابد أولاً من بناء تبويب للمعارف. وتبويب المعارف ليس عبارة عن قاموس أو موسوعة مفردات، بل هو عبارة عن خريطة للمفاهيم المترابطة ومعاني الكلمات التي تعكس علاقات كتلك التي توجد بين كلمتي bill وkill في اللغة الإنجليزية.

إن بناء هذا النوع من تبويب المعارف وطبائع الموجودات على نحو قادر على احتواء معارف العالم قد يشكل مهمة مهولة تتطلب جهداً لا يقل عن الجهد المطلوب لجمع موسوعة علمية ضخمة والخبرات اللازمة لجمعها، ولكنها ليست بالمهمة المستحيلة. ولقد أخذت على عاتقها عِدة شركات ناشئة في مختلف أنحاء العالم، مثل Hakia وCognition Search وLexxe، مواجهة هذا التحدي. وليس علينا إلا أن ننتظر لنرى نتيجة هذه الجهود.

ولكن كيف لمحرك بحث يعتمد على تكنولوجيا الدلالات اللفظية أن يحل مشكلة جودة المعلومات؟ الإجابة بسيطة: من خلال الدقة. فبمجرد أن يتمكن الحاسوب من التعامل مع اللغات الطبيعية بالدقة الدلالية اللازمة، فلن يكون من الضروري أن تكتسب المعلومات العالية الجودة الشعبية أولاً قبل أن تصل إلى المستخدم النهائي، وذلك على النقيض مما تتطلبه محركات البحث على شبكة الإنترنت اليوم.

إن التكنولوجيا الدلالية تبشر بسبل أخرى لضمان الجودة، وذلك من خلال استكشاف ثراء وتماسك المفاهيم التي يحتوي عليها نص معين. فإذا كان النص يحتوي على جملة مثل Bush killed the last bill in the Senate (بوش منع مرور آخر مشروع قانون في مجلس الشيوخ)، فهل يحتوي باقي النص على مفاهيم متماسكة؟ أم أن هذه الصفحة عبارة عن رسالة إلكترونية غير مرغوبة وتحتوي على مجموعة من السطور الشعبية المنفردة الملفوفة بالإعلانات؟ إن التكنولوجيا الدلالية قادرة على تمييز طبيعة المحتوى.

نظراً للحدود التي تقيد سرعة القراءة بين البشر (200 إلى 300 كلمة في الدقيقة) والحجم الهائل من المعلومات المتاحة فإن اتخاذ القرار على نحو فعّال اليوم يستدعي استخدام التكنولوجيا الدلالية في كافة جوانب صقل المعرفة. فلا يسعنا أن نعيش مستقبلاً حيث تصبح المعرفة تحت رحمة الشعبية والمال.

(*) عالم نووي متخصص في الذكاء الاصطناعي، والمنطق التقريبي، ونظم المعلومات. وهو مؤسس هاكيا. حقوق النشر: بروجيكت سنديكيت، 2008 www.project-syndicate.org خاص لـ(الاتصالات والعالم الرقمي)

الصفحة الرئيسية

رجوع

حفظ

طباعة

 

صفحات العدد

متابعة

سطح المكتب

اتصالات

أخبارهم

ألعاب

تكنولوجيا

مواهب

بانوراما

إضاءة

إصدارات

إبحار

سوفت وير

هاكرز

رؤى

بصمة الخروج

 

خدمات الجزيرة

الإعلانات

الإشتراكات

الأرشيف

البحث

الجزيرة في موقعك

جوال الجزيرة

كتاب وأقلام

الطقس

للاتصال بنا

 

اصدارات الجزيرة