أول صحيفة سعـودية تصــدرعلـى شبكـة الانتــرنت صحيفة يومية تصدرها مؤسسة الجزيرة للصحافة والطباعة والنشر

الطبعة الثانيةالطبعةالثالثةاختر الطبعة

Sunday 27th August,2000العدد:10195الطبعةالاولـيالأحد 27 ,جمادى الاولى 1421

القرية الالكترونية

تعدد طرق البحث يضاعف المشكلة
محركات البحث غير دقيقة ودقة النتائج تعتمد على معرفة المستخدم
المستخدم المبتدئ يضيع في بحر من المعلومات وبقليل من المعرفة يحصل على المراد
* تقرير عبدالعزيز أبانمي
الحديث عن محركات البحث حديث ذو شجون وفنون ففي عالم الشبكة العنكبوتية حيث تصطف مئات الملايين من المواقع والصفحات على طول الطريق يُصبح البحث عن موقع ما اشبه بمحاولة العثور على ابرة صغيرة في اكوام متراكمة من القش,
وقد تلعب محركات البحث وما اكثرها على الشبكة دورا مساعدا في زيادة فرص ايجاد موقع بعينه غير انه من المؤكد ان ذلك لن يتم بدون الكثير من الارهاق والمعاناة اللتين يتسبب فيهما تصفح وتقليب نتائج عملية البحث والتي تصل في اغلب الاحيان الى مئات الآلاف من الصفحات وما من شك في ان القارئ يلحظ كثرة تناول موضوع محركات البحث بشكل قد يؤدي الى تولد الاعتقاد بأن هناك تركيزا مبالغا فيه وتسليطا غير مبرر للاضواء على هذه الجزيئية من عالم الإنترنت، غير ان كثرة المتغيرات وتلاحقها بشكل دوري وتواصل التحديثات والتغيرات على خارطة محركات البحث بشكل شهري يحتمان علينا ضرورة العودة الى هذا الموضوع من الوقت الحاضر وتناوله ربما في المستقبل القريب.
وفي هذا التقرير سنحاول تقديم بعض النصائح التي تتركز بشكل اساسي على المساعدة في اختيار محرك البحث الذي يوفر للشخص حاجاته التي يبحث عنها وكيفية الاستفادة القصوى من محرك بحث ما وفي سبيل تحقيق هذين الهدفين سنحاول ضمن هذا التقرير اعطاء نبذة ووصف مختصرين لبعض المحركات البحثية المشهورة وتلك التي يتوقع لها البعض ان تكون لاعبا رئيسيا في هذا المجال اضافة الى تقديم بعض التقنيات التي تضمن اكبر استفادة ممكنة من محرك بحث ما.
وبداية لابد من التأكيد على ان مصطلح محرك البحث يتم استعماله للدلالة على عدة مفاهيم غير ان المفهوم الاقرب للصحة ان جاز التعبير هو ذلك الذي يتعامل مع محرك البحث على انه قاعدة معلومات خاصة بمواقع وصفحات الشبكة العنكبوتية، وما يقوم به اي محرك بحث هو استخدام أداة تعرف باسم ROBOT وهي اشبه بالعنكبوت في انها وبشكل افتراضي تتجول وتجوب في مختلف عوالم الإنترنت وتتفحص محتوى كل صفحة تمر بها ومن ثم تقوم بفرز هذه الصفحة ووضعها ضمن تقسيم معين بحيث يتم فيما بعد تحليلها وتحليل معلوماتها بحسب الظهور المتكرر لكلمة او عنوان ما.
ويوما بعد يوم وهذا طبعا على سبيل الافتراض تتكون لدى هذه العناكب المقدرة على ان تمشط ملايين الصفحات وتبين كما هائلا من القواعد المعلوماتية، غير ان الواقع يختلف تماما عما هو مفترض، فليس هناك من محرك بحث في امكانه ان يقوم بتغطية عالم الإنترنت بأكمله فمحرك البحث inktomi وهو المحرك الذي تمكن من التغلب على جميع محركات البحث الاخرى من حيث عدد الصفحات والمواقع التي قام بتصنيفها لا تتعدى نسبة تغطيته للشبكة العنكبوتية سوى 50% وحدث ذلك في شهر ابريل الماضي عندما بلغ عدد المواقع التي يتضمنها المحرك اكثر من 500 مليون موقع وهذا يعني ببساطة ان 50% من عالم الإنترنت لا يمكن الوصول اليه, ولكن هل في ذلك أي ضرر؟ الاجابة انه ليس بالضرورة ان يكون لذلك أي تأثير سلبي لسببين رئيسيين اولهما هو ان عالم الإنترنت مليء بما هو مفيد وهو ايضا مزدحم بالكثير من الغُثاء، ولذلك فإنه ليس هناك اي خوف من ان مواقع من مثل CNET.COM وBRITANNICA.COM وهي التي تقدم معلومات ثمينة وبشكل مجاني لن تظهر في اي محرك بحث, وثاني هذه الاسباب يتمثل في التغيير المستمر والدوري لمحتوى المواقع والصفحات مما يعني ان مهمة العنكبوت لن تكتمل ابدا لأنه لابد من ان يعود هذا العنكبوت الى الوراء ويُعيد فحص محتويات المواقع التي غطاها من قبل بشكل دوري بغرض رفع درجة دقة البحث وهذا الأمر يعني ببساطة انه كلما زاد حجم القاعدة المعلوماتية التي يحتويها محرك البحث كلما زادت المدة الزمنية لمثل هذه الخطوة وبالتالي فإن المعلومات تصبح اقدم، ومثل هذا الامر له انعكاسه المؤثر على مختلف محركات البحث وذلك لأنه في حال البحث ضمن مواضيع مشهورة ومنتشرة على نطاق واسع تكون احتمالات العثور على احدث المعلومات واقربها للدقة اكثر ضمن محركات البحث الصغيرة فيما يختلف الوضع تماما مع تلك المواضيع النادرة والمتخصصة والتي يبحث عنها القليل من الاشخاص اذ تُمثل محركات البحث المعروفة المكان الامثل للبحث عن مثل هذه المواضيع.
وهناك جانب آخر يتعلق بمحركات البحث يتمثل في اهمية استخدام قوائم الشبكة العنكبوية web indexes اذا ما رغب الشخص في رفع مستوى البحث ودرجة دقته وتجنب تصفح آلاف الصفحات التي تنتج عن عملية البحث التقليدية لأن معظم الباحثين عن موقع ما من خلال استخدام أي من محركات البحث يتوقفون بعد تصفح بضع صفحات من نتائج عملية البحث وفيما لا تحتوي هذه القوائم من مثل yahoo وgalaxy سوى على عدد اقل من قواعد المعلومات البيانية إلا انها تتمتع بخاصية هامة لها فائدتها القصوى وتتمثل في ان المسؤول عن موقع ما تم تضمينه داخل اي من تلك القوائم قادر على ان يقوم بإضافة نبذة مختصرة عن محتوى الموقع وهو ما ينعكس ايجابا على زيادة دقة القائمة لأن مثل هذا الامر يساعد هذه القائمة على تصنيف كل موقع على اساس الموضوع الرئيسي وعندها لن يحصل الشخص الذي يستخدم هذه القوائم في اية عملية بحث على آلاف النتائج بل انه سيحصل على ما يتطابق تماما مع الموضوع الذي يرغب في البحث عنه.
وفي الوقت الحاضر ظهرت نوعية ثالثة من محركات البحث يمكن وصفها بأنها محركات هجينة كونها بدأت كمحركات بحث تقليدية غير انها سرعان ما تبنت مبدأ اضافة القوائم ومن اشهر هذه المحركات alta vista وهي محركات اثبتت انها تتمتع بدرجة عالية من الاعتمادية والدقة.
وهناك ايضا نوع آخر يمكن تسميته بمحركات ما وراء او بعد البحث، وهي محركات لا تحتوي على قوائم معلوماتية خاصة بها بل تعتمد على تقنية ارسال طلبك الى العديد من محركات البحث الاخرى في نفس الوقت ومن ثم إعادة ترتيب النتائج وترتيبها على اساس درجة موثوقية والصلة بالموضوع المبحوث ونقصد بوثاقة الصلة بالموضوع عثور المحرك على مواقع تتطابق مع طلبك اما عدم العثور عليها فيعني انتفاء الصلة بالموضوع غير ان المشكلة تتمثل في انه ليس الابيض ابيض طول الوقت ولا الاسود اسود كذلك فهناك دوما منطقة رمادية، أي ان هناك درجات مختلفة من وثاقة الصلة بالموضوع وما يتسبب في ظهور الاختلافات بين محركات البحث هو الكيفية التي يتم من خلالها التعرف عليها او بمعنى آخر المعيار او المقياس الذي على اساسه يتم تصنيفها ولتقريب الصورة وجعلها اكثر وضوحا لنفترض انك تسير في ممر إحدى المكتبات العامة فكيف يمكن لك ان تحدد مدى ارتباط واتساق كتاب بما ترغب في العثور عليه؟ الجواب هو في القاء نظرة على عنوان ذلك الكتاب، وهو ما ينطبق من حيث المبدأ على جميع محتويات الشبكة العنكبوتية اذ ان اللغة التي يتم استخدامها في عالم الإنترنت هي HTML وهي تحتوي على العنوان title الذي يكون معروضا على الشريط الخاص بعنوان المتصفح، ومن ثم فإن محركات البحث تقوم بعملية مسح للعنوان بحثا عن كلمات رئيسية وجمل مشابهة لما يبحث عنه الشخص وحالما ينتهي المحرك من العناوين فإنه يتجه الى مسح محتوى الصفحة او الموقع بأكمله بحثا مرة اخرى عن الكلمات او الجمل الرئيسية التي يستهدفها البحث ويتركز البحث بشكل اكبر على بداية الصفحة.
غير ان الاهتمام بمدى تكرار ظهور كلمة او جملة رئيسية بدأ يتناقص كجزء مهم في عملية البحث مؤخرا كما ان محركات البحث الحديثة لم تعد تولي الجزء META وهو احد عناصر HTML ذلك الاهتمام الذي كان عليه الامر سابقا.
اختلافات ولكن
مما سبق يتضح ان محركات البحث تختلف فيما بينها بطريقة تعاملها مع وثاقة الصلة بالموضوع فالبعض يعتمد على TITLE فيما يلجأ البعض الآخر الى الطريقة التقليدية المتمثلة في تكرار ظهور كلمة او جملة ما وهنا تتبدى اهمية استخدام اكثر من محرك بحث واحد حتى تزداد فرص حصول الشخص على مبتغاه من مواقع او صفحات معينة على الشبكة العنكبوتية ولكن الامر الاهم من ذلك والذي يمكن اعتباره القاعدة الذهبية لأي عملية بحث هو ضرورة زيادة المعرفة الشخصية عن تقنيات المحركات البحثية المتقدمة واولى تلك التقنيات تتمثل في العمليات الرياضية وعمليات BOOLEAN ذلك ان مثل هذه المحركات المتقدمة تقوم على ثلاث افكار اولها وجود كلمات يريدها الشخص ان تكون متواجدة في المواقع التي يبحث عنها وثانيها وجود كلمات لا يريد الباحث وجودها اما ثالث هذه الافكار فيتمثل في تلك الجمل التي يريد الشخص العثور عليها بنفسها من دون زيادة او نقصان ولتحقيق الفكرتين الاولى والثانية يتم استخدام العمليتين الرياضيتين + و- وحتى تتضح الصورة بشكل افضل لنفترض ان شخصا ما يحاول البحث في موضوع الشبكات المنزلية HOME NETWORKING من دون ان يستخدم تينك العمليتين الرياضيتين فإنه من المحتمل وبشكل كبير جدا ان تظهر له مواقع عن بيوت معدة للبيع او مواقع مختصة بتأثيث المنازل او حتى تنظيفها كما ان الشخص سيحصل على عناوين لمواقع مكرسة لصيانة الشبكات والقائمة ستطول لأن المحرك البحثي يحاول البحث عن الكلمتين بشكل منفصل أي انه يمشط الشبكة متعقبا مواقع ظهور كل كلمة بمفردها على الرغم من انه يحاول جاهدا اعطاء الاولوية لتلك المواقع التي تحتوي على الكلمتين معا غير ان النتائج تظل دون المستوى ولكن ومن اجل التحقق بشكل افضل من ان الكلمتين متواجدتان في الموقع يتعين علينا ان ندخل عملية البحث بالشكل التالي + HOME + NETWORKING وذلك لأن استخدام علامة + يتطلب تواجد الكلمتين في الموقع أما عمليات BOOLEAN البحثية فتقوم على استخدام كل من AND - OR - NOT - NEAR واذا ما اردنا تطبيق مثل هذه العملية البحثية على المثال السابق فإنه يجب علينا كتابة ما يلي HOME AND NETWORKING ولكن هذا لا يعني عدم ظهور نتائج لا ترغب في ان تكون ضمن المواقع التي تقصدها وهنا يمكنك ان تستخدم الاشارة - او الكلمة NOT حتى تقصر بحثك على ما تريده وتتخلص من نتائج غير مرغوبة.
لكن المشكلة التي قد يواجهها الشخص اثناء محاولته الاعتماد على هذه التقنيات المتقدمة هي ان القليل من مواقع البحث تدعم مثل هذا النوع من التقنيات المتطورة خصوصا عمليات بحث BOOLEAN.
اما استخدام الاشارات الرياضية الحسابية فمتوفر على معظم المواقع البحثية ويمكن القول ان المواقع التي تقوم بتوظيف عمليات BOOLEAN البحثية لا تتعدى نسبتها 50% من اجمالي مواقع البحث المتوافرة على الإنترنت.
والحقيقة انه ومن خلال تجربة شخصية اجد ان محركات البحث التي استخدمتها تتقارب في مستوى نتائجها غير ان موقع ABOUT. COM كان الافضل بفضل خبرات المختصين الذين يعملون على الموقع، كما انه يتميز بقدراته الممتازة في مجال البحث البسيط والوصول الى مبتغى الشخص في اقصر وقت عبر عدد اقل من نتائج البحث.
وهناك ايضا محرك البحث altavista الذي لايزال يتمتع بقدرات مشابهه لتلك المتواجدة في ABOUT.COM، اما المواقع الاخرى التي انصح بها فهي كما يلي:
www.google.com search.msn.com
www.yahoo.com
www.askjeeves.com
www.alltheweb.com
www.hotbot.com
www.metacrawler.com
abanom@aol.com

أعلـىالصفحةرجوع

















[للاتصال بنا][الإعلانات][الاشتراكات][البحث]
أي إستفسارات أو إقتراحات إتصل علىMIS@al-jazirah.comعناية م.عبداللطيف العتيق
Copyright, 1997 - 2000 Al-Jazirah Corporation. All rights reserved