السبت، 24 أبريل 2010

إدارة المحتويات الرقمية العربية للنص الكامل بإستخدام برنامج جرينستون للمكتبة الرقمية : دراسة حالة المكتبة الرقمية للجمعية السودانية للمكتبات و المعلومات.


بسم الله الرحمن الرحيم

إدارة المحتويات الرقمية العربية للنص الكامل بإستخدام برنامج جرينستون للمكتبة الرقمية : دراسة حالة المكتبة الرقمية للجمعية السودانية للمكتبات و المعلومات.
كمال صالح مصطفي[1]
أمين مكتبة معهد الدراسات البيئية ، جامعة الخرطوم



     يهدف هذا البحث إلي توضيح الدور الذي يمكن أن تلعبه برمجيات المصدر المفتوح لنظم إدارة موارد المعلومات في دعم صناعة المحتوي العربي، بإستخدام برنامج جرينستون للمكتبة الرقمية في إدارة المحتويات الرقمية العربية للنص العربي الكامل ،من خلال دراسة حالة المكتبة الرقمية للجمعية السودانية للمكتبات والمعلومات ،مجموعات النص الكامل وهي مجموعة المؤتمر العام للجمعية و مجموعة أدبيات المكتبات و المعلومات و مجموعة نشرات الجمعية . وبالإشارة إلي الدور الذي يمكن أن تلعبه الجمعيات المهنية للمكتبات و المعلومات العربية في بناء المكتبات الرقمية.أوضح البحث ،أنواع المصادر الرقمية العربية،إعداد المصادر باستخدام واصفات البيانات الخارجية و الداخلية، وبناء المجموعات الرقمية العربية ، وإتاحتها للباحثين.و توصل البحث إلي أن البرنامج و من خلال التسهيلات التي يقدمها لبناء المجموعات الرقمية العربية يمثل أداة فاعلة في صناعة المحتوي العربي، و دعم مبادرات المصادر المفتوحة و الوصول الحر للمعلومات العلمية والتقنية .
الكلمات المفتاحية :
     المكتبات الرقمية، إدارة المحتويات الرقمية، المحتوي العربي، برنامج جرينستون للمكتبة الرقمية، النص الكامل



1 ـ الإطار العام للبحث
 1-1 الهدف
     يهدف هذا البحث إلي إلقاء الضوء علي قدرات برنامج جرينستون للمكتبة الرقمية في تنظيم و معالجة و بحث النص العربي الكامل حيث تناول:.
·     أنواع المصادر الرقمية العربية للنص الكامل.
·     بناء المجموعات الرقمية للمصادر العربية.
·     استخدام معايير واصفات البيانات في توصيف المصادر الرقمية العربية.
·     استخدام معايير واصفات البيانات في التوصيف الداخلي لبنية هيكل   المصادر الرقمية العربية.
·     معالجة البيانات الإيضاحية (جداول ،صور..الخ) في نص الوثيقة العربية.
·     بناء هياكل التصفح من واصفات البيانات و نقاط الإختيار الهجائية.
·     أساليب البحث البسيط و البحث المتقدم لوثائق النص الكامل العربية.
2-1 حدود الدراسة 
     تسعي الدراسة لدراسة نوع واحد من مصادر المعلومات الرقمية و هو النصوص الكاملة باللغة العربية و بتنسيقات PDFوTEXTوHTMLوWord في المكتبة الرقمية للجمعية السودانية للمكتبات والمعلومات ، مجموعة الدراسات السودانية في مجال المكتبات و المعلومات باللغة العربية ، وتضمنت الدراسات في الفترة الزمنية مابين 2001 حتى 2004 .مجموعة المؤتمر السنوي للجمعية عام 1998، مجموعة نشرات الجمعية للأعوام 2003 ، 2004. و قد تم ذلك بإستخدام برنامج جرينستون  للمكتبة الرقمية. و قد أقتصرت الدراسة  علي ما هو منشور علي موقع برنامج جرينستون في 2005.
3-1 الاهمية
     تكمن أهمية البحث في توضيح الدور الذي تلعبه برمجيات المصدر المفتوح في دعم صناعة المحتوي العربي، و الإشارة إلي الدور الذي يمكن أن تلعبه الجمعيات المهنية للمكتبات و المعلومات العربية في بناء المكتبات الرقمية.

4-1 منهج البحث
     قام الباحث باستخدام المنهج الوصفي لمعالجة الظاهرة قيد البحث. و قد اعتمد الباحث علي دراسة الإنتاج الفكري لموضوع الدراسة باللغتين العربية و الانجليزية.و استخدم اسلوب دراسة الحالة لمكتبة الجمعية السودانية للمكتبات و المعلومات الرقمية.
5-1  مصطلحات الدراسة
المكتبة الرقمية: يعرف إيان هـ. ويتن ، شتيفان بودي و جون تومبسون (2004 ص 97) المكتبة الرقمية "بأنها مجموعة كيانات رقمية (نص، سمعية ،فيديو) توضع مع مناهج للوصول والاسترجاع ، وللاختيار والتنظيم والصيانة".
الوثيقة Document: أشار تعريف شريف كامل شاهين (مارس 2005 ص 6) للوثيقة بأنها ". (مواد Materials) تشمل كافة أنواع وأشكال مصادر المعلومات من تقرير وكتاب ومقال ودورية وأطروحة   وموقع على الإنترنت ومواد مسموعة ومرئية ومصغرات فيلمية...الخ. والوثيقة بهذا المعنى الاصطلاحي تشمل المكونين الأساسيين الحاوية Container, والمحتوى Content أو اختصاراً "C & C.
مجموعة Collection : مجموعة وثائق جمعت معا تحت واجهة موحدة للبحث والتصفح .
6-1  الدراسات السابقة
     الدراسات العربية عن برامج جرينستون قليلة جدا، حيث أنجز طلال ناظم الزهيري ( 2008 ) دراسة هدفت إلي تطبيق إستخدام البرنامج في بناء المكتبات الرقمية الشخصية .و توصل إلي نتائج عديدة بعد التطبيق الفعلي للبرنامج كان من أهمها ملائمة النظام و فاعليته في بناء مختلف أنواع المكتبات الرقمية.
     قام متولي محمود النقيب (2007 ،ص 5) بتطبيق بعض المعايير لتقييم برمجيات المكتبات الرقمية المفتوحة المصدر وتضمنت برنامج جرينستون، بإستخدام قوائم الفحص و هي إدارة المحتويات، واجهات المستخدمين، إدارة المستخدم .وانتهي إلي عدم ملائمة النظام في المنطقة العربية قياسا إلي ديسبيس Dspace .
     تعددت الدراسات باللغة الإنجليزية عن جرينستون . حيث قام أيان ويتن (2003) بإعداد دراسة تناولت  نماذج لمكتبات رقمية دولية بإستخدام نظام جرينستون. وتناولت دراسة يان هان (2004 ،ص 7)  تطبيق معيار مكتبة جامعة أريزونا لتقييم نظم إدارة المحتويات الرقمية المفتوحة المصدر.انجز بابلو مورتي وجون روز (2006) دراسة عن تحويل قواعد بيانات CDS/ISIS إلي جرينستون .

2- الدراسة النظرية
1-2 الجمعية السودانية (http://puka.cs.waikato.ac.nz/cgi-bin/sali/library)
     يوضح تعريف الجمعية السودانية للمكتبات والمعلومات (2008 ،ديسمبر 6) بأنها من أوائل الجمعيات المهنية للعاملين في مجال المكتبات والمعلومات في الوطن العربي،حيث تكونت في مايو 1959م وكان التكوين في مباني مكتبة جامعة الخرطوم باسم (اتحاد المكتبات السوداني (. وفي عام1963 كان هذا الاتحاد عضو في اتحاد المكتبات والمعلومات العالمي إيفلا .ولم يستمر عمل هذا الاتحاد. تمت محاولتين  لإحياء الاتحاد في الأعوام 1970 ، 1988 ولكن لم يستمر هذا الأمر سوي فترات بسيطة.المحاولة التي كتب لها النجاح حتى الآن هي في العام 1997 حيث عُـقِد المؤتمر التأسيسي في جامعة الخرطوم وتمت مناقشة وإجازة الدستور المقترح وكون المكتب التنفيذي للجمعية من خمسة عشر عضواً وتم تسجيل الجمعية رسمياً لدى السيد مسجل عام الجمعيات الثقافية بوزارة الثقافة والإعلام السودانية.
     تهدف الجمعية للنهوض بقطاع المكتبات و المعلومات علي كافة المستويات و هي التخطيط والتشريع ، الموارد البشرية ، تطوير مرافق المعلومات، تقاسم الموارد، تشجيع مجالات التعاون على المستوى المحلي والوطني والإقليمي والدولي، استخدام تقنيات المعلومات والاتصالات ، و الخدمات والمستفيدين.
2-2 الأنظمة مفتوحة المصدر
     أشار إعلان المبادئ(2003)  الصادر في مرحلة جنيف من القمة العالمية لمجتمع المعلومات  إلي "أهمية برمجيات المصادر المفتوحة في تعزيز النفاذ إلي المعرفة و تعزيز تقديم الخدمات الأساسية و أداة لتجاوز الفجوات الرقمية".و أشارت سهير إبراهيم حسن صالح(2007) إلي أن "البرمجيات المفتوحة المصدر هي البرمجيات التي تتيح للمستخدم حرية الحصول علي الشفرة المصدرية، حرية نسخ وتعديل و إعادة توزيع البرنامج ضمن نفس إتفاقية ترخيص البرنامج الأصلى".مبادرة المصدر المفتوح هي المنظمة التي ترعي حركة هذه البرمجيات من خلال إتفاق GNU و الذي يعمل علي حماية الشفرة المصدرية.
3-2 نظام برنامج جرينستون للمكتبة الرقمية
     يعرف ويتن و آخرون (2004 ص 1) النظام بأنه"عبارة عن حزمة برمجيات لبناء و توزيع مجموعات المكتبة الرقمية. يعطي البرنامج طريقة جديدة لتنظيم المعلومات ونشرها على الإنترنت أو على CD-ROM.يقوم بإنتاج جرينستون "مشروع مكتبة نيوزيلندا الرقمية " في جامعة وايكاتو، ويوزع بالتعاون مع منظمة اليونسكو وجمعية هيومان إنفو. كما أنه برنامج مفتوح المصدر، ومتاح بموجب رخصة الاستخدام العام ."GNU 
1-3-2منصات التشغيل
     يعمل النظام علي مختلف منصات التشغيل،ويندوز Windows  ويونيكس Unix و ماك او اس اكس Mac OS-X .
2-3-2التوافقية
     يتمتع النظام بتوافقية عالية مع المعايير المعاصرة . OAI-PMH و METS و DSpace و  Z3950 .
3-3-2معايير واصفات البيانات
     يوفر النظام مجموعة من معايير واصفات البيانات معيار دبلن كور(المعدل) ، معيار مؤشر موقع خدمات الحكومة الأسترالية AGLS . يعتبر معيار واصفات البيانات Dublin Core (غير المعدل)هو المعيار الإفتراضي للبرنامج.
     يمكن تعريف معايير واصفات جديدة باستخدام محرر جرينستون لمعيار واصفات البيانات. وقد تم تحديث معيار جرينستون لمكتبة التنمية و إضافة واصفات بيانات تركيبة التراسل المشتركة CCF لمنظمة اليونسكو و التي قام بتعريبها محمود أتيم كمعيار لواصفات البيانات العربية.
4-3-2 أشكال ( تنسيقات ) الوثائق
     يوضح ديفيد بينبردج و دانا ماكي و إيان ويتن (2004 ، ص 21)أن النظام يستخدم المقابس (برنامج ملحق) plug-ins و هي نوعان مقابس  واصفات بيانات و هيXML, MARC, CDS/ISIS, ProCite, BibTex, Refer, OAI, DSpace, METS. و  مقابس وثائق و هي PDF, PostScript, Word, RTF, HTML, Plain text, Latex, ZIP archives, Excel, PPT, Email. و توجد مقابس لوثائق الوسائط المتعددة وهي للصور ( تنسيقات مختلفة، وتتضمن GIF, JIF, JPEG, TIFF ) . و للملفات الصوتية ملفات MP3 و Ogg Vorbis . يمكن إعداد المقابس التوليدي للتنسيقات الصوتية MPEG, MIDI الخ..
5-3-2 اللغات
     يعتبر التعدد اللغوي من خصائص النظام الفريدة. يستخدم النظام الشفرة اللغوية الموحدة يونيكود بطريقة تعالج أي لغة بصورة مناسبة. يتم التحويل من اليونيكود إلى الهجائية التي تدعم متصفح الويب المستخدم بكل سهولة .


6-3-2 التصديق و التفويض
     عند تثبيت النظام يوجد مستخدم واحد يدعى Admain "" و يمكن لهذا المستخدم إنشاء أسماء وكلمات مرور لمستخدمين ينتمون فقط لمجموعة “colbuilder” وهى المجموعة المسموح لها ببناء المجموعات.تسجل معلومات المستخدمين في قاعدتي بيانات توضع في هيكل ملفات  النظام.
4-2 المصادر العربية النصية الكاملة
     تتوفر الوثيقة العربية في أشكال  ملف بسيط Plain Text .txt و أشكال الوثائق المعقدة التي تحتوي علي نصوص ، صور ، رسوميات ، و جداول البيانات الالكترونية مثل ملفات ورد.doc   Word و ملفات HTML .html و ملفات PDF .pdf .
     أشار وليم آرمز(2006 ،ص 322 ) إلي أن طرق الإختزان النصية عليها أن تبين جانبين مختلفين من جوانب الوثيقة. بنية الوثيقة structure  و مظهر الوثيقة appearance .تتكون بنية الوثيقة من العناوين و الفقرات و الفصول و يتمثل مظهر الوثيقة في شكل الحروف و أحجامها، إختيار الهوامش  و المسافات بين السطور، العناوين الرئيسة و العناوين الفرعية، و مواضع الاشكال و الرسومات ، و يتم ترميز بنية النص الذي يتم اختزانه في الحاسب عن طريق مواصفات الترميز أو التهيئة Markup Specification، وقد تطورت لغات الترميز من لغة آسكي Ascii الي اللغة المعيارية الموحدة لتهيئة النصوص (SGML) و لغة HTML ، لغة  XML كنظم موحدة لتهيئة بنية النصوص.
     يقوم جرينستون بتحويل مصادر الوثائق التي تم تجميعها  إلي لغة تأشير جرينستون  و هي إختصارا GML  و هي لغة مبنية علي لغة XML . ويتم ذلك لإعطاء الشكل المعياري للوثائق وواصفات البيانات  لكل وثيقة.
3- الدراسة التطبيقية
1-3 المكتبة الرقمية للجمعية السودانية للمكتبات و المعلومات
     قامت الجمعية السودانية للمكتبات و المعلومات بإعداد المكتبة الرقمية في مايو 2005 باستخدام برنامج جرينستون الإصدارة 2,60 .و تكونت المكتبة الرقمية من ست مجموعات ،مجموعة نشرات الجمعية الإعلامية (نص كامل) ، مجموعة أنشطة الجمعية (صور) ، مجموعة المؤتمر العام للجمعية (نص كامل) ، مجموعة أدبيات المكتبات و المعلومات في السودان ، وهي المقالات التي شارك بها أعضاء الجمعية في المؤتمرات العلمية ( نص كامل،عربي) ، مجموعة أدبيات المكتبات و المعلومات (إنجليزي) ، ومجموعة دليل المكتبات في السودان ، الجزء الأول دليل ولاية الخرطوم ( 224 مكتبة).بالإضافة إلي معلومات حول الجمعية ، أمانات الجمعية ، و معلومات حول تثبيت القرص المدمج للمكتبة الرقمية ، وهيئة إعداد القرص المدمج.
2-3 خطوات إعداد المكتبة الرقمية
     أستخدمت واجهة القارئ ( المجمع ) في إدخال بيانات المكتبة الرقمية في 2005.و قد تم خلال هذه الفترة تطوير واجهة مكتبي جرينستون و هي نظام فرعي في البرنامج مبني بلغة جافا ،لإعداد المجموعات. وتركز هذه الورقة على واجهة مكتبي جرينستون وهذه ترجمة ل Greenstone Librarian Interface حيث يستهدف البرنامج  أمناء المكتبات و غيرهم من الأشخاص الذين يقومون ببناء المكتبات الرقمية. و قد تم إستخدام واجهة مكتبي جرينستون (GLI ) في إصدارة 2s2009.01.30، و التي تضمنت إستخدام إتجاه النص من اليمين إلي اليسار في قوائم النظام بالنسبة للغة العربية، وذلك ولأغراض الفائدة العلمية للورقة. وقد تم العمل من خلال مجموعة وقائع المؤتمر  و مجموعة أدبيات المكتبات و المعلومات و مجموعة نشرات الجمعية ، بالتناوب في تقديم النماذج حيث توفرت .كما أستخدمت مجموعة دليل المكتبات لتوفير نماذج توضيحية لم تتوفر في المجموعات السابقة.وتضمنت خطوات الإعداد :
1-2-3إعداد الوثائق
     توفرت وثائق وقائع المؤتمر العام للجمعية و الأوراق العلمية في تنسيقات مايكروسوفت ورد Microsoft Word و أشكال PDF لنشرات الجمعية. و تم تحويل الوثائق المتاحة في شكل MS Word إلى شكل HTML و لم يتم تحويل الوثائق المتاحة في شكل PDF ، و ذلك لصعوبة تحويل وثائق PDF باللغة العربية إلي HTML بصورة سليمة و ذلك لعدم وجود خاصية البنيوية Structuring  في ملفات الـ PDF كما هو الحال في ملفات  XML, SGML , HTML. و ذلك لأغراض ترقيم الوثائق بدمج واصفات البيانات في بنية البيانات ، حيث يمكن لك وصف الفصول و الأقسام.و قد تم ترقيم الوثائق و أقحمت في جزء الوصف (بين تيجان   <Description> و  </Description> ( و بين علامات <!-- ... --> باستخدام لغة HTML   بحيث لا تؤثر تيجان الفصول في هيئة الوثيقة بلغة HTML ، واضعين في الإعتبار أننا نقوم بإعداد جدول محتويات هرمي عندما نقوم بحشر تيجان الفصول و الأقسام في الوثيقة. و هذا يعني أن يتم وضع هذا الفصل ضمن الفصول الأخرى في فصل واحد مغلق يشمل كل الوثيقة.وقد تم حشر التيجان في النص كما يلي:

clip_image001



 
 
 
 
 
 
 







     تتكون الوثائق المعقدة من نص و صور و رسومات و جداول بيانية. و لضمان شكل عرض ثابت عند التحويل من تنسيق إلي آخر يفضل أن تقوم بتحويل الرسومات و الجداول إلي صيغة صور.
1-2-3 تحديد خيارات اللغة
     يتم تحديد خيارات اللغة العربية علي مستويات عديدة في النظام. يمكنك تغير لغة عرض المجموعة، تغيير لغة واجهة مكتبي جرينستون (GLI ) أنظر (الشكل 1 )، وتغيير القيمة الافتراضية للغة النظام في ملف "إعداد البرنامج الأساسي" في دليل etc من تثبيت جرينستون .كما يمكنك تغيير  نظام الترميز في متصفح الوب للحصول علي شكل أفضل (UTF-8 و Win1256). clip_image003

3-2-3 تعريف المكتبة الرقمية
     تم تعريف كل مجموعة بتحديد عنوان المجموعة، وصف موجز لمحتويات المجموعة، عنوان البريد الإلكتروني للشخص المسئول عنها ، و تحديد ايقونة المجموعة. ( شكل 2  )



clip_image005
4-2-3 تجميع مصادر الوثائق
     يتيح لك النظام التجوال و السحب و الإسقاط للأدلة و ملفات مصادر الوثائق من مساحة الملفات في الحاسوب إلي منطقة عمليات المجموعة( شكل 3 ). كما يتيح لك السحب و الإسقاط من مجموعات جرينستون الموجودة في دليل فرعي. و هنا تختلف مصادر الوثائق عن بقية مصادر وثائق الأدلة الاخري و ذلك بسبب واصفات البيانات الملحقة بها ، حيث تنبثق قائمة ( شكل 4) لاختيار واصفات البيانات بإضافتها أو دمجها أو  رفضها.
clip_image007
clip_image009

5-2-3 إثراء الوثائق بواصفات البيانات
     يتم في هذه المرحلة إثراء الوثائق التي تم إختيارها بواصفات البيانات (شكل 5 ). حيث يمكن تعين قيم واصفات جديدة للوثائق ، تعيين واصفات بيانات لمجلد و تورث لكل الوثائق ، تعيين واصفات بيانات هرمية باستخدام " | " للفصل بين واصفات البيانات ( شكل 6)، و تعديل و تحديث واصفات البيانات المعينة. و قد تم إستخدام معيار جرينستون لمجموعة مكتبة التنمية DLS و الذي تم تعديله إلي اللغة العربية.و يمكن أن تستخدم في المجموعة أكثر من معيار لواصفات البيانات( شكل 7) .
clip_image011


clip_image012

clip_image013
6-2-3 تصميم مجموعات المكتبة الرقمية
     تسمح لافتة تصميم إنشاء قائمة من المقابس و المصنفات المستخدمة و توفير المضامين أو الحجج لهما، إعداد الكشافات للنص الكامل وواصفات البيانات، و يتم تسجيل هذا الإجراء في "ملف إعداد المجموعة" ( شكل 8 ).
1-6-2-3المقابس ( برنامج ملحق ) Plug-ins
     أستخدم مقابس HTMLPug لاستخلاص واصفات البيانات المضمنة في ملفات وثائق الجمعية . و يوفر مقابس HTML مجموعة من الخيارات للمضامين او الحجج منها مضامين التعرف اللغوي وهي : ( شكل 8 )
input_encoding  : لتعريف ترميز مصدر الوثيقة. القيمة الإفتراضية هي تحديد ترميز الوثيقة آليا.و القيم المتوفرة للغة العربية هي Windows_1256 Windows codepage 1256 (WinArabic) و ISO_8859_6-Arabic و يتم تحويل هذا الترميز إلي UTF-8 ويحفظ داخليا.
default_encoding : يستخدم هذا الترميز إذا وضع input_encoding في Auto و فشلت خوارزمية فئات النص في إستخلاص ترميز اللغة.
extract_language : عرف لغة آي وثيقة و قم بإعداد واصفة بيانات اللغة.تجب ملاحظة أن هذا الإجراء يتم تلقائيا إذا كان وضع input_encoding هو Auto .
default_language : إذا فشل النظام في تحديد عنصر واصفة بيانات لغة الوثيقة سوف يتم تحديد القيمة الإفتراضية =en ( وفقا لرموز المواصفة القياسية الدولية لرموز اللغات ISO 639  . رمز اللغة الإنجليزية = en ). تجب ملاحظة انه إذا لم تأخذ extract_language المضمون المحدد هنا و لم يتم تحديد القيمة Auto في input_encoding تأخذ الوثائق قيمة هذا المضمون.
clip_image015
2-6-2-3 بناء كشافات بحث المكتبة الرقمية
     توضح ملفات المساعدة للنظام وجود ثلاث محركات بحث( شكل 9 ) لإعداد كشافات البحث ( شكل10 ) لمجموعات المكتبة الرقمية و هي كشافات النص الكامل وواصفات البيانات، و هي:
clip_image017
* محرك بحث MG
     يوفر هذا المكشف البحث البولياني و التراتيبي.و يبني لكل كشاف مخصص في المجموعة كشاف مادي منفصل. بالنسبة لبحث الجملة يستخدم  المعامل "و" لكل مصطلحات البحث و عرض الصوائب لمعرفة ما إذا كانت الجملة موجودة.
* محرك بحث MGPP
     يوفر هذا المكشف  التكشيف علي مستوي الكلمة و يتيح هذا الاسلوب البحث الحقلي و البحث علي مستوي التجاور للمكشف. يمكن للبحث البولياني أن يكون تراتيبيا. يتم إنشاء كشاف واحد للمجموعة ، تتاح فيه كل مستويات وثيقة/قسم و نص / حقول واصفات بيانات. بالنسبة للمجموعات الكبيرة يصبح إجراء البحث بطيئا نسبة لمستوي الكلمة المستخدم و هو دون مستوي القسم.


* محرك بحث Lucene
     يوفر هذا المكشف البحث الحقلي و البحث علي مستوي التجاور و لكن في مستوي واحد فقط (مثال . وثائق كاملة أو أقسام و لكن ليسا معا). لذلك تصبح هناك حاجة إلي وجود كشافين منفصلين في المجموعة للوثائق و الأقسام. يتيح وظائف البحث المتوفرة في MGPP إضافة إلي علامات المحرف الواحد، سياق بحث و فرز لنتائج البحث لحقول واصفات البيانات.
     بالنسبة لمكتبة الجمعية الرقمية تم إستخدام محرك البحث MG لبناء كشاف النص الكامل، وكشاف نص الفصول و كشاف عناوين الفصول.

clip_image019
3-6-2-3 إنشاء هياكل التصفح
     يوضح بينبردج و آخرون (2004 ، ص 28)أن المصنفات هي كيانات بيرل Perl مثل المقابس. تستخدم المصنفات Classifiers( شكل 11 )  لإنشاء هيكل التصفح في مجموعات المكتبة الرقمية باستخدام واصفات البيانات المتوفرة. كل المصنفات تولد هياكل هرمية تستخدم لعرض كشاف التصفح، المستوي الأدنى (علي سبيل المثال، الأوراق) من المستوي الهرمي هي عادة الوثائق.في بعض المصنفات هي الفصول.العقد الداخلية للبناء الهرمي هي إما VList ، HList ، أو DateList. تعتبر VList قائمة بالعناصر تعرض رأسيا إلي أسفل الصفحة، و تعرض HList القائمة أفقيا. علي سبيل المثال، مصنف AZList يولد مستويين هرميين يتضمنان HList (يولد نقاط إختيار هجائية،لغة انجليزية). و اولاده VList و التي أولادها هي الوثائق( شكل 14 ). تعتبر DateList نوع خاص من VList و تتيح الإختيار بالسنة و الشهر( شكل13 ) . كما يوجد مصنف AZcompactList و هو مصنف للفرز الألفبائي.ينتج قائمة أ-ي أفقية ، ثم قائمة راسية تتضمن الوثائق ، أو رف وثائق تربطها واصفات بيانات مشتركة ( شكل 12 ).استخدم مصنف SectionList وهو مصنف بسيط لوضع قائمة تضم كل اقسام الوثيقة .
clip_image021



clip_image022
clip_image024

نقاط الاختيار باللغة العربية
     يستخدم مصنف Genericlist اليونيكود لواصفات البيانات و يتضمن قدرات فرز، و يستخدم لتقرير قائمة هجائية تتضمن عناوين الوثائق بقيم مثل "أ- ب – ت" . ( شكل 14 )  .

clip_image025

7-2-3 تصميم محتويات صفحة العرض
     صفحات الوب التي تراها عند إستخدام النظام يتم توليدها  حسب الحاجة . يوضح بينبردج و آخرون (2004 ، ص 32) أن التحكم في جوانب عديدة من الصفحة بإستخدام خيارات  "سلاسل نسق العرض" (الجدول 2) . ويتم تضمين هذه المعلومات في ملف إعداد المجموعة ( شكل 15 ) . يوجد نوعين من عناصر الصفحة يتم التحكم فيها بسلاسل نسق العرض.النوع الأول هو الوثائق أو جزء من الوثائق( شكل 16 ) . يشمل النوع الثاني قوائم نتائج البحث ( شكل 17 ).






خيارات نسق العرض

clip_image026
   المصدر بينبردج و آخرون (2004 ، ص 33)

clip_image027

clip_image028






clip_image029

8-2-3 بناء المجموعة
     يقوم النظام خلال مرحلة البناء بضغط النص ، إنشاء الكشافات ، و إنشاء هيكل التصفح.
9-2-3 البحث و التصفح في المكتبة الرقمية:
1-9-2-3 واجهات المستفيدين :
     يوضح بينبردج و آخرون (2004 ، ص 39) أن النظام يتكون من قسمين . القسم الأول والذي يمثل المراحل أعلاه ، و هو القسم المسئول عن بناء المجموعات.القسم الثاني هو وقت تشغيل النظام runtime system و هو الذي يتفاعل مع المجموعة عندما تصبح جاهزة للعرض. وينقسم وقت تشغيل النظام  إلي قسمين. المستقبل receptionist و مزود المجموعة Collection server .من وجهة نظر المستخدم ، يعتبر المستقبل هو نقطة التفاعل مع المكتبة الرقمية.يتقبل مدخلات المستخدم،يقوم بتحليلها ، ثم يقوم بإرسالها إلي مزود المجموعة  .يعمل مزود المجموعة كآلية إستخلاص لمحتويات المجموعة و يقوم بإسترجاع المحتوي المناسب في صورة html مجرد.يقوم المستقبل باستقبال محتوي html المجرد و يضيف محتويات ملفات الماكرو المحددة لعرضها في صفحة الوب للمستخدم ( شكل 18 ). و هنا تكمن سهولة بناء واجهة مستخدم باستخدام ملفات الماكرو Macro ، حيث يحتاج المستخدم(مصمم المجموعة) لمعرفة بسيطة بلغة html ، و معرفة بسيطة نسبيا بملفات الماكرو لتصميم صفحة الوب. يوفر هذا الاسلوب مرونة فائقة لتوليد صفحات وب بلغات مختلفة (شكل 19 )


clip_image030
المصدر بينبردج و آخرون (2004 ، ص 39)

clip_image031
المصدر ملف Arabic.dm في تثبيت جرينستون
2-9-2-3 خيارات البحث
     أشار ويتن و آخرون (2008 ، ص 23) إلي أن النظام يوفر خيارات للتصفح و مستويين للبحث البسيط والمتقدم  من خلال تصميم واجهة البحث. يتم إختيار اسلوب البحث من صفحة الخيارات( شكل 20 ) 


clip_image032
  • التصفح
     في معظم المجموعات يمكنك اختيار كشافات مختلفة للتصفح . على سبيل المثال ، هناك كشاف بالعنوان ،الموضوع ، و التاريخ.
  • البحث البسيط
     واجهة بحث المستوي البسيط تتضمن مربع بحث صغير ، و يوفر البحث في سياق حقل محدد مثل النص الكامل و نص القسم و عنوان القسم و عنوان الوثيقة. يتوفر البحث في سياق نمطين للإستفسار ،نمط إستفسار (كل) ويستخدم لتضييق نطاق البحث، ونمط إستفسار (بعض) و يستخدم لتوسيع نطاق البحث.علي سبيل المثال ، توضح النماذج التالية للبحث إمكانيات البحث في هذا المستوي( شكل 21 )

clip_image033
     إذا تتضمن بحثك جملة بين علامتي تنصيص ،سوف تسترجع الوثائق التي تتضمن هذه الجملة تماما كما هي مطبوعة.
·     البحث المتقدم
     توفر تفضيلات البحث المتقدم ، مربع بحث صغير يمكن إستبداله بمربع بحث كبير. بالإضافة إلي مربعات تاريخ البحث. لا تتوافر مربعات البحث الحقلي في هذا المستوي لمحرك البحث MG . تتضمن أساليب البحث، البحث البولياني الذي يمكنك من إستخدام العوامل البوليانية  و (&) و أو (|)و ليس (!)، بالإضافة للأقواس التي تستخدم للتجميع. علي سبيل المثال ، توضح النماذج التالية للبحث إمكانيات البحث في هذا المستوي( شكل 22 )
clip_image034

كما يدعم المستوي الثاني البحث التراتيبي حتى تظهر الصوائب ذات العلاقة بموضوع البحث في أعلى القائمة.
·     بحث كل المجموعات
     يوفر النظام بحث مختلف المجموعات، و ذلك بتحديد المجموعات المستهدفة للبحث.
4-النتائج و التوصيات
 1-4 النتائج
     الهدف الرئيس لهذه الدراسة هو توضيح قدرات برنامج جرينستون في معالجة أشكال الوثائق العربية للنص الكامل ، و من خلال العمل التطبيقي لحالة المكتبة الرقمية للجمعية السودانية للمكتبات و المعلومات ، توصلت الدراسة إلى النتائج الآتية:
1-1-4 يستخدم النظام الشفرة اللغوية الموحدة اليونيكود ، و ذلك لمعالجة مختلف اللغات و من بينها اللغة العربية.
2-1-4  يستخدم النظام المقابس لزيادة قدرات النظام لتضمين مختلف أشكال الوثائق .
 3-1-4 يستخدم النظام واصفات البيانات الملحقة بالوثائق (خارجية) و المدمجة في بنية الوثائق (داخلية).
4-1-4 تتوافر من خلال النظام إمكانات البحث الحقلي وبحث النص الكامل ، حيث  يمكن بحث النص الكامل للوثيقة أو الاختيار بين الكشافات المختلفة والمبنية لمختلف أجزاء الوثيقة .
5-1-4 تتوافر من خلال النظام إمكانات نشر المجموعات على الانترنت أو في قرص مدمج.
 
2-4 التوصيات
     يوصي الباحث في ظل نتائج الدراسة بالآتي:
1-2-4 التأكيد علي إشارة الدكتور نبيل علي (2003 ص 69) للنظام كأحد الحلول المقترحة لإدارة موارد المعلومات  لنشر المحتوي العربي.
2-2-4 تضمين برمجيات المصادر المفتوحة ضمن مناهج أقسام المكتبات والمعلومات لسهولة النظام في بناء المكتبات الرقمية باللغة العربية.
3-2-4 تشجيع جمعيات المكتبات و المعلومات علي بناء مجموعاتها الرقمية لوقائع المؤتمرات وإصدار الدوريات العلمية.
4-2-4 تشجيع أعضاء هيئات التدريس لبناء المكتبات الشخصية و إتاحتها للباحثين و الطلاب.







المراجع


إعـلان المبـادئ :بنـاء مجتمـع المعلومـات: تحد عالمي في الألفيـة الجديدة(2003).موقع الإتحاد الدولي للإتصالات. تاريح الاطلاع 10 ديسمبر 2008 متاح في. www.itu.int/wsis/docs2/tunis/off/7-ar.doc

إيان هـ. ويتن ، شتيفان بودي و جون تومبسون (2008) برنامج جرينستون للمكتبة الرقمية مرشد المستخدم .( كمال صالح مصطفي، ترجمة) ، تاريح الاطلاع 10 ديسمبر 2008. متاح في http://wiki.greenstone.org/wiki/index.php/Manual

التعريف (2008 ،ديسمبر 6) موقع المكتبة الرقمية للجمعية السودانية للمكتبات و المعلومات . متاح في http://puka.cs.waikato.ac.nz/cgi-bin/sali/library

سهير إبراهيم حسن صالح(2007) مصادر المعلومات المفتوحة : مالها وماعليها [قرص مدمج] ورقة بحث مقدمه في المؤتمر 18 للإتحاد العربي للمكتبات والمعلومات تحت عنوان "مهنة المكتبات وتحديات الواقع والمستقبل ودورها في الوصول الحر للمعلومات العلمية والتقنية"جدة في الفترة (7-10 ذو القعدة 1428) 17-20 نوفمبر 2007  
شريف كامل شاهين (2005) . فهارس المكتبات العربية المتاحة عبر شبكة الإنترنت: دراسة تقويمية على ضوء توصيات إرشادات "الإفلا:IFLA" لشاشات عرض التسجيلات الببليوجرافية ومضمونها. cybrarians journal . ع 4 (مارس 2005) . تاريح الاطلاع 15 يناير 2009. متاح في : http://www.cybrarians.info/journal/no4/opac.htm

طلال ناظم الزهيري (2008) المكتبات الرقمية الشخصية تجربة بناء باستخدام نظام GREEN STONE . تاريح الاطلاع 15 ديسمبر 2008، متاح في azuhairi.jeeran.com/files/84172.doc
متولي محمود النقيب(2007) برمجيات المكتبات الرقمية المفتوحة المصدر : معايير مقترحة للتقويم[قرص مدمج]  ورقة بحث مقدمه في المؤتمر 18 للإتحاد العربي للمكتبات والمعلومات تحت عنوان "مهنة المكتبات وتحديات الواقع والمستقبل ودورها في الوصول الحر للمعلومات العلمية والتقنية" جدة في الفترة (7-10 ذو القعدة 1428) 17-20 نوفمبر2007.
نبيل علي (2003)مسح للمحتوى العربي الرقمي وبرمجياته وتطبيقاته وتقييم احتياجاته اللجنة الاقتصادية والاجتماعية لغربي آسيا (الإسكوا) . تاريح الاطلاع 10 يناير 2009، متاح في http://www.escwa.un.org/divisions/projects/dac/01DACNabi.pdf
وليم  آرمز (2006) المكتبات الرقمية (جبريل بن حسن العريشي و هاشم فرحات سيد،ترجمة). مكتبة الملك فهد الوطنية . تاريخ الإطلاع 2 يناير 2009، متاح فيhttp://www.kfnl.gov.sa/idarat/New/maktbat%20rqmiah/PDF/9.doc

Bainbridge,David, McKay, Dana , & Witten, Ian H. (2004) Greenstone digital library: Developer's guide .Retrieved January12,2009, from  http://wiki.greenstone.org/wiki/index.php/ Manual

Han, Yan (2004) Digital Content Management: the Search for a Content Management System. Retrieved December 15, 2008, from http://dlist.sir.arizona.edu/623/01/digital_content_management.pdf

Pablo Morete & John Rose (2006) Creating digital libraries based on  CDS/ISIS Database. Retrieved December 7, 2008, from http://portal.unesco.org/ci/en/ev.php- URL_ID=21746&URL_DO=DO_TOPIC&URL_SECTION=201.html
 
Witten,Ian H. (2003)Examples of Practical Digital Libraries Collections Built Internationally Using Greenstone.D-Lib Magazine., 9(3),Retrieved October 16, 2002, from http://www.dlib.org/dlib/march03/03contents.html


























 
.


[1] معرب مشارك لبرامج جرينستون، معرب أدلة البرنامج.عضو اللجنة الافريقية  لدعم برنامج جرينستون للمكتبة الرقمية - اللغة العربية بدعم من مكتب  اليونسكو الإقليمي آديس آبابا لجامعة ويكاتو ، نيوزيلندا 2005
.

هناك تعليق واحد:

hema يقول...

السلام عليكم ورحمة الله
الاخ الفاضل كمال صالح مصطفى
تحية اليك اخى فى الله على هذا المجهود العظيم فى هذا البلوج المميز جدا والاكثر من رائع العمل علية دام كثير بالتأكيد الى أن وصل الى تلك المكانة .
كل التحية والتقدير وداوم التفوق
:
دعوة الى زيارة منتدى بانوراما مصر فشرف لنا زيارتك
منتديات بانوراما مصر
اخبار منتديات بانوراما مصر
بانوراما مصر
feedburner.google - منتديات بانوراما مصر
بلوج عن اخبار مصر اليوم
أخبار مصر اليوم