نتكلّم دائما عن المحتوى العربي على الإنترنت، بالتحديد من ناحية قلّته، وعدم إيفائه بمتطلّبات معيّنة تسمح باستخدام الإنترنت بكامل قدراتها للناطقين باللغة العربيّة. هي مشكلة بالتحديد لأنّ فقر المحتوى العربي يؤدّي إلى تقليل استخدام اللغة لإنتاج المزيد من المحتوى في المستقبل، ونصل بالتالي إلى حلقة شرّيرة (vicious loop) وهي أسوأ من الحلقة المفرغة ..
في هذا المقال \ البحث (كان هناك كلمة “قصير” هنا، ولكنّني أزلتها إذ أنّه لم يعد كذلك)، سنحاول النظر إلى هذه المشكلة من خلال “ويكيبيديا” واستعمالها كنموذج.
سنحاول أن نمرّ على بعض الإحصاءات عن ويكيبيديا وعن المحتوى العربي، ونقوم ببعض المقارنات، ثم ننتقل إلى تشخيص بعض المشاكل ونقترح حلولا لها تجمع بين البساطة والفاعليّة، وربّما أمكننا (مع بعض الحظ) في كلمن أن نطبّق بعضا منها في المستقبل.
أوّلا ، هل تعلمون أن:
- ويكيبيديا هي موسوعة مفتوحة، ويمكن لأيّ شخص أن يقوم بتحرير مقالات وإضافة المحتوى إليها
- تتبع ويكيبيديا لمؤسّسة غير ربحية (wikimedia foundation ) وتعتمد على التقديمات والإسهامات المختلفة
- أظهرت بعض الدراسات أن لويكيبيديا دقّة لا بأس بها (1) (2) بالمقارنة مع موسوعات أخرى
- لو أردت طباعة ويكيبيديا ، ستكون النتيجة 7400+ مجلّدا ، يزيد حجم المجلّد عن 700 صفحة ، وتقدّر قيمته بأكثر من 500 ألف دولار (تقديرات 2015 ، (6) )
من المدهش أنّ موسوعة تعتمد على الهواة وعلى المساهمات التي يقوم بها الأفراد بلا مقابل يمكن أن تحقّق الحجم والفائدة الذين تقدّمها ويكيبيديا لمستخدميها حول العالم. ويكيبيديا هي أداة حرّة، مفتوحة، وغير تجاريّة \ غير ربحيّة. يمكن لمستخدمي لغات مختلفة وثقافات مختلفة الاستفادة منها.
تطوّر لوجو ويكيبيديا مع الزمن – لاحظ(ي) القطع الناقصة والتي تشير إلى أنّ المشروع لم يكتمل وهو – كالمعرفة – عمل مستمرّ لا ينتهي
يوجد حاليّا (2020) 309 لغات على ويكيبيديا (أو 309 ويكيبيديات)، والأكبر بينها (بالترتيب) هي : الإنكليزية ، سيبوانو ، السويديّة ، الألمانيّة ، الفرنسيّة ، الهولنديّة .. الثانية والثالثة (سيبوانو والسويديّة) تمّ خلقها بنسبة كبيرة بواسطة بوت واحد برمجه سفيركر يوهانسن. وتعتبر العربيّة واحدة من اللغات ال 17 ذات ما يزيد على 1 مليون مقالة على ويكيبيديا (اللائحة الكاملة في الفقرة أدناه).
مؤخّرا بدأ المحتوى العربي على ويكيبيديا يزداد، وذلك شيء محمود طبعا.. ولكن لا زال لدينا الكثير من العمل ..
لننظر إلى بعض الإحصاءات المفيدة..
كم من المحتوى العربي يوجد على ويكيبيديا؟
الجدول التالي (5) يظهر نسبة المقالات بلغة معيّنة من أصل النسبة الإجماليّة للمقالات الموجودة على ويكيبيديا
تاريخ الإحصاء : مايو \ أيّار 2020
عدد المقالات الإجمالي على ويكيبيديا، والمستخدم في الإحصاء: 53,346,270
النسبة من المقالات حسب اللغة:
الإنجليزية (11.4٪)
سيبوانو (10.1٪)
السويدية (7٪)
الألمانية (4.6٪)
الفرنسية (4.2 ٪)
الهولندية (3.8٪)
الروسية (3٪)
الإيطالية (3٪)
الإسبانية (3٪)
البولندية (2.6٪)
واراي (2.4٪)
الفيتنامية (2.3٪)
اليابانية (2.3٪)
صينيون (2.1٪)
العربية (2٪)
البرتغالية (1.9٪)
الأوكرانية (1.9٪)
أخرى (32.4٪)
عندما نقول أنّ المحتوى العربي على الإنترنت “قليل”، فلا بدّ أن نوضّح بالتحديد ما هو المقياس الذي يؤدّي إلى هذا الحكم. نسبة ال 2% أعلاه من المقالات تعتبر قليلة إذا أخذنا بعين الإعتبار ما يلي:
1. عدد الناطقين بالعربيّة كلغة أولى يربو على 400 مليون (أي 6% من سكّان العالم، ممّا يعني أن نسبة المحتوى إلى نسبة الناس هي ثلث (1\3) المعدّل العالمي )،
2. لا يوجد في العالم العربي بدائل موضوعيّة ومنتشرة كفاية يمكن اعتبارها بديلا عن ويكيبيديا ،
3. يوجد الكثير من الناطقين بالعربيّة كلغة ثانية في العالم وهؤلاء لم يتمّ احتساب قدراتهم واحتياجاتهم المعرفيّة ضمن الرقم
تفاصيل أكثر عن المحتوى
يقدّم الجدول التالي فكرة عن بعض التفاصيل الأخرى المتعلّقة بالمحتوى العربي على ويكيبيديا (8) :
يعود تاريخ هذه الإحصاءات إلى شهر ديسمبر \ كانون الأوّل 2018، وهي قديمة بعض الشيء ولكنّها تفي بالغرض لبعض الملاحظات:
- نلاحظ أوّلا أنّ عدد العاملين على تحرير المحتوى على ويكيبيديا قليل نسبيّا ( 2 لكلّ مليون من المتحدّثين باللغة).
- نسبة المقالات التي حُرّرت من قبل بوتات (BOTS) عالية نسبيّا (54%) وهو ما لم أكن أتوقّعه بصراحة، ولكن قد تكون نتيجة هذا أنّ هناك الكثير من المقالات غير المكتملة، وهنا قد يكون رقم ال 1 مليون مقال مبالغا فيه.
- عدد القراءات \ الإستعمال بالساعة منخفض نسبيّا، وهو مرتبط بقيمة وسعة المحتوى الموجود على ويكيبيديا.
من ينتج المحتوى العربي (4) على ويكيبيديا؟
وجدت هذا الرسم البياني المفيد (رغم أنّ الدراسة قديمة بعض الشيء ، وتعود لعام 2012)، والذي يظهر مصدر المساهمات المنتجة للمحتوى العربي على ويكيبيديا..
طبعا نحتاج لدراسة أكثر حداثة، ولكن يبدو أن عرب شمال افريقيا هم الروّاد في إضافة المحتوى العربي على ويكيبيديا. أعتقد أنّ مصر تحتسب مع دول الشام (سوريا ، الأردن ، فلسطين ، لبنان ) والعراق والخليج ضمن “الشرق الأوسط” الذي يساهم ب 25% من المحتوى. العرب في المهجر (أميركا الشماليّة: الولايات المتّحدة وكندا والمكسيك) يساهمون (وتساهمن) ب 25% من المحتوى. وعلى هذا القياس، أعتقد أن وسط-شمال إفريقيا هي تونس وليبيا ب 10% من المحتوى. هكذا، تكون الجائزة الكبرى للجزائر والمغرب وموريتانيا المساهمة ب40 % من المحتوى..!
المشاكل و التبعات
يتوزّع المحتوى العربي (نتائج البحث) على مواقع كثيرة، ويمكن أن يكون البعض منها ذا مصداقيّة منقوصة. تعرّضنا في موضوع سابق لهذه المشكلة، وللنسبة العالية من ال “نسخ ، لصق ، نشر” (7) التي تشوب عمل الكثير من هذه المواقع وهو ما قد يقلّل حماسة بعض المساهمين الذين لا يُعترف بفضلهم وإبداعهم. مشكلة الثقة لا تنتهي هنا: فماذا عن موضوعيّة هذه المقالات والمواقع؟
كذلك فإنّ كميّة كبيرة من المعرفة والمواضيع المكتوبة بالعربيّة موجودة\منتشرة\منثورة في منتديات كثيرة ومتنوّعة، وبعضها لا يمكن استخدامه بدون تسجيل. الكثير من هذه المواقع لا تعتمد نظاما واضحا ومنطقيّا لذكر المصادر، وهو ما يجعل الكثير من المواضيع والمساهمات غير مفيدة لأهداف البحث العلمي والمنطقي الصحيح.. أحيانا ذكر بعض المصادر قد يكون أكثر إفادة من ذكر عشر جمل تحتوي على آراء شخصيّة قد لا تنفع باحثا معيّنا.
الأحرف المستعملة في الكتابة العربيّة : حتى وقت قريب، كانت بعض الأجهزة والبرامج لا تدعم الأحرف العربيّة وهو ما أدّى إلى انتشار “العربيزي” ، أو استعمال الحروف اللاتينيّة لكتابة اللغة العربيّة. لا يمكن أن نكون ضدّ تطوير اللغة، وهذا نقاش يطول، ولكن المحتوى المكتوب بالعربيزي مصيره النسيان، وإنتاج المحتوى بهذا الشكل قد يكون هدرا للطاقة، لأنّ الكثير من المواقع لا يمكن الوصول إليها بدون محرّكات البحث، ولأنّ النصّ العربي الواحد يمكن كتابته بالكثير من الطرق “العربيزيّة” (الكلمة ممتعة ، لا بدّ من الإعتراف).
نحن يعنينا كثيرا من بين هذه المشاكل أثرها على خلق منظومة تشجّع البحث والإبداع والإنتاج.. وحتى الإبتكار بما يمكن أن يحمل من خلق فرص اقتصاديّة للكثيرين.
- لو تواجد المزيد من المحتوى، وكان الوصول إليه سهلا، فذلك سيزيد من فرص إنتاج المزيد منه ويخلق دورة مفيدة.
- بالإضافة إلى هذا، فإنّ القدرات الإداريّة والتقنيّة التي يمكن اكتسابها في مبادرات إنتاج المحتوى المفيد يمكن إعادة توظيفها في مشاريع جديدة تخلق فرص عمل وإنتاج جديدة.
- يمكن تشكيل فرق تضمّ في عدادها إداريّين، ومبرمجين، واختصاصيّين وهواة تحقّق أهدافا قصيرة المدى ثمّ تضع نصب عينها تحقيق أهداف أخرى، وهكذا.
انطلاقا من هذا، فإنّ مبادرات إنتاج المحتوى ليست هدفا بحدّ ذاتها، ولكنّها تشكّل حلقة ضمن سلسلة من الخطوات الواجب اتّخاذها.
الحلول المقترحة
أنا لا أعتقد أنّه يمكننا تجزئة الحلول ببساطة.. حلّ الفقر في محتوى الإنترنت قد لا يكون بالنظر إلى هذا كمشكلة منعزلة. هو مرتبط بالفقر، وانتشار الأمّيّة، وقلّة الوصول إلى الإنترنت.. البداية لا بدّ أن تكون من النظرة الكبرى إلى الاقتصاد (macro-economic): فرص عمل، تعليم، وصول إلى التقنية، وصول إلى المعلومات. أيّ عمل على مشكلة فرعيّة لا بدّ أن يبقي هذا في الحسبان.أفضل الحلول لمشاكل معقّدة لا بدّ أن تكون قريبة من الأسباب الرئيسيّة (كالفقر والبطالة وقلّة التعليم والوصول إلى خدمات التواصل)، وقريبة من عموم الناس وحاجاتهم.
رغم هذا، يمكننا أن نفكّر ببعض الطرق لإغناء المحتوى العربي بشكل عام عبر إغناء المساهمات في ويكيبيديا وغيرها، ومن الأمثلة عن الخطوات الممكنة :
- إدخال تعليم ال (Edit) لتلاميذ المرحلة الثانويّة وجعل ذلك جزءا من مشاريعهم، وتوسيع معرفتهم بالويكيز ومشاريعها العديدة، وهذه قد تكون هواية جيّدة ومفيدة للمجتمع والثقافة، ويستمرّون بممارستها خلال سنين الدراسة الجامعيّة (لقليل منهم، أعرف)
- نقل المحتوى من المدوّنات والمنتديات: بطريقة علميّة، ومع مراعاة ذكر المصادر (الأساسيّة) بوضوح، يمكن نقل كميّات كبيرة من المحتوى من بعض المدوّنات والمنتديات القديمة وحفظها بهيكليّة مناسبة للبحث والتحقيق والتطوير
- تحويل من العربيزي إلى العربيّة: ويمكن القيام بذلك باستخدام بوت ما، ثمّ إعادة القراءة من قبل محرّرين بشر
- برامج وتطبيقات وبوتات: هل يمكننا إنتاج المزيد من البرامج والتطبيقات العربيّة ؟ أنا هنا لا أتكلّم عن الترجمات الركيكة لتطبيقات بلغات أخرى، بل عن برامج أصيلة تحقّق مجموعات مختلفة من الأهداف، وتستعمل اللغة العربيّة بكثافة. ماذا عن الخطوط على الإنترنت؟ لقد واجهنا صعوبات خلال عملنا على كلمن في استعمال خطوط مختلفة بطريقة سهلة، فالكثير منها لا يعمل، والحصول عليها صعب. هل يمكننا استعمال بوتات جديدة لإنتاج أو ترجمة محتوى معيّن، طبعا مع مراعاة أن يراجع محرّرون انتاجاتها؟
معلومة ظريفة: أكثر من نصف محتوى الويكيبيديا السويديّة و 97% من محتوى الويكيبيديا الفيليبينية (سيبوانو) خلقها بوت كما ذكرنا من قبل. البوت (Lsjbot) برمجه يوهانسن (سويدي الجنسية)، وزوجته فيليبينيّة الجنسيّة وهذا سبب اختيار اللغات.
في النهاية
لا بدّ من الانتباه أنّ الهدف ليس كثرة المحتوى وحسب، بل نوعيّة المحتوى أيضا.
هذا كان محور نقاش كبير حول نوعيّة المحتوى على الإنترنت بشكل عام، وسياسات المحتوى والتمييز، خاصّة بعد جهد أل أس جي بوت. قال يوهانسن بعد الكثير من الإنتقاد لمبادرته، أنّه إذا لم ينتج البوت المحتوى، فإنّ الذي سينتجه هو مجموعة من اليافعين البيض الذكور، طبقا لاهتماماتهم الخاصّة.
لو امكننا الاعتماد على بوتات إنتاج المحتوى والترجمة بشكل عام، فإنّ إنتاج المحتوى المرتبط بالثقافة العربيّة بالتحديد، والذي يراعي خصائص المنطقة (إقتصاديّا ، ثقافيّا ، إجتماعيّا ) وحاجاتها سيبقى أولويّة كبرى، ولا بدّ من العديد من المبادرات الصغيرة لمجموعات من الروّاد والمغامرين لأنّ الطريقة التراتبيّة (Top-Down أو أعلى-أسفل) قد لا تكون قادرة على خلق النتائج المرجوّة.
بتوزيع المخاطر وتشجيع المبادرة الإبداعيّة الفرديّة قد نتمكّن من تحقيق نتائج أفضل وبيئة إبتكاريّة مستدامة.
الهدف من هذه المقالة فتح نقاش. إذا كان لديكم أرقام أحدث وأكثر دقّة، لا تتردّدوا بعرضها عبر حسابات كلمن على إنستاغرام وفيسبوك أو هنا. راسلونا إذا رغبتم بالمشاركة في مبادرات كلمن، أو إذا كانت لديكم أفكاركم الخاصة لتطوير المحتوى العربي، أو لاستخدام الموارد الثقافيّة العربية في مجالات إبداعيّة مختلفة.
(3) ترتيب مواقع الإنترنت (أبريل \ نيسان 2020 ) ( ملاحظة : يتمّ الترتيب عبر قياسات مركّبة ، تشمل عدد المستخدمين ( users) والصفحات المفتوحة ( page views) و كمّيّة البيانات المرسلة ( traffic data) )
اللائحة المفصّلة :
المصادر والمراجع :
(1) : http://www.sciam.com/article.cfm?id=good-samaritans-are-on-the-money
(2) : http://news.bbc.co.uk/2/hi/technology/4530930.stm
(3) : https://en.wikipedia.org/wiki/List_of_most_popular_websites
(4) : https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0030091
(5) : https://meta.wikimedia.org/wiki/List_of_Wikipedias#1+_articles
(6) : https://blog.wikimedia.org/2015/06/19/meet-print-wikipedia/
(7) : نسخ لصق نشر
(8) : https://stats.wikimedia.org/EN/Sitemap.htm
***
***
أحمد حجازي