يساعدنا الذكاء الاصطناعي في قراءة الأدب القديم لبلاد الرافدين

مجلة المذنب نت متابعات عالمية:
[… who s]يا للعمق ، […] البلد،
[who] عرف […]و […] الجميع […]
[… who] رأى العمق […] البلد،
[who] عرف […]و […] الجميع […]
يمثل هذا الاقتباس الأول بداية ملحمة جلجامش المعروفة منذ القرن التاسع عشر فصاعدًا. يُظهر الشكل التالي النص الذي تمت استعادته بالكامل ، بالشكل الذي حققه بعد أكثر من 100 عام ، عندما نُشر جزء جديد منه في عام 2007.
الذي رأى الغمر أساس البلد ،
من عرف الطرق الصحيحة ، كان حكيمًا في كل شيء!
كلكامش الذي رأى الغمر اساس البلاد
من عرف الطرق الصحيحة ، كان حكيمًا في كل شيء!
طوال القرن العشرين ، لم يُعرف سوى النسخة المجزأة من مقدمة الملحمة. أجيال من القراء ، عندما واجهتهم في البداية أكثر الأدب الكلاسيكي في بلاد ما بين النهرين ، شعروا بالإحباط من قراءة نص مجزأ ، من السماح لهم فقط بإلقاء نظرة شبكية على عالم البابليين.
المكتبة البابلية الإلكترونية ، قدم المؤلف
كان النص الأصلي مكتوبًا بالخط المسماري ، وهو نظام الكتابة الأكثر انتشارًا والأهمية تاريخيًا في الشرق الأوسط القديم. يأتي اسمها من انطباعات على شكل إسفين (باللاتينية ، cuneus) التي تشكل علاماتها.
فيما يتعلق باستحالة قراءة القصيدة بأكملها ، أعرب كاتب مسماري عن إحباطه: “لسوء الحظ ، لا تزال الأسطر الافتتاحية لملحمة كلكامش لا يمكن قراءتها بالكامل دون استخدام الخيال بشكل كبير”.
هذا الإحباط هو ، حتى اليوم ، الخبز والزبدة لكل كتاب مسماري ، غالبًا ما يتم تجربته “عندما يعاني المرء من نص مجزأ في غرفة الطلاب في المتحف البريطاني ويشتبه لسبب أو بآخر أن قطعًا مجهولة الهوية موضوعة في الأدراج على بعد أمتار قليلة فقط. بعيد”. ادخل إلى منصة المكتبة البابلية الإلكترونية (eBL).
الوصول إلى الأدب البابلي
الهدف الأساسي لمشروع eBL هو تعزيز فهم الأدب البابلي من خلال إعادة بنائه إلى أقصى حد ممكن. بالإضافة إلى ذلك ، يهدف المشروع إلى توفير منصة سهلة الاستخدام تحتوي على ترجمات مكثفة لشظايا الألواح المسمارية ، جنبًا إلى جنب مع أداة بحث قوية ، لمعالجة المشكلة المستمرة للطبيعة المجزأة لأدب بلاد ما بين النهرين.
العمود الفقري للمشروع هو Fragmentarium ، الذي يجمع رقميًا الترجمات الصوتية لأجزاء من الألواح المسمارية. تم التنقيب عن هذه الألواح المسمارية في الغالب في القرن التاسع عشر ، وتم تخزينها في أدراج المتاحف المختلفة منذ ذلك الحين.
على وجه الخصوص ، يحتوي المتحف البريطاني على مئات الآلاف من الألواح المسمارية ، والتي لم يُقرأ الكثير منها منذ العصور القديمة. لقد أدى تعاوننا مع المتحف البريطاني إلى رقمنة عشرات الآلاف من هذه الألواح وتحويلها صوتيًا في Fragmentarium.

قدم المؤلف
إذا كان Fragmentarium هو العمود الفقري للمشروع ، فإن عرضه هو eBL Corpus. تم تصميم المجموعة بحيث تحتوي على طبعات من كل “كلاسيكيات” الأدب البابلي التي تم نسخها خلال الألفية الأولى قبل الميلاد ، من ملحمة الخلق إلى قصيدة المتألم الصالح.
تستخدم إصدارات eBL العديد من الأجزاء غير المنشورة أو غير المحررة سابقًا ، والتي غالبًا ما يتم تحديدها من قبل أعضاء المشروع ، وبالتالي تمثل أحدث الإصدارات من النصوص.
ربط قواعد البيانات
المشكلة الرئيسية التي نواجهها هي جعل قاعدتي البيانات الكبيرتين (Fragmentarium و Corpus) للتحدث مع بعضهما البعض. لا يزال الأدب من بلاد ما بين النهرين القديمة مليئًا بالفجوات النصية ، وكان تحديد الأجزاء لملء هذه الفجوات بطيئًا وشاقًا بسبب الغموض في الكتابة المسمارية.
في الواقع ، الكتابة المسمارية لا تعرف قواعد الإملاء. لا توجد طريقة معيارية واحدة لكتابة كلمة. يقوم الكتبة ، عند نسخ النصوص التقليدية ، بتكييفها مع لهجاتهم الخاصة أو تفضيلاتهم الإملائية. وبالتالي ، تصبح مهمة التعرف على الشظايا صعبة ، حيث قد تختلف العلامات الموجودة في جزء واحد عن تلك الموجودة في جزء آخر.
كما هو الحال في العديد من أنظمة الكتابة القديمة والحديثة ، يمكن أن يمثل الحرف المسماري نفسه قراءات صوتية متعددة وكلمات كاملة. عندما يكون هناك سياق كافٍ ، فإن المعنى المتعدد لا يمثل مشكلة: عادة ما يكون هناك قراءة صحيحة واحدة فقط لكل علامة.
في مشروع حديث ، قمنا بتدريب نموذج ذكاء اصطناعي مع مجموعة صغيرة نسبيًا (أقل من 20000 سطر) وبدون استخدام قائمة علامات ، لتوضيح هذا المعنى المتعدد … حقق الكمبيوتر نسبة نجاح 98٪.
ومع ذلك ، مع الأجزاء المعزولة ، لا توجد قراءة صحيحة للشخصية. تصبح القراءة ممكنة فقط إذا حدد المرء مصدر الجزء.
كما أننا لا نملك لوحًا مسماريًا واحدًا يمكن من خلاله إعادة بناء بداية عمل مثل جلجامش. بدلاً من ذلك ، لدينا العديد من المخطوطات ، بعضها متداخل. عادة ، تبقى أجزاء قليلة فقط من كل مخطوطة.
يكمن مفتاح تحديد القطع الإضافية ، وبالتالي المضي قدمًا في إعادة البناء ، في اكتشاف التداخلات بين الأجزاء ، والتي بدورها ستمكن من اكتشاف المزيد من التداخلات مع الأجزاء الأخرى ، وما إلى ذلك.

المكتبة البابلية الإلكترونية ، قدم المؤلف
الكلمات هي حمضنا النووي التاريخي
ومن المثير للاهتمام أن الاستبدالات الموجودة في النصوص المسمارية تشبه الاختلافات الجينية الموجودة في الحمض النووي. يعتبر أخذ هذه الاختلافات في الاعتبار مصدر قلق رئيسي في المعلوماتية الحيوية ، مما أدى إلى تطوير العديد من خوارزميات محاذاة التسلسل.
نفذ مشروع eBL خوارزمية مماثلة لمحاذاة السلسلة مصممة خصيصًا للكتابة المسمارية ، مما يسهل عملية تحديد الهوية ويسرع بشكل كبير التقدم.
باستخدام هذه الخوارزمية ، والمرافق الأخرى المتنوعة التي أتاحها مشروع eBL للباحثين ، نجح الفريق المخصص لها في جامعة Ludwig Maximilian في ميونيخ في تحديد آلاف الأجزاء الجديدة ، كما نجح في تطوير إعادة بناء الأدب البابلي بشكل كبير.
إذا وجدت 150 عامًا من وجود علم الآشوريات قبل المشروع 5000 قطعة مسمارية يمكن ضمها إلى قطع معروفة بالفعل ، فقد أضافت السنوات الخمس لمشروع eBL 1500 أخرى إلى العدد ، وعدة آلاف لا يمكن ضمها مباشرة.
إن الوتيرة تتسارع فقط ، ومن المأمول أنه بعد نشر بوابة المكتبة البابلية الإلكترونية في فبراير ، سيستخدم باحثون وهواة آخرون هذه الأدوات لإعادة بناء النصوص القديمة المفقودة جزئيًا.
تم تمويل مشروع eBL ، الذي بدأ في أبريل 2018 في جامعة Ludwig Maximilian في ميونيخ ، بجائزة Sofja Kovalevskaja من مؤسسة Alexander von Humboldt.
نشكركم على قراءة المنشور عبر مجلة المذنب نت, المتخصصة في التداول والعملات الرقمية والمشفرة