7 أمثلة على التحيز في الصور التي تم إنشاؤها بواسطة الذكاء الاصطناعي

مجلة المذنب نت متابعات عالمية:
إذا كنت متصلاً بالإنترنت مؤخرًا ، فمن المحتمل أنك رأيت بعض الصور الخيالية التي تم إنشاؤها بواسطة مولدات تحويل النص إلى صورة مثل Midjourney و DALL-E 2. وهذا يشمل كل شيء من طبيعي (أعتقد إصابة لاعب كرة قدم في الرأس) إلى سريالية (فكر في وجود كلب في الفضاء).
لم يكن إنشاء الصور باستخدام مولدات الذكاء الاصطناعي أسهل من أي وقت مضى. ومع ذلك ، في الوقت نفسه ، يمكن لهذه المخرجات إعادة إنتاج التحيزات وتعميق التفاوتات ، كما يُظهر بحثنا الأخير.
كيف تعمل مولدات الصور بالذكاء الاصطناعي؟
تستخدم مولدات الصور القائمة على الذكاء الاصطناعي نماذج التعلم الآلي التي تأخذ إدخال نص وتنتج صورة واحدة أو أكثر تتطابق مع الوصف. يتطلب تدريب هذه النماذج مجموعات بيانات ضخمة تحتوي على ملايين الصور.
على الرغم من أن Midjourney غير شفافة بشأن الطريقة الدقيقة التي تعمل بها الخوارزميات ، فإن معظم مولدات صور الذكاء الاصطناعي تستخدم عملية تسمى الانتشار. تعمل نماذج الانتشار عن طريق إضافة “ضوضاء” عشوائية إلى بيانات التدريب ، ثم تعلم كيفية استعادة البيانات عن طريق إزالة هذه الضوضاء. يكرر النموذج هذه العملية حتى يكون لديه صورة تطابق الموجه.
هذا يختلف عن نماذج اللغات الكبيرة التي تدعم أدوات الذكاء الاصطناعي الأخرى مثل ChatGPT. يتم تدريب النماذج اللغوية الكبيرة على البيانات النصية غير الموسومة ، والتي يتم تحليلها لتعلم أنماط اللغة وإنتاج استجابات شبيهة بالبشر للمطالبات.
اقرأ المزيد: AI to Z: كل المصطلحات التي تحتاج إلى معرفتها لمواكبة عصر الضجيج في مجال الذكاء الاصطناعي
كيف يحدث التحيز؟
في الذكاء الاصطناعي التوليدي ، تؤثر المدخلات على المخرجات. إذا حدد المستخدم أنه يريد فقط تضمين أشخاص من لون بشرة معين أو جنس معين في صورته ، فسيأخذ النموذج ذلك في الاعتبار.
علاوة على ذلك ، سيكون للنموذج أيضًا ميل افتراضي لإرجاع أنواع معينة من المخرجات. عادة ما يكون هذا نتيجة لكيفية تصميم الخوارزمية الأساسية ، أو عدم وجود تنوع في بيانات التدريب.
استكشفت دراستنا كيف تصور Midjourney المصطلحات التي تبدو عامة في سياق المهن الإعلامية المتخصصة (مثل “محلل الأخبار” و “المعلق الإخباري” و “مدقق الحقائق”) وغير المتخصصين (مثل “الصحفي” و “المراسل” ، “المراسل” و “الصحافة”).
بدأنا تحليل النتائج في أغسطس من العام الماضي. بعد ستة أشهر ، لمعرفة ما إذا كان أي شيء قد تغير بمرور الوقت ، قمنا بإنشاء مجموعات إضافية من الصور لنفس المطالبات.
في المجموع ، قمنا بتحليل أكثر من 100 صورة تم إنشاؤها بواسطة الذكاء الاصطناعي خلال هذه الفترة. كانت النتائج متسقة إلى حد كبير مع مرور الوقت. فيما يلي سبعة تحيزات ظهرت في نتائجنا.
1 و 2. الشيخوخة والتمييز على أساس الجنس
بالنسبة للألقاب الوظيفية غير المتخصصة ، أعاد ميدجورني صورًا لشبان وشابات فقط. بالنسبة للأدوار المتخصصة ، تم عرض كل من الشباب وكبار السن – لكن كبار السن كانوا دائمًا رجالًا.
تعزز هذه النتائج ضمنيًا عددًا من التحيزات ، بما في ذلك الافتراض بأن كبار السن لا (أو لا يستطيعون) العمل في أدوار غير متخصصة ، وأن الرجال الأكبر سنًا هم فقط المناسبون للعمل المتخصص ، وأن العمل الأقل تخصصًا هو مجال المرأة.
كانت هناك أيضًا اختلافات ملحوظة في كيفية عرض الرجال والنساء. على سبيل المثال ، كانت النساء أصغر سناً وخالية من التجاعيد ، بينما “يُسمح” للرجال بالتجاعيد.
كما يبدو أن الذكاء الاصطناعي يقدم الجنس باعتباره ثنائيًا ، بدلاً من إظهار أمثلة للتعبير الجندري الأكثر مرونة.
ميدجورني
3. التحيز العنصري
أعيدت جميع الصور لمصطلحات مثل “صحفي” أو “مراسل” أو “مراسل” ظهرت حصريًا على أشخاص ذوي بشرة فاتحة. هذا الاتجاه إلى افتراض البياض بشكل افتراضي هو دليل على الهيمنة العرقية المضمنة في النظام.
قد يعكس هذا الافتقار إلى التنوع والتمثيل في بيانات التدريب الأساسية – وهو عامل يتأثر بدوره بالافتقار العام للتنوع في مكان العمل في صناعة الذكاء الاصطناعي.

ميدجورني
4 و 5. الطبقية والمحافظة
جميع الشخصيات في الصور كانت أيضًا “محافظة” في مظهرها. على سبيل المثال ، لم يكن لدى أي منهم وشم أو ثقوب أو تسريحات شعر غير تقليدية أو أي سمة أخرى يمكن أن تميزهم عن التصورات السائدة المحافظة.
ارتدى الكثيرون أيضًا ملابس رسمية مثل القمصان ذات الأزرار وربطات العنق ، وهي علامات على توقعات الطبقة. على الرغم من أن هذا الزي قد يكون متوقعًا لأدوار معينة ، مثل مقدمي البرامج التلفزيونية ، إلا أنه ليس بالضرورة انعكاسًا حقيقيًا لكيفية ارتداء المراسلين أو الصحفيين بشكل عام.
6. العمران
دون تحديد أي موقع أو سياق جغرافي ، وضع الذكاء الاصطناعي جميع الأرقام في البيئات الحضرية مع ناطحات السحاب الشاهقة ومباني المدن الكبيرة الأخرى. هذا على الرغم من أن أكثر بقليل من نصف سكان العالم يعيشون في المدن.
هذا النوع من التحيز له آثار على كيفية رؤيتنا لأنفسنا ، ودرجة ارتباطنا بأجزاء أخرى من المجتمع.

ميدجورني
7. مفارقة تاريخية
كانت التكنولوجيا الرقمية ممثلة تمثيلا ناقصا في العينة. بدلاً من ذلك ، ملأت التقنيات من عصر مختلف تمامًا – بما في ذلك الآلات الكاتبة والمطابع والكاميرات القديمة الضخمة – العينات.
نظرًا لأن العديد من المحترفين يبدون متشابهين هذه الأيام ، يبدو أن الذكاء الاصطناعي يعتمد على تقنيات أكثر تميزًا (بما في ذلك التقنيات التاريخية) لجعل تمثيلاته للأدوار أكثر وضوحًا.

صور المؤلفين عبر Midjourney
في المرة التالية التي تشاهد فيها صورًا تم إنشاؤها بواسطة الذكاء الاصطناعي ، اسأل نفسك عن مدى تمثيلها للجمهور الأوسع ومن الذي سيستفيد من التمثيلات في الداخل.
وبالمثل ، إذا كنت تنشئ صورًا بنفسك ، ففكر في التحيزات المحتملة عند صياغة مطالباتك. وإلا فقد تعزز عن غير قصد نفس الصور النمطية الضارة التي أمضى المجتمع عقودًا في محاولة التخلص منها.
نشكركم على قراءة المنشور عبر مجلة المذنب نت, المتخصصة في التداول والعملات الرقمية والمشفرة