البيانات الضخمة في فجر الذكاء الاصطناعي

مع بَدء عمليات المسح الفضائي الطموحة في إنتاج كميات هائلة وغير مسبوقة من البيانات، يتساءل بول فيشر كوكبيرن عما إذا كنا سنجد مستقبل علم الفلك في الذكاء الاصطناعي

أبريل 1, 2024

0 21 8 دقائق

البيانات الضخمة — كثير من المعلومات؟ مع طوفان هائل من البيانات الفضائية آتٍ على الطريق، يواجه العلماء مهمة شاقة تتمثل في تحليلها كلها

كتب الراحل دوغلاس آدامز Douglas Adams في كتابه دليل المسافر إلى المجرة The Hitchhiker’s Guide to the Galaxy: ”الفضاء كبير. كبير فعلاً. لن تصدق مدى ضخامة حجمه الهائل، وكم هو مربك للعقل والتفكير“.

افسح الطريق يا هابل: سيرسل التلسكوب إقليدس في يوم واحد من البيانات أكثر مما أرسله التلسكوب المخضرم هابل طوال حياته

ومن الإنصاف أن نقول هنا إنه لم يخطئ في قول ذلك.

ويرى علماء الفلك وخاصة أولئك الذين يركزون على أبحاث علم الكون (الكوزمولوجيا) Cosmology – أن لهذا نتيجةً واحدة واضحة: كلما صارت دراساتهم لمثل هذا الكون ”الكبير حقاً“ أدق وأكثر تفصيلاً، زادت كمية البيانات التي سينتجونها على الأرجح وستكون عليهم معالجتها. يمكن القول إن هذه مشكلة تلوح في الأفق منذ أن بدأ علماء الفلك أول مرة في تثبيت كاميرات على تلسكوباتهم؛ غير أن أحدث التقنيات الرقمية قد دفعت هذه المسألة إلى المقدمة بنحو لم يسبق له مثيل.

فلنأخذْ على سبيل المثال مصفوفة الكيلومتر المربع Square Kilometre Array، التي ذُكِرت في مقال سابق من عدد هذا الشهر: حالما تبدأ هذه المصفوفة عملها بكامل طاقتها، فهي ستنتج ”تيرابايتات“ من البيانات في كل ثانية.

كما تُعد أحدث مهمة للوكالة إيسا، وهي تلسكوب إقليدس الفضائي Euclid space telescope (الذي أُطلق في 1 يونيو 2023)، مثالاً رئيساً آخر. ومهمته هي في الأساس محاولة قياس هندسة الكون بكامله، وتحسين فهمنا للمادة المعتمة Dark matter والطاقة المعتمة Dark enrtgy. إنه يتطلب رصداً شديد الدقة لبلايين النجوم والمجرّات. وإن كمية البيانات التي سينتجها خلال مدته الرسمية التي تدوم 6 سنوات لا يمكن تصورها تقريباً.

ويوضح أستاذ الفيزياء الفلكية بجامعة إدنبرة، آندرو إن. تايلر Andrew N Taylor، قائلاً: ”ما أراه مثيراً هو أن أحداً لن يستطيع أن يدرس جميع بيانات إقليدس؛ فهي ستكون كبيرة جداً، ولن يتمكن أحد من ذلك أبداً. ومن المحتمل جداً إذا نظر أي شخص إلى منطقة ما من السماء، فما من أحد قد نظر إلى تلك المنطقة نفسها من السماء بمثل هذه الدقة والتفاصيل من قبل“.

**خطة هجوم مذهلة للتلسكوب إقليدس، سيمسح فيها أكثر من ثلث مساحة السماء**

حِمل زائد من المعلومات
ومنذ ما يقرب من 20 عاماً، كان آندرو جزءاً من تجمع إقليدس Euclid Consortium التابع للوكالة إيسا، والذي يدير التلسكوب الفضائي، وساعد على ابتكار فكرته الأولى، وتصميم المهمة وأهدافها العلمية. وخلال السنوات العشر الماضية، عندما صُمم التلسكوب، وصُنع، واختُبر مع بصرياته وأجهزة الكشف المختلفة عليه قبل إطلاقه، فقد تحول تركيزه ومعه كثيرٌ من العلماء الآخرين إلى تحليل بيانات الرصد.

يقول آندرو: ”يُنتج إقليدس كمية هائلة من البيانات. ونحن نتلقى منه كميات منها بقدر مئات الغيغابايتات يومياً. ولإعطائك فكرة فقط عن حجمها، سيكون التمثيل الجيد هو ما يصلنا من التلسكوب هابل الفضائي. فمن حيث جودة الصورة، ستبدو صورة واحدة من إقليدس وصورة واحدة من هابل متشابهتَين جداً، ولكن إذا عمدتَ إلى تجميع كل الصور التي التقطها هابل خلال حياته ووضعتها على صفحة السماء، فهي ستغطي مساحة تقارب 20 مرة فقط من حجم القمر البدر. أما التلسكوب إقليدس فيستطيع أن يفعل ما فعله هابل في حياته كلها في يوم واحد. وفي الواقع، سيكون الأمر أكثر من ذلك، لأنه لا يلتقط صوراً بصرية مثل هابل فحسب، بل أيضاً صوراً بالأشعة تحت الحمراء ولأطياف المجرات والأجرام الموجودة هناك. وهذه خطوة كبيرة لعلم الفلك من حيث كمية المعلومات التي سنحصل عليها“.

مراحل على ”خط أنابيب“ البيانات Data pipeline الذي يحول البيانات الأولية الكبيرة التي لا يصعب التعامل معها إلى صور يستطيع علماء الفلك تفسيرها

وهذا ليس فقط لأن فريق إقليدس متعدد الجنسيات أراد الانطلاق به وجمع كثير من البيانات. يقول آندرو: ”الهدف العلمي هو محاولة فهم طبيعة المادة المعتمة، وكون الطاقة المعتمة؛ ومن أجل اختبار نظرياتنا، نعلم أنه يتعين علينا البحث عن اختلافات صغيرة دقيقة جداً في أشياء مثل توزُّع المادة وتطوُّرها في الكون. إنها مشكلة البيانات الكبيرة الكلاسيكية: لقد حصلنا على إشارة صغيرة جداً، ولذا فنحن في حاجة إلى مجموعة ضخمة من البيانات لمحاولة الحصول على مستويات الدقة التي نحتاج إليها لاختبار نظرياتنا“.

توضح هذه الصورة الاختبارية المبكرة للتلسكوب إقليدس كيف تُغربِل الخوارزميات الشوائب الضوئية غير المرغوب فيها وتفصلها من بتات البيانات المفيدة للباحثين

ومن أجل معالجة البيانات، فقد طوّر تجمُّع إقليدس خوارزميات حاسوبية مخصصة، لتساعد في ضغط البيانات، و”خط نقل“ للبنية التحتية لتكنولوجيا المعلومات يأخذ البيانات الأولية ويحولها إلى شيء يمكن لعلماء الفلك استخدامه وتفسيره فعلاً. تعتمد جميع التقنيات المستخدمة على الأساليب التقليدية نفسها التي استخدمها علماء الفلك منذ مئات السنين، ولكن حجم العمل يتطلب نهجاً جديداً. ومع أن جميع البيانات الواردة من إقليدس سيتلقاها مبدئياً المركز الأوروبي لعلم الفلك الفضائي بالقرب من مدينة مدريد، فإنها لن تعالج هناك.

سيُنفذ العمل على بيانات إقليدس في 9 مراكز بيانات علمية في معظم أنحاء أوروبا، ومركز المملكة المتحدة الذي يوجد في المرصد الملكي في إدنبرة. يقول تايلر: ”كان المفهوم الأصلي هو أن تتحمل كل دولة المسؤولية عن مجال واحد من مجالات المعالجة، وأن تنقل البيانات بين البلدان. أدركنا في وقت مبكر أن هذا لن يكون ممكناً؛ وكان الحل الذي توصلنا إليه هو أن نقسم السماء إلى أتْساع Ninths. وسينفذ كل مركز بيانات جميع عمليات المعالجة لرقعة السماء المنوطة به“.

**قوة الناس: اكتشف معلم المدرسة الهولندي هاني فان آركل Hanny van Arkel أصداء فريدة لعملية تأيُّن كويزار**

اكتشاف ”الأمور الغريبة“

عندما يتعلق الأمر باكتشاف الأمور الغريبة في البيانات، يبدو العنصر البشري أفضل بكثير من الآلة

هل يمكن لتكنولوجيا تعلُّم الآلة والذكاء الاصطناعي أن تساعد على اكتشاف ما هو غير متوقع في مجموعات البيانات الفلكية؟ يعتقد آلكس آندرسن Alex Andersson، الباحث في جامعة أكسفورد، أن هذا قد يكون ممكناً.

ويقول: ”يمكنك النظر إلى نماذج معينة من الفيزياء، مثل كيفية عمل النجوم أو سلوك المجرات، وكذلك الأشياء التي يمكنك التنبؤ بها ولكنك لم ترها بعد شكل من ’مجاهيل معروفة‘. وبعد ذلك هناك ذلك ’المجهول المجهول‘. أمضي كثيراً من وقتي في العمل على خوارزميات الكشف عن الحالات الشاذة والغريبة، حيث أحاول ألا أفترض كثيراً عن الفيزياء أو عما أتوقع، وأن أرى ما تقوله البيانات فقط، وما يخرج منها بصورة ’شيء غريب‘ “.

تتضمن أعمال آندرسن مرصد ميركات MeerKAT في جنوب إفريقيا، وهو التلسكوب الراديوي الذي سيشكل نواة مصفوفة الكيلومتر المربع (SKA). وفضلاً عن ذلك هو يدير مشروع علوم مواطن Citizen Science يسمى ”انبعث من الفضاء، يا ميركات“ Burst from Space MeerKAT على منصة Zooniverse، ويطلب من مئات المتطوعين على الإنترنت البحث في بيانات هذا التلسكوب عن صفات وأشياء غير عادية. وقد ساعدت مشروعات علمية مماثلة xq للمواطنين عمليات المسح الفلكية الأخرى على التعمق في كميات هائلة من البيانات. وكثيراً ما كان هؤلاء المتطوعون رائعين في كشف الأشياء الغريبة والشاذة في الصور والتي يمكن أن تؤدي إلى اكتشافات جديدة. أحد الأمثلة المبكرة هو من مشروع Galaxy Zoo على منصة Zooniverse، حيث عثر المساعدون على نقاط خضراء غريبة تبين أنها مجرات صغيرة متراصة.

غير أن البيانات الواردة من التلسكوب إقليدس ومصفوفة الكيلومتر المربع SKA ستكون ضخمة جداً للتعامل معها، حتى من قِبل فرق العلماء المواطنين. هل يمكن تدريب الذكاء الاصطناعي للبحث عن تلك الأشياء المجهولة؟ يختبر آندرسن مثل هذه الخوارزميات الكاشفة للمعالم الشاذة على ذات البيانات التي يبحث فيها العلماء المواطنون، بهدف معرفة ما إذا كانت ستكشف عن الأمور ”الغريبة“ ذاتها. ومع ذلك فإن هدفه ليس استبدالَ العلماء المواطنين، بل استخدام الذكاء الاصطناعي لتقليص حجم البيانات إلى كمية معقولة ليتمكنوا من التعامل معها.

ويقول: ”أعتقد شخصياً أن الاكتشاف في الكون هو تجربة إنسانية فريدة، ولذا لا أرى أن تعلُّم الآلة سيحل محلنا في هذا الصدد“.

الذكاء الاصطناعي

**سِيري، كم يوجد من المادة المعتمة في الكون؟**

الذكاء الاصطناعي يدرب حواسيب على التفكير مثل الإنسان

يمكن القول إن العام 2023 كان هو العام الذي اكتسب فيه الذكاء الاصطناعي اهتماما كبيراً فعلاً، فألهم مثل أي تطور تكنولوجي عبر تاريخ البشرية حماسَ المبشرين بفوائده الممكنة، وكذلك الرعب المتوقع من جوانبه السلبية المحتملة.

ومع ذلك فقد كان الذكاء الاصطناعي موجوداً وقتاً أطول بكثير من وجود أمثال الربوت ChatGPT. لقد صيغ المصطلح ذاته أول مرة في العام 1956، وعمل العلماء على إيجاد طرق تمكن أجهزة الحواسيب من ”التفكير“ والاستجابة لنا بطريقة أكثر ”بشرية“ منذ عقد الستينات من القرن العشرين على الأقل. ومن دون حتى أن نلاحظ، يعتمد جزء كبير من حياتنا الحديثة حالياً على الذكاء الاصطناعي، سواء كان ذلك نشاطك على وسائل التواصل الاجتماعي، أو خيارات المشاهدة على موقع Netflix، أو المساعدات المنزلية الرقمية، مثل آلكسا Alexa وسِيري Siri.

الأمر كله يتعلق بجعل التكنولوجيا الخاصة بنا تبدو كأنها أكثر استجابة، وهو مبدأ يمكن استخدامه بعدة طرق مختلفة. وقد حدث أحد أكبر التطورات في مجال تعلُّم الآلة المتفرع من الذكاء الاصطناعي، حيث تُمكِّن خوارزمياتُ البرامج المتطورة بنحو متزايدٍ الآلاتِ من تذكر أخطائها والتعلم منها، بدلاً من مجرد تكرار أي مهام بُرمجت لتنفيذها.

يتعلق كثير من المخاوف بشأن التكنولوجيا بقدرة الحاسوب على تنفيذ العديد من المهمات وخاصة العمليات الحسابية بسرعة أكبر بكثير من البشر. ومع مواجهة علماء الفلك لمجموعات بيانات أكبر من أي وقت مضى، فمن المحتمل أن يصير تعلُّم الآلة أداة شائعة الاستخدام.

التدريب في مركز غودارد للتحليق الفضائي، حيث تسابق الوكالة ناسا لمعالجة التحديات واقتناص الفرص التي توفرها التكنولوجيا الجديدة

تجزئة البيانات
ستستلزم هذه المعالجة تحويل الصور الفردية إلى ”فهارس“. وستكتشف الخوارزميات معالم معينة يهتم بها فريق التلسكوب إقليدس، مثل النجوم والمجرات، ثم تنشأ قوائم بمواقعها وأحجامها وخصائصها الأخرى. ولن يتحقق هذا إلا في تلك المرحلة، عندما تصير البيانات بحجم أكثر قابلية للإدارة، حيث سيرسل كل مركز من مراكز البيانات جميع بياناته إلى المركز الرئيس للتجميع والمعالجة النهائية.

وهذا العمل لا يخلو من التحديات. يوضح تايلور: ”أحد الأشياء التي كان علينا التعامل معها هو كيفيةٌ تساوي بين الأمور عندما لا تكون البنية التحتية الأساسية للحواسيب متماثلة. ولذا هناك كثير مما نسميه بالمحاكاة الافتراضية، وهو أننا نحاول محاكاة الحاسوب نفسه في كل مكان“.

أظهرت ورش العمل حول الذكاء الاصطناعي وتعلُّم الآلة كيف ستُحدث الأتمتة ثورة في علم البيانات Data Science عبر الوكالة الفضائية

صعود الآلات
وبينما يبدو هذا النموذج ”الموزع“ للبيانات أمراً لا مفر منه جزئياً داخل منظمة متعددة الجنسيات مثل الوكالة إيسا، فهو يعني أن فريق خبراء إقليدس صار، وبنحو غير متوقع، رائداً في كيفية تنفيذ مشروعات الحوسبة الضخمة على شبكات موزعة، وقد تواصلت معهم بالفعل شركات كبيرة مهتمة بمعرفة كيف فعلوا ذلك. فبعد كل شيء، ليس علماء الفلك وحدهم من لديه مجموعات ضخمة من البيانات ليعالجها.

ومع كل هذا الحديث عن أنظمة تكنولوجيا المعلومات والخوارزميات، كيف ستبدو أهمية العنصر البشري عندما يتعلق الأمر بمعالجة البيانات؟

”مع أنه يوجد لدينا الآن مسار تنفيذي وتحليل جاهزين، إلا أن تطوير الخوارزميات قد أنجزه بالكامل عنصر بشري، استخدم معرفته وفهمه“

يقول تايلر: ”نحن بالتأكيد ندخل عصراً تبدو فيه أجهزة الحواسيب قادرة على فِعل مزيد ومزيد، وتَوَلي مزيد ومزيد من الأعمال. أعتقد أن [إقليدس] جاء في مرحلة محظوظة، بمعنى أننا كنا نعمل على هذا الأمر منذ ما يقرب من 20 عاماً. وقد بدأت الكتابة الحقيقية للخوارزميات منذ نحو 10 سنوات فقط“.

ومع ذلك، هناك أيضاً بعض الأساليب الأحدث تستخدم في بيانات إقليدس، مثل الذكاء الاصطناعي (AI)، وهي تقنية استخدام برامج الحاسوب التي تحاكي طريقة تفكير البشر. إحدى المجموعات الفرعية المحددة من الذكاء الاصطناعي المستخدمة في علم الفلك هي ”تعلم الآلة“ Machine learning، حيث تتعلم البرامج من التجربة في أثناء معالجة البيانات، ليؤدي هذا إلى تحسين تحليلها مع الوقت.

حالياً يستخدم التلسكوب إقليدس هذه الأدوات الأحدث بطريقة محدودة، مثل المساعدة على تصنيف المجرات. يقول تايلر: ”كان الاتجاه السائد هو اتباعَ الأشياء التي فهمناها، والتي ثبت أنه يمكن الاعتماد عليها في المشروعات السابقة. يجري تنفيذ كثير من الأشياء بطريقة تقليدية أكثر من أجل ’القوة‘، و’الموثوقية‘“ .

لن يستطيع أي إنسان أن ينظر إلى جميع بيانات التلسكوب إقليدس؛ ويجب على الخوارزميات الموجهة بالأشخاص أن تضطلع بهذا العمل في نهاية الأمر

إبقاء الناس في المعادلة
في الوقت الحالي يتلقى علماء الفلك البيانات من فورهم، ولذا فهم ما زالوا في المراحل الأولى من معالجتها. ومع انتقالهم إلى مراحل أكثر تقدماً في عمليات التحليل، سيرغبون في النهاية بمقارنة البيانات مع ما تتنبأ به نظرياتهم وهذه إحدى الطرق الرئيسة التي يستخدمونها لاختبار أفكارهم عن آلية عمل الكون.

يوضح تايلر: ”إحدى المشكلات هنا هي كيفية إنشاء النماذج النظرية. أما ما يخص التحليل التفصيلي، فنحن نريد إجراء محاكاة للكون بناءً على نظريات مختلفة لما يحدث فيه. إن إجراء محاكاة كاملة أمر مكلف جداً، ولذا فهناك كثير من العمل في محاولة فهم ما إذا كان في إمكاننا استخدام الذكاء الاصطناعي أو تعلُّم الآلة لاختصار الوقت والجهد من دون خسارة في الإتقان أو الدقة، و توفير وسائل سريعة للاضطلاع بذلك“.

وفي المحصلة يقبل تايلر أن حجم البيانات التي ينتجها تلسكوب إقليدس سيشجع على زيادة استخدام تعلُّم الآلة، وأتمتة معالجة بيانات إقليدس. لكنه يرى أن علماء الفلك العنصر البشري ما زالوا في قلب ما يحدث.

يقول تايلر: ”في الوقت الحالي، وعلى الرغم من توفُّرنا الآن على مسار وتحليل لفعل ذلك، فإن تطوير الخوارزمية قد جرى بالكامل من قِبل بشر، استخدموا معرفتهم وفهمهم للمشكلات لمعالجة هذا النوع من مجموعات البيانات“.

”فالأمر لا يتعلق فقط بالقول: ’دعونا نُلقِ نظرة على بعض الصور باستخدام الذكاء الاصطناعي، وسيخبرنا بالإجابات‘، لأن هناك كثيراً من التفاصيل في الصور في حاجة إلى فهمها واستيعابها“.

إحدى خصائص برامج الذكاء الاصطناعي هي حاجتها إلى البيانات من أجل أن تتعلم. في الوقت الحالي، لا يعرف الذكاء الاصطناعي كيف تبدو بيانات التلسكوب إقليدس، وذلك لأنه قد بدأ من فوره مهمته في مسح السماء. وحتى عندما يبدأ في معالجة البيانات، سيظل في حاجة إلى معطيات بشرية لفهم ما يبحث عنه، والبَدء في تعليمه دروسه الأولى.

بول فيشر كوكبيرن Paul Fisher Cockburn:
كاتب علمي يكتب في علوم الفلك

يعلق تايلر قائلاً: ”هناك قدر كبير من التفاصيل التي يجب الاطلاع عليها وفهمها حقاً. والعنصر البشري هو الذي يأتي بهذه المعرفة“.

ستنمو المشكلات المتعلقة بالتعامل مع البيانات الضخمة بمرور الوقت. وفقط من خلال الجهد الجماعي باستخدام أدوات المعالجة مثل الذكاء الاصطناعي وفرق بشرية منتشرة عبر أنحاء العالم سيتمكن علماء الفلك من العمل معاً من أجل فهم أفضل للكون من حولنا.

الوسوم

أبريل 1, 2024

0 21 8 دقائق

اشترك معنا بإدخال إيميلك الشخصي

مقالات ذات صلة

تصوير سديم الجبار

إضـاءة صديقة للظلام

تــــــذكّــــَرْ روزيــــتــــا

خبراؤنا يعاينون أحدثَ المعدات الفلكية

اترك تعليقاً إلغاء الرد