أخصائيي الأرشيف الرقمي: حماية البيانات العامة من المحو

في العقود الثلاثة التي انقضت منذ أن قامت Brewster Kahle بتدوين آلة Wayback Archive غير الربحية ، تم توسيع نطاقها لتشمل مواقع الويب الحكومية ومجموعات البيانات – والتي تعتبر العديد منها ضرورية للمجتمعات الهندسية والعلمية. تعد الوكالات الحكومية الأمريكية مثل المؤسسة الوطنية للعلوم ، ووزارة الطاقة ، وناسا مصادر مهمة لبيانات البحث ، والمواصفات الفنية ، وتوثيق المعايير في كل مجال إلى حد كبير حيث IEEE Spectrumجمهور العمل – AAI وعلوم الكمبيوتر ، والأجهزة الطبية الحيوية ، والطاقة والطاقة ، وأشباه الموصلات ، والاتصالات … القائمة تطول.
يؤثر الوصول إلى تلك البيانات الحكومية بشكل مباشر على استنساخ التجارب ، والتحقق من صحة النماذج ، وسلامة السجل العلمي.
إذن ماذا يحدث إذا تختفي مجموعة بيانات كاملة؟ من بين أشياء أخرى ، يمكن أن تبطل سنوات من البحث المبني على هذا الأساس.
حتى وقت قريب ، كان حذف البيانات بالجملة نادرًا. في الولايات المتحدة ، تتضمن التحولات الرئاسية عادة بعض التغييرات على المواقع الحكومية لتعكس أولويات السياسة الجديدة. وبعد 11 سبتمبر ، قامت إدارة جورج دبليو بوش بإزالة “ملايين البايت” من المعلومات من المواقع الحكومية لأسباب أمنية وكذلك مئات وثائق وزارة الدفاع و “عشرات الآلاف” من ملفات لجنة تنظيم الطاقة الفيدرالية.
أجرت إدارات أوباما وبايدن أيضًا تغييرات على المواقع الحكومية ولكنها لم تشارك في الإزالة الواسعة النطاق لصفحات الويب أو مجموعات البيانات. في الواقع ، وسع أوباما وصول الجمهور إلى البيانات الحكومية في عام 2009 من خلال إطلاق Data.gov ، الذي تعتبر مهمته المعلنة جزئيًا “إطلاق سلطة الحكومة المفتوحة لإبلاغ القرارات من قبل الجمهور وصانعي السياسات”.
خلال فترة ولاية الرئيس دونالد ج. ترامب الأولى ، وجد الباحثون في مبادرة البيانات والحكم البيئي أن بعض المواقع الحكومية أصبحت غير قابلة للوصول ، وتم تطهير عبارة “تغير المناخ” من عدة صفحات على شبكة الإنترنت الحكومية.
لكن مجموعات الوكالة الدولية للطاقة في الغالب لم تلاحظ تدمير البيانات بشكل صريح نطاق مساعد المحرر جويندولين راك.
يؤثر الوصول إلى البيانات الحكومية بشكل مباشر على استنساخ التجارب ، والتحقق من صحة النماذج ، وسلامة السجل العلمي.
وكان المصطلح الثاني مختلفا. في فبراير ، بعد أسابيع قليلة من أداء ترامب اليمين الدستورية لمدة فترة الثانية ، صحيفة نيويورك تايمز ذكرت أن إدارته أسقطت أكثر من 8000 صفحة ويب وقواعد البيانات. ظهرت العديد من هذه الصفحات منذ ذلك الحين ، لكن بعض الصفحات والملفات المستعادة كانت لها تغييرات ، بما في ذلك محو المصطلحات مثل “تغير المناخ” (مرة أخرى) و “الطاقة النظيفة” ، “الحانة التقارير. واجهت هذه التحركات تحديات متعددة للمحكمة. في 11 فبراير ، على سبيل المثال ، أمر قاضٍ اتحادي بالوصول العام إلى صفحات الويب ومجموعات البيانات التي تنتمي إلى مراكز السيطرة على الأمراض والوقاية منها واستعادة إدارة الغذاء والدواء.
في عدد أبريل ، تقارير RAK عن الجهود المبذولة للحفاظ على وصول الجمهور إلى المعلومات. بالإضافة إلى العمل المستمر في أرشيف الإنترنت ، تصف كيف قام المحفوظون في مختبر الابتكار في المكتبات في كلية الحقوق بجامعة هارفارد بتجميع نسخة من أرشيف Data.gov 16-terabyte ، والذي يتضمن أكثر من 311000 مجموعة بيانات عامة. يتم تحديث هذا الأرشيف النسخ يوميًا باستخدام بيانات جديدة من خلال الاستعلامات الآلية إلى واجهات برمجة التطبيقات (APIs).
المحفوظون هم الأوصياء على الذاكرة. نعتمد عليهم لمساعدتنا على البقاء على اتصال مع تاريخنا ، والحفاظ على قاعدة المعرفة لدينا ، وتوفير السياق ، والسماح لنا بفهم كيف وصلنا إلى حيث نحن وإلقاء الضوء على الطريق إلى الأمام. في مجالات العلوم والهندسة والطب ، حيث تعود ابتكارات اليوم على أكتاف اكتشافات الأمس ، تضمن هؤلاء المحافظون الرقميون أن دائرة المعرفة الإنسانية تظل غير منقطعة.
تظهر هذه المقالة في إصدار الطباعة في أبريل 2025 حيث أن “الكثير من النسخ تبقي الأشياء آمنة”.
من مقالات موقعك
المقالات ذات الصلة حول الويب