تستعد لطوفان البيانات

من Facebook إلى قسم السيارات ، يتم فهرسة العالم في قواعد البيانات. لا أحد يعرفه أفضل من الأستاذ المساعد ورجل الأعمال في معهد ماساتشوستس للتكنولوجيا مايكل ستونبراكر ، الذي أمضى الخمسة وعشرين عامًا الماضية في تطوير التكنولوجيا التي جعلته كذلك. حصل على استراحة كبيرة من خلال اختراع وتسويق التكنولوجيا التي تكمن وراء معظم قواعد البيانات ، والمعروفة باسم قواعد البيانات العلائقية ، التي تحكم اليوم. لكن ستونبراكر الآن ، وبكل سرور ، يصف اختراعاته السابقة بأنها عفا عليها الزمن إلى حد كبير. إنه يعمل على جيل جديد من تقنية قواعد البيانات التي يمكنها التعامل مع تدفق البيانات الرقمية الذي بدأ يطغى على الأساليب المعمول بها.

قواعد البيانات العلائقية موجودة في كل مكان كحل لبيانات المؤسسة. يقول ستونبراكر إنهم كانوا ناجحين بشكل خرافي. لكنه يقول إن أكبر بائعي قواعد البيانات ، بما في ذلك Oracle و IBM و Microsoft ، لا يزالون يبيعون مثل هذه المنتجات على أنها مناسبة لأي عمل. لدى Stonebraker وجهة نظر مختلفة: أن تقنيات قواعد البيانات الجديدة مطلوبة للتعامل مع الزيادات الأسية في المعلومات التي يجب على الشركات التعامل معها. حقق Stonebraker ، 67 عامًا ، نجاحًا بالفعل مع العديد من مقارباته الجديدة.

واحد هو نظام قاعدة بيانات يسمى C- المتجر . على عكس معظم الأنظمة المستخدمة اليوم ، فإنه يخزن البيانات على قرص عمود بعد عمود ، وليس صفًا بصف. يتطلب هذا التعديل البسيط إعادة كتابة كاملة لكيفية عمل قواعد البيانات ، لكنه يتوافق بدقة مع طريقة عمل ذاكرة الكمبيوتر وطريقة الوصول إلى قواعد البيانات. ينتج عن ذلك أداء أسرع ومزيد من البيانات المضغوطة.



أتاح هذا التعديل وغيره من الأدوات التي صنعها Stonebraker وزملاؤه في معهد ماساتشوستس للتكنولوجيا ، وبراون ، وبرانديز ، وييل ، وجامعة ماساتشوستس إطلاق فيرتكا ، وهي شركة قامت بتسويق C-Store وساعدت العملاء في الاستعلام عن قواعد البيانات الكبيرة في الوقت الفعلي تقريبًا. استحوذت شركة Hewlett-Packard على Vertica في فبراير وتفتخر بعملائها بما في ذلك Comcast ، التي تستخدمها لمراقبة ملايين الأجهزة التي تشكل شبكات التلفزيون والإنترنت الخاصة بها ، و Groupon التي تستخدمها لتحليل تصرفات الملايين من مشتركيها.

نظام ذو صلة من Stonebraker وبعض الزملاء الأكاديميين أنفسهم ، H- المتجر ، يعتمد على نفس الأفكار مع تحسينات إضافية مثل التشغيل بالكامل في ذاكرة الكمبيوتر ، وليس على القرص ؛ هذه الطريقة مفيدة بشكل خاص في معالجة المعاملات عبر الإنترنت. كود H-Store مفتوح المصدر ، ولكن يتم تسويق التكنولوجيا من خلال دعم المشاريع فولت ديسيبل ، مع Stonebraker كمدير تقني. يجادل بأن هذا النوع من نظام قواعد البيانات المصمم خصيصًا للاستخدام السريع هو ما ستحتاجه معظم الشركات لاعتماده عاجلاً وليس آجلاً للتعامل مع تدفق البيانات الرقمية.

بعض المنظمات عالقة بالفعل في هذا الفيضان. ضع في اعتبارك Facebook. يستضيف Facebook بالفعل عددًا من الصور الرقمية أكثر من أي شركة أخرى ، يقوم Facebook ببناء بنية تحتية جديدة للتخزين والمعالجة بأسرع ما يمكن. ومع ذلك ، فإنها تدفع بتقنية قاعدة البيانات التي تستخدمها إلى أقصى حد ، حيث تقوم بتقسيم الرسم البياني الاجتماعي الشهير الخاص بها عبر 4000 قاعدة بيانات يجب أن تعمل جميعها معًا كوحدة واحدة ، كما يقول ستونبراكر. إنهم يموتون فقط تحت عبء طبقة الإدارة اللازمة للحفاظ على هذا النظام ، كما يقول. لديهم أصعب مشكلة في قاعدة البيانات على هذا الكوكب ، ولا يوجد نظام حالي يلبي احتياجاتهم.

الحلول التي تبنيها Stonebraker لقطاع مختلف تمامًا غارق بالفعل في البيانات قد تساعد في النهاية. قبل بضع سنوات ، سمع عن المشاكل التي تواجه تلسكوب مسح شامل كبير قيد الإنشاء في تشيلي. ستجمع 100 بيتابايت من البيانات الأولية والبيانات المشتقة ، كما يقول Stonebraker ، ولم يكن لديهم أدنى فكرة عما يجب فعله بهذا القدر.

كم من الوقت يمر على السفينة؟

قام Stonebraker والمتعاون David DeWitt ، المنتسبان إلى جامعة Wisconsin-Madison ، ببناء نظام قاعدة بيانات فريد باسم SciDB . يتمتع المشروع مفتوح المصدر الآن بدعم المشروع ومجتمع كبير من المتطوعين من داخل العلوم. لكن ستونبراكر يعتقد أن ميزات برنامج SciDB ستحظى في النهاية باهتمام يتجاوز الأوساط الأكاديمية.

جميع البيانات العلمية غير مؤكدة ولديها أشرطة خطأ ، على عكس البيانات الموجودة في قاعدة بيانات الرواتب ، لذلك يمكن لـ SciDB الانتباه إلى عدم اليقين. كما أنه لا يمكن استبداله ، لأن رجال العلم لا يريدون أبدًا التخلص من أي شيء ، كما يقول. لا تختلف هذه الميزات كثيرًا عن الحاجة إلى التحليلات عالية الطاقة والمثقلة بالإحصاءات أو علوم البيانات بشكل متزايد في قلب الأعمال الناجحة التي تقودها التكنولوجيا. أحد الأمثلة على ذلك هو موضع الإعلان عبر الإنترنت: يتطلب استهداف كل شخص على حدة تحليلًا حسابيًا مكثفًا لتجميع الأشخاص المتشابهين معًا.

ومع ذلك ، لا يدعي Stonebraker أن أنظمة قواعد البيانات الجديدة مثل تلك التي يعمل عليها يمكن أن تكون حلاً سحريًا للشركات التي تتعلم فجأة حدود التقنيات الأكثر رسوخًا. إن الأهمية المتزايدة لتخزين البيانات ومعالجتها للأعمال التجارية من جميع الأنواع سوف تتطلب منهم جعل كلاهما أكثر أولوية عمل. إذا كنت تدير شركة ، فعليك إجراء هندسة على نطاق واسع منذ البداية ، كما يقول ، لأنه لا شك أنك ستحتاج إليها لاحقًا.

يخفي

التقنيات الفعلية

فئة

غير مصنف

تكنولوجيا

التكنولوجيا الحيوية

سياسة التكنولوجيا

تغير المناخ

البشر والتكنولوجيا

وادي السيليكون

الحوسبة

مجلة Mit News

الذكاء الاصطناعي

الفراغ

المدن الذكية

بلوكشين

قصة مميزة

الملف الشخصي للخريجين

اتصال الخريجين

ميزة أخبار معهد ماساتشوستس للتكنولوجيا

1865

وجهة نظري

77 Mass Ave

قابل المؤلف

ملامح في الكرم

شوهد في الحرم الجامعي

خطابات الخريجين

أخبار

انتخابات 2020

فهرس With

تحت القبه

خرطوم الحريق

مؤشر With

قصص لانهائية

مشروع تكنولوجيا الوباء

من الرئيس

غلاف القصه

معرض الصور

موصى به