علت قطعی جهانی X و ChatGPT مشخص شد؛ توضیح مشکل توسط کلودفلر
روز گذشته، بخشهای گستردهای از اینترنت جهان تحت تأثیر مشکلات داخلی شرکت کلودفلر (Cloudflare) قرار گرفت. سرویسهای محبوبی مانند هوش مصنوعی ChatGPT، شبکه اجتماعی ایکس (X) و حتی وبسایت Downdetector (که وظیفه گزارش قطعیها را برعهده دارد) از دسترس خارج شدند و کاربران بسیاری را دچار سردرگمی کردند. اکنون، کلودفلر با انتشار بیانیهای رسمی، شرح کاملی از دلایل فنی این اختلال را ارائه داده است.
متیو پرینس (Matthew Prince)، همبنیانگذار و مدیرعامل کلودفلر، در یک پست وبلاگی رسمی، جزئیات فنی وقوع این حادثه را منتشر کرد. برخلاف گمانهزنیهای اولیه مبنی بر حمله سایبری گسترده، دلیل اصلی این اختلال، یک خطای داخلی در سیستم مدیریت بات (Bot Management) کلودفلر بود که در نهایت منجر به پر شدن حافظه سیستم و از کار افتادن سیستمهای پردازش ترافیک مشتریان شد. متیو پرینس به صراحت اعلام کرد که این حادثه نه حمله سایبری، نه مشکل DNS و نه یک حمله انکار سرویس توزیعشده (DDoS) در مقیاس بزرگ بود، بلکه یک تغییر در سیستم مجوزهای پایگاه داده منشأ این بحران فنی بوده است.
فرایند فنی اختلال: از دیتابیس ها تا قطع دسترسی
کلودفلر مسئول مدیریت حدود ۲۰ درصد از ترافیک کل وب در سراسر جهان است و ابزاری حیاتی به نام «Bot Management» را اجرا میکند. وظیفه این ابزار، شناسایی خزندههای وب (Web Crawlers) و جلوگیری از فعالیتهای مخرب یا استخراج غیرمجاز دادهها (Scraping) برای مقاصد مختلف از جمله آموزش مدلهای هوش مصنوعی است.
مدیرعامل کلودفلر فرآیند فنی دقیق وقوع اختلال را اینگونه توضیح میدهد:
- خطای پیکربندی: مدل یادگیری ماشینی که پشت سیستم مدیریت بات قرار دارد، به صورت مداوم یک فایل پیکربندی را برای شناسایی درخواستهای خودکار بهروزرسانی میکند.
- تغییر در رفتار دیتابیس: اما یک تغییر در رفتار درخواستهای پایگاه داده ClickHouse (که مسئول تولید این فایل پیکربندی است)، باعث شد تا تعداد زیادی ردیفهای تکراری و اضافی در فایل مذکور تولید شوند.
- فاجعه پر شدن حافظه: این فایل پیکربندی با سرعتی غیرمنتظره بزرگ شد و از محدودیت حافظه تعیینشده فراتر رفت.
- از کار افتادن پراکسی: در نتیجه، سیستم اصلی پراکسی (Proxy) که وظیفه پردازش ترافیک مشتریان را بر عهده دارد، برای هر درخواستی که به ماژول مدیریت بات وابسته بود، دچار خطا و از کار افتادگی شد.
در پی این اتفاق، شرکتهایی که از قوانین کلودفلر برای مسدود کردن باتهای مخرب استفاده میکردند، با مشکل بزرگی روبرو شدند؛ چرا که سیستم به اشتباه ترافیک واقعی کاربران را به عنوان بات شناسایی کرده و مسدود مینمود. نکته جالب توجه این است که آن دسته از مشتریان کلودفلر که از این سرویس مدیریت بات استفاده نمیکردند، در طول این حادثه همچنان آنلاین باقی ماندند.




