خبرتکنولوژی

علت قطعی جهانی X و ChatGPT مشخص شد

توضیح مشکل توسط کلودفلر

علت قطعی جهانی X و ChatGPT مشخص شد؛ توضیح مشکل توسط کلودفلر

روز گذشته، بخش‌های گسترده‌ای از اینترنت جهان تحت تأثیر مشکلات داخلی شرکت کلودفلر (Cloudflare) قرار گرفت. سرویس‌های محبوبی مانند هوش مصنوعی ChatGPT، شبکه اجتماعی ایکس (X) و حتی وب‌سایت Downdetector (که وظیفه گزارش قطعی‌ها را برعهده دارد) از دسترس خارج شدند و کاربران بسیاری را دچار سردرگمی کردند. اکنون، کلودفلر با انتشار بیانیه‌ای رسمی، شرح کاملی از دلایل فنی این اختلال را ارائه داده است.

متیو پرینس (Matthew Prince)، هم‌بنیان‌گذار و مدیرعامل کلودفلر، در یک پست وبلاگی رسمی، جزئیات فنی وقوع این حادثه را منتشر کرد. برخلاف گمانه‌زنی‌های اولیه مبنی بر حمله سایبری گسترده، دلیل اصلی این اختلال، یک خطای داخلی در سیستم مدیریت بات (Bot Management) کلودفلر بود که در نهایت منجر به پر شدن حافظه سیستم و از کار افتادن سیستم‌های پردازش ترافیک مشتریان شد. متیو پرینس به صراحت اعلام کرد که این حادثه نه حمله سایبری، نه مشکل DNS و نه یک حمله انکار سرویس توزیع‌شده (DDoS) در مقیاس بزرگ بود، بلکه یک تغییر در سیستم مجوزهای پایگاه داده منشأ این بحران فنی بوده است.

فرایند فنی اختلال: از دیتابیس ها تا قطع دسترسی

کلودفلر مسئول مدیریت حدود ۲۰ درصد از ترافیک کل وب در سراسر جهان است و ابزاری حیاتی به نام «Bot Management» را اجرا می‌کند. وظیفه این ابزار، شناسایی خزنده‌های وب (Web Crawlers) و جلوگیری از فعالیت‌های مخرب یا استخراج غیرمجاز داده‌ها (Scraping) برای مقاصد مختلف از جمله آموزش مدل‌های هوش مصنوعی است.

مدیرعامل کلودفلر فرآیند فنی دقیق وقوع اختلال را این‌گونه توضیح می‌دهد:

  1. خطای پیکربندی: مدل یادگیری ماشینی که پشت سیستم مدیریت بات قرار دارد، به صورت مداوم یک فایل پیکربندی را برای شناسایی درخواست‌های خودکار به‌روزرسانی می‌کند.
  2. تغییر در رفتار دیتابیس: اما یک تغییر در رفتار درخواست‌های پایگاه داده ClickHouse (که مسئول تولید این فایل پیکربندی است)، باعث شد تا تعداد زیادی ردیف‌های تکراری و اضافی در فایل مذکور تولید شوند.
  3. فاجعه پر شدن حافظه: این فایل پیکربندی با سرعتی غیرمنتظره بزرگ شد و از محدودیت حافظه تعیین‌شده فراتر رفت.
  4. از کار افتادن پراکسی: در نتیجه، سیستم اصلی پراکسی (Proxy) که وظیفه پردازش ترافیک مشتریان را بر عهده دارد، برای هر درخواستی که به ماژول مدیریت بات وابسته بود، دچار خطا و از کار افتادگی شد.

در پی این اتفاق، شرکت‌هایی که از قوانین کلودفلر برای مسدود کردن بات‌های مخرب استفاده می‌کردند، با مشکل بزرگی روبرو شدند؛ چرا که سیستم به اشتباه ترافیک واقعی کاربران را به عنوان بات شناسایی کرده و مسدود می‌نمود. نکته جالب توجه این است که آن دسته از مشتریان کلودفلر که از این سرویس مدیریت بات استفاده نمی‌کردند، در طول این حادثه همچنان آنلاین باقی ماندند.

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا