Big Data چیست؟
Big data مفهوم جدیدی است که به مجموعه ای از داده ها اشاره دارد که سایز و مقدار آنها فراتر از نرم افزارهای معمولی روزانه مورد استفاده است و اساسا توسط همین نرم افزارها ایجاد و تولید و مدیریت می شوند و سپس وارد مرحله ذخیره سازی می گردند. این نوع از داده ها شامل هر دونوع داده ی ساخت سافته و غیر ساخت یافته هستند و از منابع مختلفی مانند تراکنش های نرم افزارهای تجاری و مالی ، صفحات وب ، ویدئوها ، تصاویر ، email ها ، رسانه های اجتماعی و نظایر آن تولید می شوند. این مجموعه عظیم از داده ها اساسا نیاز به ذخیره سازی ، آپدیت ، آنالیز، مدل سازی و تصمیم گیری های هوشمند آنی دارند.
اکوسیستم Big Data شامل موارد زیر است :
- دستگاه هایی که داده ها را از چندین مکان جمع آوری کرده و همچنین داده هایی جدید از این داده های جمع آوری شده می سازد.
- جمع کننده های داده یا data collector که داده ها را از دستگاه و یوزرها می گیرند.
- تجمیع کننده های داده که کامپایل داده ی جمع شد را برعهده دارند و خروجی آنها اطلاعات قابل فهم است
- یوزرها و خریداران ای که از اطلاعات جمع شده ، زنجیره ای از اطلاعات پر ارزش را بدست می آورند.
شکل زیر اکوسیستم big data را نشان می دهد.

اکوسیستم big data
سیستم های قدیمی IT و ابزارهای پردازش داده و متدولوژی های سنتی توانایی مدیریت volume ها ، داینامیک بودن و پیچیدگی و تنوع Big data را ندارد . آنالیز Big data نیاز به آنی بودن دارد و این آنی بودن آنالیز، خود نیازمند تکنولوژی های جدید، ساختار و ابزار جدید ، برای ایجاد راندمان بالا و پردازش موازی حجیم یا MPP که سر واژه ی massively parallel processing است ، پلت فرم های داده ای و آنالیزهای پیشرفته ی مجموعه های داده است.
علم دیتای امروزی را می توان سنتز چندین رشته اعم از آمار، ریاضی، مجازی سازی، علوم کامپیوتر دانست که خود علوم کامپیوتر در جهت توسعه الگوریتم های پیشرفته برای آنالیز مقادیر حجیم اطلاعات گام بر می دارد.
بسیاری از صنایع ، تجارت ها و خدمات نیازمند توسعه این علم نوظهور هستند من جمله بهداشت و درمان، صنایع نظامی، بانک ها، رسانه های اجتماعی، بیمه ها و مواردی از این قبیل.
دیدگاهتان را بنویسید