تاریخچه بیگ دیتا
هفتادسال گذشته است از انفجار اطلاعات و اولین تلاش برای تعیین نرخ رشد دادهها. فرمونت رایدر در سال ۱۹۹۴ آینده کتابخانههای آمریکایی را پیش بینی کرد. او بیان کرد هر ۱۶ سال یکبار حجم کتابهای موجود در کتابخانه دو برابر میشوند. این موضوع باعث ایجاد فکری شد که سرنوشت اطلاعات بسیار زیاد بشر را تغییر داد.
این فکر، برخواسته از احساس نیاز بود. نیاز به منبعی برای نگهداری حجم بسیار زیاد اطلاعات و دادهها.
سال ۱۹۶۷ دکتر مین در مقالهای با عنوان فشردهسازی خودکار دادهها به انفجار اطلاعات اشاره کرد. او پس از بررسی بیان کرد باید دادهها را در کمترین فضای ممکن ذخیره کرد. در سال ۱۹۷۵ وزارت پست و مخابرات در ژاپن اطلاعات را سرشماری کرد. بعد از این سرشماری متوجه شدند عرضه اطلاعات بیش از تقاضای آن است.
همچنین در تحقیق دیگری در سال ۱۹۸۱، سازمان مرکزی آمار مجارستان پروژه تحقیقاتی متفاوتی را شروع کرد که در آن حجم زیادی از اطلاعات که در یک بیت قرار داشت بررسی شد.
بعد از تمام اینها تغییرات بسیار زیادی رخ داد تا اینکه علم بیگ دیتا به جایگاه امروز خودش رسید.
بیگ دیتا چیست؟
آشناترین تعریفی که از این مفهوم وجود دارد، این است که بیگ دیتا مجموعهای از دادههای بزرگ است که میتوانند برای درک و پردازش الگوها و رفتارهای انسانی، توسط کامپیوتر مورد محاسبه و پردازش قرار بگیرند. اما این جمله چه معنایی دارد؟
شاید بهتر باشد برای درک بهتر این مفهوم، کمی سادهتر با ذکر یک مثال با آن آشنا شویم.
همانطور که از اسم آن پیداست، این ترکیب به معنیِ حجم زیادی از اطلاعات است که میتواند از منابع متفاوتی دریافت شده باشد.
آیا صرفا انباشت اطلاعات و ذخیره حجم زیادی از آن سودمند است؟ قطعا پاسخ منفی است. کاربرد بسیار مهمی که جمع آوری این اطلاعات دارد، دستیابی کسب و کار به نتایج درخشان است.
به عنوان مثال، شما اگر صاحب سایت فروش آنلاین هستید، میتوانید از اطلاعات ظاهرا بیارزش مشتریان نتایج ارزشمند استخراج کنید. اطلاعات رفتاری مشتریان شما در سایت فروش آنلاین، کمک کننده است. با بررسی بیگ دیتاها متوجه میشوید چه پیشنهاداتی میتوانید برای مشتریان خود داشته باشید.
در این مثال، از این طریق میتوان فهمید کدام محصول متقاضی بیشتری دارد. و نتایج بهتری حاصل کرد.
ویژگیهای بیگ دیتا
داراییهای اطلاعاتی در یک شرکت یا سازمان، دارای دو ویژگی مهم است.
- حجم بالا دارند
- با سرعت زیاد تولید میشوند و تنوع گسترده دارند.
فراموش نکنیم که این حجم زیاد از اطلاعات نیازمند شیوههای پردازش نوآورانه با هزینهی مناسب است تا بتوان از آن برای اتوماسیون فرایندها، تصمیمگیری، بهبود نگرش و بینش در سازمان استفاده کرد.
بیگ دیتا چه ویژگیهایی داره؟
پنج ویژگی مهم بیگ دیتا
1- مقدار (Volume) به مقدار و اندازه دادههای تولید شده، گردآوری شده و ذخیره شده که در حجم زیاد تلقی شود که باعث کاهش هزینه شود.
2- گوناگونی Variety گوناگونی دادهها به شکل عددی، اطلاعات سنتی، صدا و ایمیلی و است که میتواند در دسته بندی مالی، اقتصادی و مدریتی و … نیز قرار گیرد.
این تنوع داده ها به تحلیلگران کمک لازم را می کند که با استفاده مناسب نتیجه هدفمندی داشته باشند.
3- سرعتVelocity در مورد این ویژگی باید گفت، سرعت تولید و پردازش دادهها در راستای برآورده کردن خواستهها و چالشهای پیش رو که در مسیر توسعه و رشد قرار دارند.
سرعت دادههای تولید شده در سال 2010 به میزان تمامی اطلاعاتی بود که تا سال 2003 تولید شده بود! رویارویی با چنین حجم اطلاعاتی که روزافزون به طور سرسام آور تولید و ذخیره میشود برای تمام سازمانها و تحلیلگران به چالشی بزرگ تبدیل شده است.
4- تغییر پذیریVariability یکی از مشکلاتی که در مواجه با بیگ دیتا از اهمیت زیادی برخوردار است. تغییرات در دادههای ورودی است، به این معنی که هرگونه تغییر داده باعث عدم تطابق و ناپایداری داده میشود و هرچه این ناپایداری دادهها بیشتر باشد کنترل و مدیریت آن دشوارتر میشود.
5- اطمینان Veracity کیفیت دادههای ذخیره شده میتواند به قدری متفاوت باشد که تاثیر شدیدی بر تحلیل دقیق بگذارد.
وضعیت بیگ دیتا در ایران و جهان چگونه است؟
در ایران نیز از آنالیز بیگ دیتا استفاده میشود. برای مثال بانک آینده یا شرکت نفت ایران از این علم برای بهبود کار خود استفاده کردهاند! با این حال فاصله بین صنعت و دانشگاه بسیار زیاد است. بیشتر سازمانها مشکلاتی در جمع آوری و نگهداری از دادهها را دارند. به همین دلیل این حوزهها در آیندهای نزدیک رشد قابل توجهی خواهند داشت. با این حال اکثر دانشگاهیان به علم تحلیل دادهها علاقه دارند. در حالی که اگر دادهی ارزشمند و مناسب وجود نداشته باشد چیزی برای تحلیل نیز وجود نخواهد داشت. با این تفاسیر رفته رفته شاهد آینده روشن بیگ دیتا در ایران خواهیم بود.
ما در عصر اطلاعات زندگی میکنیم. در این دوره کسانی که از اطلاعات بیشتری برخوردارند یا میتوانند به خوبی از دادهها یا اطلاعات استفاده کنند پیروز هستند. باید گفت که بیگ دیتا در هر زمینهای میتواند مفید بوده و به بازدهی بیشتر در تمام سازمانها کمک کند. وضعیت بیگ دیتا در سایر نقاط جهان از ایران بهتر است و در بسیاری از سازمانها از کلان داده برای توسعه، افزایش کارایی، پیشبینی و به طور کلی بهبود زندگی انسان استفاده میکنند.
در آخر…
صحبت از این علم، نقطهی پایانی ندارد. زیرا که دادهها به سرعت در حال رشد هستند.
با توجه به اینکه دادههای بسیار زیادی وجود دارد و این دادهها به سرعت در حال رشد هستند، برای بهبود انجام کار در سازمانها و تصمیمگیریهای بهتر باید از کلان داده استفاده کرد. به همین دلیل امروزه علم آنالیز کلان داده بسیار مهم است. البته این علم زمینههای مختلفی دارد.