مفاهیم کلان داده ( Big Data )
کلان داده یا بیگ دیتا ( Big Data ) را میتوان یکی از اصطلاحات پُرتکرار در حرفها و نوشتههای مربوط به فناوری اطلاعات دانست.
اگر جستجوهای مربوط به کاربرد کلان داده را در گوگل بررسی کنید، میبینید که کاربرد کلان داده در پزشکی، اقتصاد، بانکداری و نیز حسابداری و حسابرسی، صرفاً بخش کوچکی از سوالها و دغدغههای علاقهمندان این حوزه را به خود اختصاص میدهد.
همهی ما با شنیدن بیگ دیتا یا کلان داده تا حدی میتوانیم معنای آن را حدس بزنیم: ظاهراً به زبان ساده میتوان گفت موضوع بیگ دیتا، به حجم زیاد دادهها مربوط است؛ حجمی که هر روز نیز رو به افزایش است و هر یک از ما، در هر مقیاسی که فعال باشیم، جلوههایی از آن را مشاهده و تجربه کردهایم.
اما اجازه بدهید برای آشنایی با یک تعریف دقیقتر، به سراغ موسسه گارتنر برویم و تعریف گارتنر را از بیگ دیتا بخوانیم:
تعریف کلان داده (گارتنر)
بیگ دیتا (Big Data) به معنای داراییهای اطلاعاتی [یک مجموعه یا سازمان] است که:
* حجم بالادارند
* باسرعت زیاد تولید میشوند
* یا تنوع گسترده دارند

مدل 3v بیگ دیتا (Big 3V Model)
در اغلب تعریف های کلان داده، سه اصطلاح حجم (Volume) و سرعت (Velocity) و تنوع (Variety) را میبینید. در حدی که گاهی برای تعریف بیگ دیتا از اصطلاح 3v استفاده میکنند.
به عنوان مثال، شرکت PWC هم که از بزرگان مشاوره مدیریت در جهان است، بیگ دیتا را با همین 3vتعریف میکند.
اکثر مقالات کتابِ راهنمای کاربردهای بیگ دیتا هم همین تعریف 3v را مبنای بحث خود قرار دادهاند.
فرانسیس باتل نیز در کتاب مدیریت ارتباط با مشتری خود، هنگامی که به بحث CRM تحلیلی میرسد، به سراغ همین الگوی 3v میرود.
شرکت ارنست اند یانگ هم در راهنمای خود برای آشنایی با کلان داده، همین تعریف را مورد اشاره قرار داده و البته برای اینکه حرف تازهای هم زده باشد، یک V چهارم هم به آن افزوده است (V چهارم، حرف اول Veracity است و به اهمیت دقیق بودن و قابلاتکا بودن دادهها اشاره دارد).
قاعدتاً با این توضیحات، باید قانع شده باشید که الگوی 3v (یا4v) مدل رایج و شناختهشدهای برای تعریف بیگ دیتا است و اکنون میتوانیم به سراغ تعریف دقیقتر این هر یک از این مولفهها برویم.

کاربردهای کلان داده چیست؟
وقتی از بیگ دیتا صحبت میکنیم، بیشتر از یک وضعیت حرف میزنیم؛ وضعیتی که در آن حجم زیادی از دادهها، با سرعت زیاد و تنوع گسترده تولید میشوند.
اما اینکه از چنین وضعیتی چگونه میتوان استفاده کرد، نیازمند دانشهای دیگری است. دانشمندان علوم دادهها (Data Scientists)، متخصصان هوش مصنوعی (Artificial Intelligence) و فعالان داده کاوی (Data-mining) از جمله کسانی هستند که میتوانند کاربردهای Big Data را در حوزههای مختلف بیابند و توسعه دهند.
بنابراین با وجودی که اصطلاح کاربردهای کلان داده (Big Data Applications) در فارسی و انگلیسی رایج است و ما هم آن را بهکار میبریم، همواره بهخاطر داشته باشید که منظور، کاربردهای تحلیل کلان دادههاست؛ وگرنه حجم و تنوع دادهها، به خودی خود کاربردی ندارد و اگر تحلیل و پردازش مناسب روی داده های حجیم انجام نشود، این دادهها از منظر مدیریت منابع، با سایر منابع هرز سازمانی تفاوتی نخواهند داشت.
قاعدتاً پرداختن به جزئیات این کاربردها، بحثی تخصصی بوده و فراتر از حوزهی تعریف شده برای درس سواد دیجیتال است. اما شاید نکات زیر بتواند سرنخی برای جستجوهای بیشتر و مطالعات کاملتر شما باشد:
کاربرد Big Data چیست؟
بررسی چند نمونه ساده از جمله کاربردهای بیگ دیتا در زندگی روزمره میتوان به سرویس های مسیریابی مانند Waze و بخش Navigation در Google Map اشاره کرد. حجم قابل توجهی از دادههای مربوط به وسایل نقلیهی در حال حرکت (در واقع: موبایلهای در حال حرکت) به صورت پیوسته و در لحظه، پردازش میشوند و مسیرهای مناسب بر اساس مقصد تعیین شده و ترجیحات کاربران به آنها پیشنهاد میشود.
در بحثمدیریت ارتباط با مشتری هم، CRM تحلیلی یکی از حوزههایی است که کاربرد کلان داده در آن کاملاً مشخص است و مرور درس CRM تحلیلی میتواند در این زمینه کمی به شما دید بدهد.
اگر با بخش بندی بازار و بررسی رفتار مشتریان هم آشنا باشید، بیتردید میتوانید تصور کنید که تحلیل بیگ دیتا چقدر میتواند مفید باشد و در این زمینه به کمک تصمیمگیران بیاید.
اگر با بحث شخصی سازی (Personalization ) هم آشنا باشید، میتوانید حدس بزنید که تحلیل دادهها در حجم بالا، چگونه میتواند به برنامه ریزی برای شخصی سازی خدمات کمک کند.
البته شخصی سازی خدمات، حتی بدون تحلیل کلان داده هم امکانپذیر است. اما وقتی گزینههای پیش روی شما زیاد و منابعتان محدود باشد، طبیعی است که شخصی سازی بر اساس تحلیل بیگ دیتا میتواند اثربخشترین گزینهها را (در مقایسه با هزینهی هر گزینه) برای شما تخمین زده و برآورد کند.
سیستم های توصیه گر (recommendation engine) هم از جمله کاربردهای کلان داده ها در کسب و کارهای دیجیتال هستند و استفاده از Big Data در این زمینه، نتایج محسوس و ملموسی به همراه داشته است.
یکی از حوزههایی که همواره در بحث بیگ دیتا مورد توجه بوده، حوزه پزشکی است.
علل مختلفی را برای این مسئله میتوان ذکر کرد:
* اطلاعات عددی گسترده و متنوعی که میتوان از بیماران به دست آورد (در مقایسه با حوزههای کیفی)
* میل انسانها به همکاری در حوزهی سلامت (با این فرض که میتواند برایشان دستاوردهای مفید داشته باشد)
* اپلیکیشنها و ابزارهای متعددی که امروزه در حوزهی سلامت استفاده میشوند و دادههای فراوانی که تولید میکنند (فقط کافی است به سنسور شتابسنج موبایل خود فکر کنید که در بخش زیادی از روز، حرکتهای شما را ثبت میکند)
اما در بررسی کاربرد بیگ دیتا در پزشکی، مهم است که حوزههای مختلف را از یکدیگر تفکیک کنیم. مثلاً شاخهی پیش بینی از جمله حوزههایی است که امید نسبتاً بیشتری به آن وجود دارد و پیشرفتهای جالبتوجهی هم داشته است (شاید پروژهی Google Flu را بشناسید که هدف آن، پیشبینی آمار و روند شیوع آنفولانزا در نقاط مختلف، بر اساس میزان جستجوی کاربران بود).
شاخهی عارضهیابی و Diagnose، دومین حوزهای است که رشد محسوسی داشته است و امکان پردازش حجم زیاد تصاویری که از بیماران ثبت میشود، این امید را ایجاد کرده که بتوان در آینده فرصتهای ارزشمندی برای عارضهیابی خلق کرد.
حوزهی درمان و تصمیم گیریهای مربوط به آن، دشوارترین شاخه است و هنوز، باید زمان زیادی منتظر بمانیم تا دستاوردهای محسوس آن را مشاهده و تجربه کنیم.
اگر علاقهمند به مطالعهی بیشتر در زمینه کاربرد کلان داده در پزشکی و بهطور کلی حوزهی سلامت هستید، دو مقالهی زیر میتوانند نقطهی شروع مناسبی باشند:
فایل اول توسط مک کنزی تهیه شده و کمی عمومیتر است. فایل دوم، بیشتر از نظر منابعی که معرفی کرده مفید است. اغلب رفرنسهای معرفی شده، مطالب مفید و آموزنده و سادهای دارند. البته طبیعی است هر دو فایل با در نظر گرفتن مخاطب مبتدی معرفی کردهایم و اگر قصد داشته باشید به شکل تخصصی در این حوزه مطالعه کنید، باید به سراغ ژورنالهای تخصصی بروید.
سئو هم حوزهی دیگری است که به صورت گسترده از تحلیل Big Data استفاده کرده و نتایج آن را نیز همهی ما تجربه کردهایم.
در تاریخچه سئو اشاره کردیم که عبور از دوران تکیهی صِرف بر تحلیل کلمات کلیدی و رسیدن به الگوریتم های تحلیل رفتاری، باعث شده که روشهای سنتی سئوی کلاه سیاه دیگر به سادگی اثربخش نباشند. بخش مهمی از این دستاورد را باید به توانایی تحلیل رفتار کاربران در مقیاس گسترده نسبت داد.
این روزها اگر هم سایتها بتوانند با تکنیکهای سیاه، جایی در رتبههای برتر نتایج جستجو به دست بیاورند، موتورهای جستجو (خصوصاً گوگل) به سرعت پس از فرستادن بازدیدکنندگان به این صفحات و بررسی رفتار آنها، نامناسب بودن و کیفیت پایین این صفحات را ترجیح داده و نتایج خود را اصلاح میکنند.
شرکت توسعه ارتباطات مانترا ( مانتراتلکام) با همکاری شرکای داخلی وخارجی خود و با هدف خدمت رسانی و سرمایه گذاری در صنعت مخابرات، فنآوری اطلاعات و ارتباطات کشور به عنوان مجموعه ای منعطف، بهره ور، ریسک پذیر و متخصص با ایجاد هم افزایی درون گروهی در ارائه راهکارهای جامع استقرار و توسعه شبکههای مخابراتی، مدیریت و اجرای پروژههای نصب، راهاندازی و بهرهبرداری و نیز با بکارگیری فنآوری نوین و به روز، توانسته است مقتدرانه به سوی اهداف متعالی خود که همان ارتقای صنعت فنآوری اطلاعات و ارتباطات کشور است گام بردارد. مانتراتلکام مصمم است با تولید، انتقال و مدیریت فنآوری در مسیر رفع نیازها و ارتقای صنعت ارتباطات و اطلاعات کشور پیشتاز باشد و بر این اساس در افق پنج ساله خود بر توسعه خدمات متمرکز خواهد بود. خدمات مبتنی برذخیره سازی داده و هوش مصنوعی دو حوزه برجسته ای است که این شرکت در نظر دارد سرمایه گذاری های گسترده ای را در آن انجام دهد.