مفاهیم کلان داده ( Big Data )

 

کلان داده یا بیگ دیتا ( Big Data ) را می‌توان یکی از اصطلاحات پُرتکرار در حرف‌ها و نوشته‌های مربوط به فناوری اطلاعات دانست.

اگر جستجوهای مربوط به کاربرد کلان داده را در گوگل بررسی کنید، می‌‌بینید که کاربرد کلان داده در پزشکی، اقتصاد، بانکداری و نیز حسابداری و حسابرسی، صرفاً  بخش کوچکی از سوال‌ها و دغدغه‌های علاقه‌مندان این حوزه را به خود اختصاص می‌دهد.

همه‌ی ما با شنیدن بیگ دیتا یا کلان داده تا حدی می‌توانیم معنای آن را حدس بزنیم: ظاهراً به زبان ساده می‌توان گفت موضوع بیگ دیتا، به حجم زیاد داده‌ها مربوط است؛ حجمی که هر روز نیز رو به افزایش است و هر یک از ما، در هر مقیاسی که فعال باشیم، جلوه‌هایی از آن را مشاهده و تجربه کرده‌ایم.

اما اجازه بدهید برای آشنایی با یک تعریف دقیق‌تر، به سراغ موسسه گارتنر برویم و تعریف گارتنر را از بیگ دیتا بخوانیم:

تعریف کلان داده (گارتنر)

بیگ دیتا (Big Data) به معنای دارایی‌های اطلاعاتی [یک مجموعه یا سازمان] است که:

* حجم بالادارند

* باسرعت زیاد تولید می‌شوند 

* یا تنوع گسترده دارند

 

مدل 3v بیگ دیتا (Big 3V Model)

در اغلب تعریف های کلان داده، سه اصطلاح حجم (Volume) و سرعت (Velocity) و تنوع (Variety) را می‌بینید. در حدی که گاهی برای تعریف بیگ دیتا از اصطلاح 3v استفاده می‌کنند.

به عنوان مثال، شرکت PWC هم که از بزرگان مشاوره مدیریت در جهان است، بیگ دیتا را با همین 3vتعریف می‌کند.

اکثر مقالات کتابِ راهنمای کاربردهای بیگ دیتا هم همین تعریف 3v را مبنای بحث خود قرار داده‌اند.

فرانسیس باتل نیز در کتاب مدیریت ارتباط با مشتری خود، هنگامی که به بحث CRM تحلیلی می‌رسد، به سراغ همین الگوی 3v می‌رود.

شرکت ارنست اند یانگ هم در راهنمای خود برای آشنایی با کلان داده، همین تعریف را مورد اشاره قرار داده و البته برای این‌که حرف تازه‌‌ای هم زده باشد، یک V چهارم هم به آن افزوده است (V چهارم، حرف اول Veracity است و به اهمیت دقیق بودن و قابل‌اتکا بودن داده‌ها اشاره دارد).

قاعدتاً با این توضیحات، باید قانع شده باشید که الگوی 3v (یا4v) مدل رایج و شناخته‌شده‌ای برای تعریف بیگ دیتا است و اکنون می‌توانیم به سراغ تعریف دقیق‌تر این هر یک از این مولفه‌ها برویم.

 

کاربردهای کلان داده چیست؟

وقتی از بیگ دیتا صحبت می‌کنیم، بیشتر از یک وضعیت حرف می‌زنیم؛ وضعیتی که در آن حجم زیادی از داده‌ها، با سرعت زیاد و تنوع گسترده تولید می‌شوند.

اما این‌که از چنین وضعیتی چگونه می‌توان استفاده کرد، نیازمند دانش‌های دیگری استدانشمندان علوم داده‌ها (Data Scientists)، متخصصان هوش مصنوعی (Artificial Intelligence) و فعالان داده کاوی (Data-mining) از جمله کسانی هستند که می‌توانند کاربردهای Big Data را در حوزه‌های مختلف بیابند و توسعه دهند.

بنابراین با وجودی که اصطلاح کاربردهای کلان داده (‌Big Data Applications) در فارسی و انگلیسی رایج است و ما هم آن را به‌کار می‌بریم، همواره به‌خاطر داشته باشید که منظور، کاربردهای تحلیل کلان داده‌هاست؛ وگرنه حجم و تنوع داده‌ها، به خودی خود کاربردی ندارد و اگر تحلیل و پردازش مناسب روی‌ داده های حجیم انجام نشود، این داده‌ها از منظر مدیریت منابع، با سایر منابع هرز سازمانی تفاوتی نخواهند داشت.

قاعدتاً پرداختن به جزئیات این کاربردها، بحثی تخصصی بوده و فراتر از حوزه‌ی تعریف شده برای درس سواد دیجیتال است. اما شاید نکات زیر بتواند سرنخی برای جستجوهای بیشتر و مطالعات کامل‌تر شما باشد:

کاربرد Big Data چیست؟

بررسی چند نمونه ساده از جمله کاربردهای بیگ دیتا در زندگی روزمره می‌توان به سرویس های مسیریابی مانند Waze و بخش Navigation در Google Map اشاره کرد. حجم قابل توجهی از داده‌های مربوط به وسایل نقلیه‌ی در حال حرکت (در واقع: موبایل‌های در حال حرکت) به صورت پیوسته و در لحظه، پردازش می‌شوند و مسیرهای مناسب بر اساس مقصد تعیین شده و ترجیحات کاربران به آن‌ها پیشنهاد می‌شود.

در بحثمدیریت ارتباط با مشتری هم، CRM تحلیلی یکی از حوزه‌هایی است که کاربرد کلان داده در آن کاملاً مشخص است و مرور درس CRM تحلیلی می‌تواند در این زمینه کمی به شما دید بدهد.

اگر با بخش بندی بازار و بررسی رفتار مشتریان هم آشنا باشید، بی‌تردید می‌توانید تصور کنید که تحلیل بیگ دیتا چقدر می‌تواند مفید باشد و در این زمینه به کمک تصمیم‌گیران بیاید.

اگر با بحث شخصی سازی (Personalization ) هم آشنا باشید، می‌توانید حدس بزنید که تحلیل داده‌ها در حجم بالا، چگونه می‌تواند به برنامه ریزی برای شخصی سازی خدمات کمک کند.

البته شخصی سازی خدمات، حتی بدون تحلیل کلان داده هم امکان‌پذیر است. اما وقتی گزینه‌های پیش روی شما زیاد و منابع‌تان محدود باشد، طبیعی است که شخصی سازی بر اساس تحلیل بیگ دیتا می‌تواند اثربخش‌ترین گزینه‌ها را (در مقایسه با هزینه‌ی هر گزینه) برای شما تخمین زده و برآورد کند.

سیستم های توصیه گر (recommendation engine) هم از جمله کاربردهای کلان داده ها در کسب و کارهای دیجیتال هستند و استفاده از Big Data در این زمینه، نتایج محسوس و ملموسی به همراه داشته است.

یکی از حوزه‌هایی که همواره در بحث بیگ دیتا مورد توجه بوده، حوزه پزشکی است.

علل مختلفی را برای این مسئله می‌توان ذکر کرد:

* اطلاعات عددی گسترده و متنوعی که می‌توان از بیماران به دست آورد (در مقایسه با حوزه‌‌های کیفی)

* میل انسان‌ها به همکاری در حوزه‌ی سلامت (با این فرض که می‌تواند برایشان دستاوردهای مفید داشته باشد)

* اپلیکیشن‌ها و ابزارهای متعددی که امروزه در حوزه‌ی سلامت استفاده می‌شوند و داده‌های فراوانی که تولید می‌کنند (فقط کافی است به سنسور شتاب‌سنج موبایل خود فکر کنید که در بخش زیادی از روز، حرکت‌های شما را ثبت می‌کند)

اما در بررسی کاربرد بیگ دیتا در پزشکی، مهم است که حوزه‌های مختلف را از یکدیگر تفکیک کنیم. مثلاً شاخه‌ی پیش بینی از جمله حوزه‌هایی است که امید نسبتاً بیشتری به‌ آن وجود دارد و پیشرفت‌های جالب‌توجهی هم داشته است (شاید پروژه‌ی Google Flu را بشناسید که هدف آن، پیش‌بینی آمار و روند شیوع آنفولانزا در نقاط مختلف، بر اساس میزان جستجوی کاربران بود).

شاخه‌ی عارضه‌یابی و Diagnose، دومین حوزه‌ای است که رشد محسوسی داشته است و امکان پردازش حجم زیاد تصاویری که از بیماران ثبت می‌شود، این امید را ایجاد کرده که بتوان در آینده فرصت‌های ارزشمندی برای عارضه‌یابی خلق کرد.

حوزه‌ی درمان و تصمیم گیری‌های مربوط به آن، دشوارترین شاخه است و هنوز، باید زمان زیادی منتظر بمانیم تا دستاوردهای محسوس آن را مشاهده و تجربه کنیم.

اگر علاقه‌مند به مطالعه‌ی بیشتر در زمینه کاربرد کلان داده در پزشکی و به‌طور کلی حوزه‌ی سلامت هستید، دو مقاله‌ی زیر می‌توانند نقطه‌ی شروع مناسبی باشند:

فایل اول توسط مک کنزی تهیه شده و کمی عمومی‌تر است. فایل دوم، بیشتر از نظر منابعی که معرفی کرده مفید است. اغلب رفرنس‌های معرفی شده، مطالب مفید و آموزنده و ساده‌ای دارند. البته طبیعی است هر دو فایل با در نظر گرفتن مخاطب مبتدی معرفی کرده‌ایم و اگر قصد داشته باشید به شکل تخصصی در این حوزه مطالعه کنید، باید به سراغ ژورنال‌های تخصصی‌ بروید.

 سئو هم حوزه‌ی دیگری است که به صورت گسترده از تحلیل Big Data استفاده کرده و نتایج آن را نیز همه‌ی ما تجربه کرده‌ایم.

در تاریخچه سئو اشاره کردیم که عبور از دوران تکیه‌ی صِرف بر تحلیل کلمات کلیدی و رسیدن به الگوریتم های تحلیل رفتاری، باعث شده که روش‌های سنتی سئوی کلاه سیاه دیگر به سادگی اثربخش نباشند. بخش مهمی از این دستاورد را باید به توانایی تحلیل رفتار کاربران در مقیاس گسترده نسبت داد.

این روزها اگر هم سایت‌ها بتوانند با تکنیک‌های سیاه، جایی در رتبه‌های برتر نتایج جستجو به دست بیاورند، موتورهای جستجو (خصوصاً گوگل) به سرعت پس از فرستادن بازدیدکنندگان به این صفحات و بررسی رفتار آن‌ها، نامناسب بودن و کیفیت پایین این صفحات را ترجیح داده و نتایج خود را اصلاح می‌کنند.

شرکت توسعه ارتباطات مانترا ( مانتراتلکام)  با همکاری شرکای داخلی وخارجی خود و با هدف خدمت رسانی و سرمایه گذاری در صنعت مخابرات، فنآوری اطلاعات و ارتباطات کشور به عنوان مجموعه ای منعطف، بهره ور، ریسک پذیر و متخصص با ایجاد هم افزایی درون گروهی در ارائه راهکارهای جامع استقرار و توسعه شبکه‌های مخابراتی، مدیریت و اجرای پروژه‌های نصب، راه‌اندازی و بهره‌برداری و نیز با بکارگیری فنآوری نوین و به روز، توانسته است مقتدرانه به سوی اهداف متعالی خود که همان ارتقای صنعت فنآوری اطلاعات و ارتباطات کشور است گام بردارد. مانتراتلکام مصمم است با تولید، انتقال و مدیریت فنآوری در مسیر رفع نیازها و ارتقای صنعت ارتباطات و اطلاعات کشور پیشتاز باشد و بر این اساس در افق پنج ساله خود بر توسعه خدمات متمرکز خواهد بود.  خدمات مبتنی برذخیره سازی داده و هوش مصنوعی دو حوزه برجسته ای است که این شرکت در نظر دارد سرمایه گذاری های گسترده ای را در آن انجام دهد.