تجسم داده یا Data visualization یکی از فرایندهای کاربردی علم داده است که بخشی از سیستم معماری داده نیز به شمار میآید. تجسم یا بصریسازی داده، شیوهای برای تبدیل کردن دیتا در قالب اولیه مختلف عددی و متنی و تصویری به یک تصویر گرافیکی قابل تشخیص و ساده است. در این شیوه با استفاده از نمودار، نقشه و هرگونه تصویر دیگر یک داستان یا فرایند معنادار نشان داده میشود. تمام کسبوکارها و سازمانها از این شیوه به مقاصد گوناگونی استفاده میکنند.
میتوان این تجسم را به زبان ساده نمایش تصویری دادهها در راستای رسیدن به بینش دانست. در این تصویر الگوها، روندها و نتایج آنالیز دادهها نشان داده میشود تا در مراحل بعد تصمیمهایی مبتنی بر داده اتخاذ شوند. رمزگشایی دادهها با پیچیدگیهای فراوانی مواجه است. حجم بالای داده نیز معمولاً این پیچیدگی را سختتر میکند. ابزار مختلف هوش تجاری به تجسم داده کمک میکنند تا نتیجه آنالیز این مجموعههای گسترده آماری به صورت نمودارهای مختلف با تنوع رنگی و کاملاً بصری قابل تشخیص باشند.
انواع تجسم داده
دادهها آمار ورودی به یک سیستم هستند که لازم است پردازش و تبدیل به سرنخهایی قابل درک و مشاهده شوند.
بصریسازی داده در دو نوع است: اکتشافی و توضیحی. همانطور که از نامگذاری این دو دسته درک میشود، در روش اکتشافی معنا و مفهوم نهفته در دادهها کشف میشود و در روش توضیحی، آنچه که از بطن دادهها درک شده به دیگران منتقل میشود.
تجسم اکتشافی: زمانی که آنالیز یا تجزیه و تحلیل دادهها انجام شود، میتوان به الگوها، روندها یا ناهنجاریها و موارد مختلف دیگر دست یافت. در این مرحله اطلاعاتی به دست میآید یا به اصطلاح کشف میشود. این اطلاعات در بهبود شرایط و یافتن راهحل برای مشکلات کارساز خواهند بود.
تجسم توضیحی: پس از آنالیز دادهها و به دست آوردن اطلاعات کافی در مورد آنها زمان آن میرسد که این مفاهیم یا بینش با دیگران به اشتراک گذاشته شود. یک سمت خود دادهها قرار دارند که معمولاً با حجم بالا و پیچیدگی زیادی همراه هستند و سمت دیگر این اشتراکگذاری ممکن است اعضای گروه، سهامداران و ذینفعان کسبوکار، مخاطب عمومی یا افراد متخصص باشند. در هر صورت باید مفاهیم استخراجشده از دادهها به یک شکل بصری و قابل تشخیص در اختیار دیگران قرار گیرد.
مدلهای تجسم داده
به تصویر درآوردن دادهها در اولین مراحل تکامل و بلوغ خود اغلب در مایکروسافت اکسل و به صورت جدول، نمودار میلهای یا نمودر دایرهای بود که دادهها را به اطلاعات قابل فهم تصویری تبدیل میکرد. این روش همچنان در حال استفاده است اما برای دادههای کلان و پیچیده از روشهای بهتری استفاده میشود. در بصریسازی دادهها معمولاً اینفوگرافی، نمودار گلولهای، نقشه حرارتی، نمودار سری زمانی، نمودار خطی، نمودار درختی، نمودار مساحتی و ابرهای حبابی موارد آشناتری هستند اما در مجموع میتوان مدلهای مختلف بصریسازی را به چند دسته تقسیم کرد.
- نمودارها شامل انواع نمودارهای میلهای، خطی، دایرهای و موارد دیگر
- گرافها شامل نمودارهای پراکنده، هیستوگرام و موارد دیگر
- نقشهها شامل نقشههای جغرافیایی، نقشههای حرارتی و موارد دیگر
- داشبوردها به صورت پلتفرمهای تعاملی برای ترکیب تصویرسازیهای متعدد با یکدیگر
اهمیت مصورسازی داده
تجسم داده مثل ترجمه و برگردان مفاهیم و اطلاعات مهمی است که از تجزیه و تحلیل دادهها به دست آمده است. تجزیه و تحلیل داده به درک داده کمک میکند و بصریسازی به سادهسازی و انتقال مفاهیم تخصصی و پیچیده به افراد دیگر کمک میکند. این بصریسازی ممکن است در موارد متعددی کاربرد داشته باشد، از انتقال آمار و محاسبات عددی گرفته تا مراحل تجویز و تشخیص تخصصی پزشکی را تحت پوشش خود قرار میدهد.
بصریسازی داده در آمار و یادگیری ماشین که از مهمترین کاربردهای هوش تجاری است، استفاده میشود. دادهها به کمک ابزار مختلف تبدیل به نمودارهایی میشوند که با یک نگاه میتوان اطلاعات کلی آن را دریافت کرد و موارد مورد نظر برای بررسی به راحتی در آنها شناسایی میشوند و درک کیفی از وضعیت دادهها به وجود میآید. شناسایی الگوها، دادههای نامربوط و خراب، عناصر غیرضروری و … به کمک به تصویر درآمدن دادهها انجام میشود. در تجسم داده ضمن مستندسازی دادههای بهدستآمده از فعالیتهای سازمانی و اجرایی، نحوه جرایان دادهها نیز ترسیم میشوند و طرحی اولیه برای مدیریت دادهها نیز به تصویر در میآید.
تجسم داده در تجزیه و تحلیل دادههای پیشرفته نقش مهمی ایفا میکند. مثلاً در نوشتن الگوریتمهای آنالیز پیشگویانه میتوان به کمک تجسم خروجیها هم بر نتایج نظارت داشت و هم از درستی عملکرد مدلهای مورد نظر نیز اطمینان حاصل کرد.
موارد استفاده مصورسازی داده
بصریسازی راهکارهای سریع و مؤثری جهت برقراری ارتباط و تشخیص عوامل مختلف در بین دادهها را فراهم میکند.
- ارزیابی تغییرات در طور زمان: در ارزیابی فراوانی رویدادها در یک مدت مشخص کاربرد دارد و از هیستوگرام استفاده میشود.
- تعیین تکرارها: در شناخت فراوانی یک رویداد خاص در طول زمان از این روش استفاده میشود.
- تشخیص ارتباط بین ویژگیها و متغیرها: در شناسایی ویژگیها میتوان از نمودار نقطهای استفاده کرد.
- ارزیابی شبکهها: برای بررسی یک شبکه مشخص مثل پایگاه مشتریان استفاده میشود تا ارتباطات معنادار در شبکه را شناسایی کند.
- تشخیص ارزش و ریسک: در ارزیابی میان ارزش و ریسک اقدام به یک عمل مثل استراتژی کسبوکار یا دستهبندی و شناسایی راهحلهای ممکن از این روش استفاده میشود.
به کمک امکاناتی که بصریسازی ایجاد میکند، میتوان عوامل مؤثر بر رفتار مشتریان در یک کسبوکار را شناسایی کرد و به بهبود و اصلاح نقاط ضعف پرداخت.
مزایای تجسم داده
دادهها پس از جمعآوری، پردازش و مدلسازی برای آنکه بتوانند قابل نتیجهگیری باشند و از آنها مفهومی دریافت کرد به صورت مصور در میآیند. این به تصویر درآمدن مزایایی دارد که عبارتند از:
- تشخیص نتیجه به کمک نمودارها، روندها و الگوهای قابل درک
- درک بصری و سریع از تحلیل دادههایی با حجم بالا
- معنادار کردن دادهها
- درک سریعتر اطلاعات و تصمیمگیری دادهمحور با ضریب اطمینان بالا
- توزیع سریع و ساده اطلاعاتی
- کاهش نیاز به حضور متخصصان علم داده در سطح سازمان
- عملکرد سریع و بهینه و اصلاح ایرادات بر اساس دادهها
- تصمیمگیری استراتژیک
- بهبود خدمات
- ایجاد بینش عمیق صحیح و سریع
- افزایش تعامل
ویژگیهای تجسم داده
به تصویر درآوردن داده همیشه موجب تسهیل و سادگی درک مفاهیم نهفته در آنها میشود. ویژگیهای این روش را میتوان در دسته مزایای آن نیز به شمار آورد. اما قابلیتهایی که تصویرسازی دادهها دارد با این ویژگیها یکی شده و بهتر است در یک دستهبندی جداگانه آورده شوند. این ویژگیها به طور کلی عبارتند از:
- دقت بالا: در تجسم دادهها دقت، وضوح و یکپارچگی داده در اولویت قرار میگیرد و نتایج به شکلی دقیق و غیرقابل دستکاری به تصویر در میآیند.
- انعطافپذیری: در این شیوه به کاربران امکان داده میشود تا دادهها را به شکلهای مختلف مورد ارزیابی قرار دهند.
- مقیاسپذیری: دادهها با حجم و اندازه مختلف قابل دستهبندی هستند و میتوان آنها را بدون در نظر گرفتن میزان پیچیدگی و حجمشان در مقیاسهای مختلف مورد سنجش قرار داد.
تجسم داده و بیگ دیتا
نیاز به بصریسازی بیگ دیتا و دادههای پیچیده هر روز در مدیریت کسبوکارها کاربرد دارد. در آنالیز دادهها از شیوهها و ابزار مختلفی استفاده میشود. سرعت و دقت و سهولت درک مفاهیم استخراجشده از دادهها از مهمترین نیازهای مدیریتی در کسبوکارها هستند.
بصریسازی بیگ دیتا یا کلان داده نیاز به تکنیکهای متفاوتی نسبت به روشهای رایج تجسم داده دارد. معمولاً از روشهای نمایشی پیچیده مثل نقشههای حرارتی استفاده میکنند. در این مسیر از سیستمهای کامپیوتری قدرتمندی که قابلیت تحلیل بیگ دیتا را داشته باشند استفاده میشود.
کاربردهای تجسم داده
به تصویر درآوردن دادهها در تمامی بخشهای فعالیت یک جامعه مثل صنعت، تجارت و پژوهش کاربرد دارد. اما در برخی از بخشها اهمیت آن بیشتر مورد استقبال قرار گرفته و کاربردهای توسعهیافتهتری برای آن در نظر گرفته شده است. در حال حاضر حوزه بهداشت و درمان، مدیریت و تصمیمگیری در بخشهای مختلف به کمک هوش تجاری، سرمایهگذاری، بازاریابی و تجارت الکترونیک از مواردی هستند که بیش از بقیه حوزههای فعالیت از بصریسازی داده در کسب بینش از دادههای خام استفاده میکنند.
کاربردهای این تصویرسازی در مواردی مثل دسترسی و مشاهده آنی سابقه و پرونده پزشکی بیماران و پژوهشهای علم پزشکی در تشخیص و درمان بیماریها، درآمد فروش، عملکرد بازاریابی، تعامل با مشتریان، سطح موجودی، هزینهها و سنجش شاخصهای کلیدی عملکرد در هر فعالیت و کسبوکاری تا حد بسیار زیادی حائز اهمیت است.
هوش تجاری یک ابزار قدرتمند در تجسم داده
هوش تجاری از مهمترین ابزار به تصویر کشیدن دادههای پیچیده و مختلف است. داشبوردها و امکانات مختلفی که هوش تجاری برای انجام مقایسه و سنجش و به تصویر کشیدن دادههای مختلف در اختیار کاربران خود قرار میدهد به منزله انقلابی در تسریع درک مفهوم و استخراج بینش از دادهها است.
هوش تجاری چارگون امکانات مختلفی را در داشبوردهای مدیریتی خود در نظر گرفته است. مثلاً در زمینه منابع انسانی میتوان به نمایش داشبورد شاغلین شامل تعداد افراد بر حسب سال و ماه، نمایش درون سازمانی شاغلین، نمایش مشخصات شغلی و اطلاعات افراد، نمایش پراکندگی مدرک تحصیلی، نمایش نسبت جذب و ترک در سازمان و نمایش بسیاری از معیارها و پارامترهای دیگر اشاره کرد که همگی در آنالیزها و بررسیهای مربوط به سرمایه انسانی کاربرد فراوان دارند و بدون صرف زمان زیاد میتوان به راحتی و به سرعت تمام این اطلاعات را در یک داشبورد مشاهده و مقایسه کرد.
این ابزار قدرتمند در مصورسازی داده موجب شفافسازی و قابلیت پایش سریع و آسان فرایندهای مختلف سازمانی میشود و نیاز سازمانهای بزرگ و کوچک در تحلیل دادهها و تبدیل آنها به اشکال قابل فهم در یک نگاه را برآورده میسازد. به این ترتیب تصمیمگیریها راحتتر میشوند و زمان کمتری نیز صرف ارزیابی و تحلیل دادهها برای رسیدن به نتیجه میشود.
سخن پایانی
تجسم داده آخرین مرحله از پردازش دادهها برای تبدیل آنها به بینش است. در این روش نتایج به راحتی قابل تشخیص، ارزیابی و تصمیمگیری هستند. بصریسازی داده یکی از سودمندترین راههای درک و استخراج مفاهیم از دادهها است. به تصویر درآوردن مفاهیم، شکلی از ارتباط است که اطلاعات پیچیده و انبوه را به صورت گرافیکی و ساده در میآورد. این تصاویر امکان مقایسه و بررسی روایی فرایند را تا حد بسیار زیادی تسهیل میکنند. به کمک این تکنیک تصمیمگیریهای مدیریت و ارزیابیها تا حد بسیار زیادی ساده میشوند اما از میزان کیفیت و دقت آنها کاسته نمیشود، چون بینش بهدستآمده ناشی از شهود نیست و کاملاً مبتنی بر دادههای ثبتشده در تاریخچه یک سازمان است.