عنوان چرخه حیات تجزیه و تحلیل داده (2)
نوع منبع مقاله
گروه تجزیه و تحلیل
تاریخ انتشار ۱۶ / ۰۵ / ۱۳۹۵
خلاصه امروزه شاهد قرار گرفتن داده در کانون تحولات کسب و کار می باشیم . تنها با تجزیه و تحلیل داده است که می توان بینش لازم جهت تصمیم گیری صحیح و به موقع را تولید کرد و از تصمیم گیری مبتنی بر داده خام به سمت تصمیم گیری مبتنی بر بصیرت حرکت کرد . شرایط امروز دنیا بگونه ای است که هرگز به سازمان ها و افرادی که از داده خام به عنوان سوخت موتور تصمیم گیری استفاده می نمایند، فرصت چشیدن طعم موفقیت در یک فضای شدیدا رقابتی را نخواهد داد . تصمیم گیری داده محور و یا ایجاد سازمان های داده محور از مهمترین چالش های بنگاه های اقتصادی در عصر حاضر است . چالش هایی که پاسخ گویی به آنها نیازمند ایجاد یک اکوسیستم منسجم متشکل از عناصر مختلفی است که مهمترین ماموریت آن مدیریت داده به عنوان یک دارایی سازمانی است . بدون شک ، تجزیه و تحلیل داده یکی از بازیگران حیاتی و توانمند در این اکوسیستم می باشد .در این بخش با فعالیت های تعریف شده در اولین مرحله چرخه حیات تجزیه و تحلیل داده آشنا می شویم .

امروزه شاهد قرار گرفتن داده در کانون تحولات کسب و کار می باشیم .  تنها با تجزیه و تحلیل داده است که می توان بینش لازم جهت تصمیم گیری صحیح و به موقع را تولید کرد و از تصمیم گیری مبتنی بر داده خام به سمت تصمیم گیری مبتنی بر بصیرت حرکت کرد . شرایط امروز دنیا بگونه ای است که هرگز به سازمان ها و افرادی که از داده خام به عنوان سوخت موتور تصمیم گیری استفاده می نمایند، فرصت چشیدن طعم موفقیت در یک فضای شدیدا رقابتی را نخواهد داد . تصمیم گیری داده محور و یا ایجاد سازمان های داده محور از مهمترین چالش های بنگاه های اقتصادی در عصر حاضر است . چالش هایی که پاسخ گویی به آنها نیازمند ایجاد یک اکوسیستم منسجم  متشکل از عناصر مختلفی است که مهمترین ماموریت آن  مدیریت داده به عنوان یک دارایی سازمانی است . بدون شک ، تجزیه و تحلیل داده یکی از بازیگران حیاتی و توانمند در این اکوسیستم می باشد .
با برداشت های مختلف از ماهیت تجزیه و تحلیل داده ، نمی توان به یک درک مشترک دست یافت و بدیهی است نباید انتظار تولید یک ارزش مشترک را داشت . تجزیه و تحلیل داده می بایست تابع یک فرآیند حاکمیتی باشد و این فرآیند ملزم به تبعیت از یک چرخه حیات معتبر . تاکنون چرخه های حیات متعددی به منظور تجزیه و تحلیل داده ارایه شده است . در بخش اول به یکی از این چرخه های حیات با تمرکز بر روی کلان داده ها و یا داده های عظیم اشاره گردید . چرخه حیات فوق از شش مرحله مهم و استراتژیک تشکیل شده است که در ذیل هر مرحله مجموعه ای از فعالیت ها تعریف می شود . در این  بخش با تمرکز بر روی اولین مرحله چرخه حیات  با مجموعه فعالیت های آن و کارکرد عملیاتی هر یک آشنا خواهیم شد. در شکل 1 مراحل مختلف چرخه حیات تجزیه و تحلیل داده با تمرکز بر اولین مرحله نشان داده شده است .
 

مراحل مختلف چرخه حیات تجزیه و تحلیل داده
شکل 1 : مراحل مختلف چرخه حیات تجزیه و تحلیل داده

 مرحله اول : اکتشاف
اکتشاف ، اولین مرحله چرخه حیات تجزیه و تحلیل داده است . در این مرحله ، تیم داده می بایست ضمن بررسی دقیق مساله و اشراف اطلاعاتی نسبت به آن ، با منابع داده مورد نیاز و در دسترس برای انجام پروژه به خوبی آشنا گردد . همچنین لازم است تیم داده نسبت به تدوین فرضیه های اولیه که در ادامه اجرای پروژه برای تست داده به آنها نیاز است اقدام نماید . شکل 2 ، فعالیت های مرحله اکتشاف چرخه تجزیه و تحلیل داده را نشان می دهد . 

فعالیت های مرحله اکتشاف چرخه تجزیه و تحلیل داده
شکل 2 : فعالیت های مرحله اکتشاف چرخه تجزیه و تحلیل داده
در ادامه به هر یک از فعالیت های مرحله اکتشاف چرخه تجزیه و تحلیل داده اشاره می گردد .

 آشنایی با کسب و کار و اشراف اطلاعاتی به آن
آشنایی و شناخت مناسب  نسبت به ابعاد مختلف مساله بسیار ضروری است و می بایست با یک نگرش 360 درجه ای با این موضوع برخورد داشت و مساله را از ارتفاع چند کیلومتری نگاه کرد  نه چند سانتی متری!  با شناخت یک درصدی نسبت به یک مساله نمی توان راه حلی را ارایه داد که انتظار موفقیت 99 درصدی از آن را داشته باشیم . در بسیاری موارد ، دانشمندان داده دارای دانش عمیق محاسباتی و کمی می باشند که می توان از آن در ابعاد وسیعی در حوزه های مختلف کسب و کار استفاده کرد . به عنوان نمونه می توان به فردی اشاره کرد که دارای درجه پیشرفته ای از علم ریاضیات و آمار است . این دانشمندان داده دارای دانش عمیقی در خصوص متدها ، تکنیک ها و روش های متنوعی جهت اکتشاف می باشند که می توان از این توانمندی  در ارتباط با مشکلات مفهومی و کسب و کار متنوعی استفاده بعمل آورد . برای برنامه ریزی و ایجاد مدل در مراحل سوم و چهارم چرخه حیات تجزیه و تحلیل ، میزان آشنایی با کسب و کار الزامی است . تیم داده در این مرحله تعیین می کند با چه میزان دانش و شناخت کسب و کار می توان برنامه ریزی و ایجاد مدل را انجام داد . تامین منابع مورد نیاز برای انجام پروژه به شناخت صحیح  حوزه کسب و کار بستگی دارد تا این اطمینان حاصل گردد که تیم پروژه ضمن شناخت مناسب نسبت به حوزه کسب و کار و اشراف اطلاعاتی مناسب نسبت به آن دارای تخصص های مورد نیاز جهت اجرای پروژه می باشد .   

ارزیابی منابع موجود برای حمایت از پروژه
تیم داده می بایست در مرحله اکتشاف ،  منابع در دسترس برای حمایت از پروژه را بررسی نماید . منابع شامل فناوری ، ابزارها ، سیستم ها ، داده ها و افراد می باشند . در این مرحله ، تیم داده ابزارهای در دسترس ، فناوری ها و انواع سیستم هایی را که می توان با استفاده از آنها شرایط عملیاتی کردن مدل ها را فراهم کرد ، بررسی می نمایند. همچنین لازم است سطح بلوغ تجزیه و تحلیل در سازمان مورد نظر به دقت ارزیابی گردد تا فاصله موجود در خصوص بکارگیری ابزارها ، فناوری ها و مهارت ها به دقت تعیین گردد . تعیین مهارت ها و نقش های مورد نیاز جهت اجرای پروژه و در نهایت بهره برداری از مدلی که در مرحله چهارم ایجاد خواهد شد  بسیار حائز اهمیت است  . در صورت عدم وجود مهارت ها و تخصص های مورد نیاز جهت انجام پروژه ، قبل از هر چیز می بایست این فاصله به درستی برطرف گردد .
علاوه بر ارزیابی مهارت ها و منابع محاسباتی ، می بایست بررسی موجودی نوع های داده در دسترس برای  تیم پروژه نیز در دستور کار قرار گیرد . آیا برای تامین اهداف پروژه به اندازه کافی  داده وجود دارد ؟ آیا می بایست داده اضافه تری جمع آوری شود و یا  لازم است داده مورد نیاز از منابع خارجی خریداری گردد و یا می توان با تبدیل داده موجود به نیاز تیم پروژه پاسخ داد؟ انجام یک پروژه خصوصا با اهداف بلند مدت با تاکید صرف بر داده موجود ، احتمال موفقیت پروژه را به شدت کاهش خواهد داد . در چنین مواردی لازم است اهداف بلند مدت بدون محدود شدن در داده موجود در دستور کار قرار گیرد .  شاید بتوان با داده موجود ره توشه ای برای یک سفر بلند مدت جمع و جور کرد ولی بخاطر داشته باشیم که این ره توشه در اولین ایستگاه های توقف مصرف خواهد شد و ادامه کار با مشکل جدی مواجه خواهد شد . 
همچنین لازم است تیم پروژه دارای ترکیب مناسبی از تخصص ها و مهارت های مرتبط و مورد نیاز باشد . از تحلیل گران مستعد گرفته تا مدیران پروژه تیزهوش و نکته سنج . در صورتی که مهارت های مورد نیاز در تیم پروژه نباشد در چه مدت زمانی می توان این توانمندی را با هدف افزایش وسعت و عمق مهارت ها انجام داد ؟
تامین منابع مورد نیاز ( ابزارها ، فناوری ، داده ، افراد ) در ابتدای پروژه نسبت به زمانی که پروژه در جریان است دارای اثرات جانبی کمتری خواهد بود و قطعا احتمال موفقیت یک پروژه را افزایش خواهد داد . پاسخ به این پرسش که آیا تیم پروژه دارای منابع کافی جهت انجام موفقیت آمیز پروژه است و یا به منابع بیش تری نیاز است ، بسیار حیاتی است که می بایست در مرحله اکتشاف به آن پاسخ داد . بخاطر داشته باشیم که احتمال تامین منابع مورد نیاز در مراحل آغازین یک پروژه نسبت به زمانی که پروژه در جریان است به مراتب بیش تر خواهد بود .

بیان روند حل مساله
بیان روند حل مساله برای موفقیت پروژه امری حیاتی است . در گام نخست توصیه می شود با تهیه بیانیه ای ابعاد مختلف مساله تشریح و بین تیم پروژه و تمامی ذینفعان به اشتراک گذاشته شود . این کار باعث می شود که اعضاء تیم و ذینفعان به یک درک مشترک در خصوص نیازها و ابعاد مختلف مساله برسند و ضمن آشنایی با وضعیت جاری در آغاز با چالش های احتمالی حل مساله و راه حل های مطرح نیز آشنا گردند .در این بیانیه می توان به موارد مختلفی اشاره کرد :  این که چرا پروژه  تعریف شده است ؟  قرار است چه مساله ای را حل کند؟  معیارها و  شاخص های موفقیت و یا شکست پروژه چیست ؟  چگونه می توان این اطمینان را پیدا کرد که روند انجام پروژه همسو با اهداف حامی یا حامیان پروژه است ؟ 
 
شناسایی ذینفعان اصلی
یکی دیگر از فعالیت های مهم در مرحله اکتشاف چرخه حیات تجزیه و تحلیل ، شناسایی ذینفعان اصلی و علایق هر یک در پروژه است . می بایست تمامی افراد و یا بخش هایی در سازمان  که به نوعی از مزایای پروژه بهره مند خواهند شد و یا بطرز محسوسی بر روی پروژه تاثیرگذار هستند ، شناسایی گردند . بررسی سوابق انجام پروژه های مشابه و واکاوی دلایل موفقیت و یا ناکامی هر یک نیز می بایست در دستور کار قرار گیرد . شناسایی ذینفعان اصلی و آشنایی با خواسته هر یک می بایست بگونه ای انجام شود که در ادامه مراحل چرخه حیات تجزیه و تحلیل به مشکل برخورد نکنیم و با داشتن اطلاعات مستند شده مورد نیاز، بتوانیم  فعالیت های تعریف شده در هر مرحله از چرخه را به درستی انجام دهیم . تدوین و ترسیم مدل و نوع تعاملات بین فعالیت ها و انتظارات مشارکت کنندگان و همچنین پیشگیری از بروز تاخیر زمانی از دیگر فعالیت های مهم در این مرحله است .
   
مصاحبه با ذینفعان اصلی و حامیان تجزیه و تحلیل 
تیم داده می بایست برنامه ریزی لازم جهت گفتگو با ذینفعان و حامیان پروژه را با هدف ایجاد شفافیت و تبین روند حل مساله تجزیه و تحلیل انجام دهد . در بسیاری از موارد ممکن است ذینفعان و یا حامیان پروژه دارای یک راه حل از قبل تعریف شده باشند که بر روی عملیاتی کردن آن اصرار دارند . تیم داده می بایست این موضوع را بطور جدی پیگیری نماید که ارایه یک راه حل از قبل تعریف شده و احتمالا الهام گرفته شده از تجربه سایر افراد و یا سازمان ها ممکن است تامین کننده دستاوردهای موردنظر نباشد و با تاکید و تمرکز بر دانش و تخصص خود ، ضمن شناسایی ابعاد مختلف مساله ، نسبت به ارایه یک و یا چندین راه حل مناسب اقدام نماید . یکی از روش های مناسب جهت آشنایی شفاف وعمیق نسبت به صورت مساله ، انجام مصاحبه با ذینفعان اصلی و حامیان پروژه است تا ضمن آشنایی با خواسته هر یک بتوان با درک و شناخت عمیق تر وارد فرآیند حل مساله گردید . گفتگو با ذینفعان اصلی و حامیان پروژه می بایست مبتنی بر یک روش علمی منسجم باشد تا بتوان در کوتاهترین زمان ممکن با دیدگاه هر یک آشنا گردید . طرح مناسب انواع سوالات ( از سوالات کوتاه گرفته تا سوالات تشریحی )  ، اختصاص زمان مناسب جهت مصاحبه ، شنیدن نقطه نظرات دیگران ( شنیدن فعال )  تا تحمیل نظر خود ، دادن فرصت فکر کردن به دیگران ، عدم اصرار و یا تعصب بر روی یک موضوع خاص  از جمله مواردی می باشند که می بایست در انجام مصاحبه ها به دقت رعایت گردد .

ایجاد فرضیه های اولیه 
ایجاد مجموعه ای از فرضیه های اولیه یکی از جنبه های کلیدی مرحله اکتشاف  است .این مرحله شامل شکل دهی ایده هایی است که تیم داده می تواند با داده تست نماید . توصیه می گردد با مجموعه اندکی از فرضیه ها کار را شروع و تست کرد و در ادامه موارد بیش تری را اضافه کرد .در واقع به کمک این فرضیه ها ، محدوده تست های تجزیه و تحلیل که تیم داده در مرحله پنجم  از آنها و به عنوان فونداسیون یافته ها و دستاوردها استفاده خواهد کرد ، مشخص می گردند. مهم این است که بتوان به سمت تولید نتایج موثرتر با سطح رضایت مندی بیشتر ذینفعان اصلی حرکت کرد .

 شناسایی پتانسیل منابع داده
یکی دیگر از فعالیت های مهم در مرحله اکتشاف ، شناسایی انواع داده یی است که تیم داده برای حل مساله به آنها نیاز دارد. بررسی خصایص اصلی داده نظیر حجم ، تنوع و سرعت تغییرات از جمله مواردی است  که می بایست در مرحله شناسایی پتانسیل منابع داده به آن توجه جدی گردد . برای شناسایی پتانسیل منابع داده ، فعالیت های پنج گانه زیر توصیه می گردد : 
  • شناسایی منابع داده:  تهیه لیستی از منابع داده کاندید که تیم داده ممکن است برای تست فرضیه های اولیه به آنها نیاز داشته باشد . لیست فوق ، شامل مجموعه داده در دسترس به همراه داده هایی است  که امکان خرید آنها وجود دارد تا تیم داده بتواند با بکارگیری آنها تست فرضیه های اولیه را انجام دهد .
  • بررسی کلی منابع داده :  بررسی اولیه وضعیت داده و شناخت بهتر نسبت به آنها .
  •  بررسی داده های خام : دریافت داده از منابع داده اولیه به منظور شناخت وابستگی های داخلی بین خصلت های داده ، آشنایی با محتویات ، کیفیت  و محدودیت ها .
  • بررسی ساختارهای داده و ابزارهای مورد نیاز  : نوع و ساختار داده ، نوع ابزاری را که تیم داده می تواند جهت تجزیه و تحلیل از آنها استفاده نماید ، مشخص می نماید . این که کدام فناوری می تواند یک کاندید خوب برای پروژه باشد و چگونه می توان به ابزارهای مورد نیاز دستیابی داشت از جمله مهمترین اهداف این فعالیت است .
  • مشخص کردن محدوده زیرساخت داده مورد نیاز : با توجه به ماهیت مساله، می بایست نوع زیرساخت مورد نیاز نظیر رسانه های ذخیره سازی و یا ظرفیت شبکه بررسی گردد.
خلاصه
تجزیه و تحلیل داده می بایست تابع یک فرآیند حاکمیتی باشد و این فرآیند ملزم به تبعیت از یک چرخه حیات معتبر. تاکنون چرخه های حیات متعددی به منظور تجزیه و تحلیل داده ارایه شده است . در بخش اول به یکی از این چرخه های حیات با تمرکز بر روی کلان داده ها و یا داده های عظیم اشاره گردید . چرخه حیات فوق از شش مرحله مهم و استراتژیک تشکیل شده است که در ذیل هر مرحله مجموعه ای از فعالیت ها تعریف می شود . مرحله اکتشاف به عنوان اولین مرحله در چرخه حیات تجزیه و تحلیل دارای یک نقش کلیدی و حیاتی  است . با انجام صحیح فعالیت های تعریف شده در مرحله فوق ، تیم داده می تواند سفر خود را ادامه داده و خود را آماده انجام فعالیت های تعریف شده در مرحله دوم نماید. زمانی که تیم داده دارای اطلاعات کافی برای تهیه پیش نویس اولیه طرح تجزیه و تحلیل و به اشتراک گذاشتن آن باشد ، می توان قدم در مرحله بعدی گذاشت . مهمترین دستاورد مرحله اکتشاف که با تایید سطح کمی و کیفی خروجی ایجاد شده می توان  خود را آماده ورود به مرحله بعدی کرد عبارتند از : شناخت شفاف و عمیق ( هم در سطح و هم در عمق ) نسبت به حوزه کاری و مساله ای که قرار است حل شود ، تعیین منابع داده مورد نیاز به همراه پتانسیل بالقوه هر یک  ، شناسایی ذینفعان اصلی ، تعیین منابع مورد نیاز شامل نیروی انسانی ، فناوری ، ابزارها و سیستم ها  ، ایجاد فرضیه های اولیه ،   تعریف شاخص های موفقیت و ناکامی پروژه 
در بخش بعد به سراغ مرحله دوم چرخه حیات تجزیه و تحلیل داده خواهیم رفت و با مجموعه فعالیت های لازم جهت آماده سازی داده آشنا خواهیم شد .
  
منابع  :
EMC Education Services. Data Science and Big Data Analytics: Discovering, Analyzing, Visualizing and Presenting Data. Wiley, 2015
Bart Baesens,Analytics in a Big Data World: The Essential Guide to Data Science and its Applications. Wiley, 2014
Rachel Alt-Simmons,Agile by Design: An Implementation Guide to Analytic Lifecycle Management,Wiley, 2014