ورود به حساب کاربری

نام کاربری *
رمز عبور *
یاداوری

مراحل اجرای یک پروژه تحلیل داده

1- BUSINESS UNDERSTANDING
  • Define Objectives and Goals
  • Define Success Metrics
  • Data Sources Identification & Dictionaries
  • Feasibility Report
  • Code Base Structure
2- DATA UNDERSTANDING
  • Data Quality Report
  • Inconsistency Reporting
  • Tracking Missing  Data
3- PRE-MODELING
  • Models Exploration Report
  • Refined Proposal
4- MODELING
  • Data Analysis
  • Data Hypothesis
  • Feature Selection  Method
  • Feature Construction  Method
  • Statistical Methods
  • Modeling Requirements
5- Evaluation
  • Performance Evaluation Report
  • Model Report
6- DEPLOYMENT
  • Production Readiness Report
  • Exit Report and Handoff
7- EVANGELISM
  • Delivery and Maintenance Plan
  • Training and  Monitoring Plan
  • Ad  Hoc Report
  • Schedule Report
  • API Report
  • Testing Document

برای اجرای یک پروژه تحلیل داده تیم شرکت موارد زیر را در قالب یک چک لیست مورد توجه قرار داده و سعی می کند برای هر یک از آیتمها اقدامی انجام دهد که منجر به موفقیت بیشتر پروژه شود:

1- تعریف پروژه
  • نمای کلی، دامنه و ریشه پروژه تشریح شده است؟
  • ارائه پیش زمینه کافی از مورد کاربرد انجام شده است؟
  • بیان مسئله به وضوح انجام شده است؟
  • توضیحات کافی و مبسوط از راه حل پیشنهادی ارائه شده است؟
2- متریک ها
  • توضیح مناسبی از متریک ها و دلیل انتخاب هر یک ارائه شده است؟
  • نحوه سنجش هر یک از متریک ها تشریح شده است؟
  • ارتباط بین متریک های انتخاب شده و KPI تجاری تعیین شده است؟
3- تحلیل و آنالیز
  • تشریح دقیق و کاملی از ویژگی های داده های وروردی مورد کاربرد ارائه شده است؟
  • اطلاعات آماری از داده های ورودی تهیه و ارائه شده است(مانند Missing-Outlier-N
  • تحلیلی از نتایج و اطلاعات آماری بدست آمده از هر یک از ویژگی ها ارائه شده است؟
  • در خصوص داده های ناقصی که در نتیجه مدل اثرگذار است توضیحی داده شده است؟
  • برای حل ناهنجاری ها و افزایش کیفیت داده ها چه اقداماتی به ازای هر ویژگی ها انجام شده است؟
  • آیا برای درک بهتر نتیجه آنالیز داده های ورودی از مکانیزمهای بصری سازی استفاده شده است؟
  • آیا پلات ها و نتیجه بصری سازی در گزارش تشریح شده اند؟
4- الگوریتمها و تکنیک ها
  • آیا الگوریتم استفاده شده شامل متغیرها و پارامترهای پیش فرض به صورت کامل و همچنین در قالب سودوکد تشریح شده است؟
  • نحوه انتخاب ویژگی های داده های ورودی توسط الگوریتم و تکنیک های مورد استفاده تشریح شده است؟
  • کتابخانه ها و توابع محیطی استفاده شده تشریح شده است؟
  • نیازمندی های سخت افزای و پردازشی حداقلی برای اجرای مدل ذکر شده است؟
5- بنچمارک
  • بنچمارک استفاده شده برای مقایسه تعیین شده است؟
  • دلایلی انتخاب بنجمارک تشریح و تبیین شده است؟
6- پیش پردازش داده ها
  • روشهای انتخاب ویژگی و پیش پردازش داده ها تشریح شده است؟
  • روشهای تمیزسازی و پاک سازی داده ها تشریح شده اند؟
  • در صورت عدم انجام پیش پردازش، آیا دلیل منطقی ذکر شده است؟
7- پیاده سازی
  • روش پیاده سازی الکوریتم انتخاب شده و نوع ارتباط آن با داده های ورودی تشریح شده است؟
  • آیا مستند سازی کافی درون کد و مستندات فنی کد نوشته به اندازه کافی است(تشریح توابع، استفاده از روشهای شی گرایی در توسعه کد)؟
  • آیا کدها در ریپازیتوری شرکت درج و کامیت شده اند؟
  • آیا ماژول تست واحد برای مدل یا اجزای آن نوشته شده است؟
  • آیا ساختار استاندارد شرکت در توسعه و کدنویسی مدل (ترکیب فایل ها و کنارهم قرار گیری آنها) رعایت شده است؟
8- اصلاح
  • آیا روند بهبود به روشنی مستند شده است، مانند اینکه چه تکنیک هایی استفاده شده اند؟

  • روشهای استفاده شده در بهبود پارامترها تشریح شده است؟
9- نتایج
  • آیا مدل با دادهای Unseen مورد محک قرار گرفته است؟
  • آیا در مرحله تست مدل از داده های نویز تزریقی در داده های آموزش استفاده شده است؟
  • آیا روشی برای تفسیر مدل طراحی شده پیاده سازی شده است؟
  • آیا روال دریافت بازخورد از کاربران تشریح شده است؟
  • آیا نتایج بدست آمده از نتایج بنچمارک ها قوی تر است؟
  • آیا جنبه های دشوار و جالب پروژه تشریح شده است؟

شرکت دانش بنیان رایانش سریع هزاره ایرانیان به منظور ارائه راهکارهای رایانش سریع، تحلیل داده، بیگ دیتا و کلان داده به سازمانها و شرکتهای عصر دیجیتال تشکیل شده است. خدماتی از جمله طراحی راهکارهای بیگ دیتا، راه اندازی دریاچه داده و انباره داده، ساخت کاتالوگ داده، تحلیل داده و یادگیری ماشینی و ... از جمله فعالیتهای این شرکت می باشد.

 

 

آخرین مقالات

کامپایل و نصب mfix-2016.1

درک عملکرد دستگاه های انرژی، محیط زیست و فرایندها...

معرفی کامل صف پیشرفته کاف...

آپاچی کافکا نیز پلت فرم متن باز به منظور پردازش جر...

روندهای معماری داده در سا...

هدف اصلی از پیاده‌سازی معماری داده، استانداردسازی...

کامپیوترهای کوانتومی: انف...

کامپیوترهای کوانتومی انفجاری در سرعت محاسبات ایجا...

رایانش مرزی یا EDGE COMPU...

در این مقاله تصمیم داریم با مفهومی به نام رایانش...

پردازش سریع تصاویر دریافت...

پردازش سریع تصاویر دریافت از راه دور (RS) در بسیار...

امنیت در مجازی سازی و رای...

مجازی سازی و رایانش ابری در رایانش ابری کامپوننت...

الگوریتم‌‌های پیش‌بین و ک...

استفاده از الگوریتم‌های پیش‌بین و هوش مصنوعی به د...

استفاده از سیستم چند عامل...

رایانش ابری یکی از راه حل های فشرده توسعه یافته بر...

۶ مهارت پر تقاضای بازار د...

متخصص دانش ابری (Cloud professional) یکی از عناوی...

جریان موازی بین منابع HPC...

چکیده انجام تجزیه و تحلیل یا تولید تصویری همزمان ب...

پردازش داده‌های جریانی در...

با ظهور وب ۲٫۰ و اینترنت اشیا، ردگیری همه نوع اطلا...

معرفی روش ها و ارائه پیشن...

چكیده محاسبات ابری یک فنآوری جدید نیست؛ بلکه روشی...

آیا فرآیند دموکراتیزه شدن...

ما وسط یک تحول تکنولوژیکی هستیم که شیوه سازماندهی...

کارکرد نظارتی و مدیریتی م...

محاسبات ابری و اینترنت اشیا به عنوان دو مبحث داغ د...

پیوند کلان داده با هوش مص...

سیستم‌های نرم‌افزاری تجاری همچون سرویس‌های ERP و...

محاسبات ابری قدرت رقابتی...

آیا فناوری دیجیتال، یک نیروی دموکراتیزه کننده است...

معماري لامبدا در مقابل مع...

معماري لامبدا تولید بی وقفه داده ها در دنیاي امروز...

زبان برنامه‌نویسی Milk سر...

زبان برنامه‌نویسی Milk که توسط دانشگاه MIT توسعه...

بیگ دیتا ، یادگیری ماشین...

سازمان‌ها گاهی اوقات به سختی تلاش می‌کنند تا با دس...

محاسبات مه چه هستند و چه...

در ابتدا همه چیز «ابر» بود، ولی حالا کلمه جدید «مه...

توسعه هوش مصنوعی مبتنی بر...

به گزارش ایسنا و به نقل از انگجت، پژوهشگران "ام.آی...

نگاهی به کاربردهای رایانش...

رایانش ابری مبحثی است که این روزها زیاد به آن پرد...

نرم افزار شبیه سازی، آنال...

دانلود CST Studio Suite: ارائه راه حل های محاسبات...

دانلود Siemens Star CCM+...

نرم افزار Star CCM یک ابزار شبیه سازی قدرتمند است...

ورود بیگ دیتا به صنعت دار...

تکنولوژی در حال ورود به صنعت داروسازی است و پیش‌بی...

چهارمین جلسه meetup: اصلا...

مهاجمان اغلب با استفاده از اشتباهات کدنویسی کوچک و...

مدیریت خصوصیات صف در کلاس...

 لیست زیر ,ویژگی های صف را نمایش می دهد : acl_grou...

AMD از رویکرد طراحی تازه‌...

AMD چند روز پیش به‌صورت رسمی از رویکرد طراحی جدیدی...

دومین جلسه meet up:مقدمه...

فهرست : توضیح مختصر از توسعه ی کلودسیم نصب کلودسیم...

گالری تصاویر

hacklink al duşakabin fiyatları fethiye escort bayan escort - vip elit escort dizi film izle erotik film izle duşakabin hack forum casibom marsbahis marsbahisgirtr marsbahis matadorbet casibom