بخش های از فصل دوم

هوش تجاری: تعریف و هدف

 تعریف:

هوش تجاری پردازش تغییر شکل داده به منظور استخراج اطلاعات و تغییر شکل دادن اطلاعات به منظور استخراج دانش است.

هدف:

هدف هوش تجاری انتقال (تبدیل) حجمی از داده در داخل مقادیر ارزشمند کسب و کار از طریق ارائه گزارشات تحلیلی است.

 

هاوارد ارسنر: تحلیل‌گر گروه گارتنر، هوش تجاری را به عنوان یک پردازش، که داده را به اطلاعات و اطلاعات را به هوش تجاری تبدیل می‌کند. نکته کلیدی این است که هوش تجاری یک پردازش است.

  • هوش تجاری از یک سیستم اطلاعاتی، با استفاده از پردازش‌های تحلیلی آنلاین این امکان را می‌دهد تا روند‌ها را پیش‌بینی کرده و به، سؤالات کسب و کار را پاسخ دهید.
  • از منظر یک تحلیلگر، هوش تجاری پردازش‌هایی است که اطلاعات با ارزش با کیفیت و معنی‌دار را درباره یک موضوع را جمع‌آوری می‌کند.
  • انبار داده زیر ساخت مورد نیاز برای ارائه گزارشات را در سطح هوش تجاری را فراهم می‌سازد.
  • هدف انبار داده تبدیل حجم زیاد داده‌ها به اطلاعات است.
  • تعریف داده: داده به عنوان واقعیت و ارقام تعریف می‌شدند.
  • اطلاعات: داده‌های پردازش شده و تفسیر شده داخل یک فریم‌ورک با معنی است.
  • در واقع اطلاعات مجموعه‌ای از داده‌ها است تا یک شخص در یک نقطه از زمان یا دوره زمانی بتواند آنها را ارزیابی می‌کند.
  • دانش: دانش به نتیجه‌ای که از نتیجه پردازش اطلاعات توسط کاربر بدست می‌آید گفته می‌شود.

 

راه‌حل‌های تکنولوژی برای پیاده‌سازی انبار داده:

  • سخت افزار
  • سیستم عملیاتی
  • پایگاه داده
  • ابزارهای پرس‌وجو
  • برنامه‌های کاربردی

  • پایگاه داده‌های بزرگ
  • معماری 64 بیتی
  • تکنیکهای ایندکس‌گذاری
  • سیستم‌‌های کم هزینه و مقرون به صرفه
  • ابزارهای قدرتمند انبار داده
  • ابزارهای پیچیده کاربران

با استفاده از تکنولوژی‌های امروزه منابع کمتری در سخت افزاری و نرم افزار مصرف می‌شود، با استفاده از راه‌حل‌های اینترانت و اینترنت و همچنین پایگاه داده‌هایی که می‌توانند حجم زیادی از داده‌ها را برای تحلیل نگهداری کنند، می‌توان به سادگی به  داده‌ها دسترسی پیدا کرد.

تکنولوژی (به طور خاص، تکنولوژی سیستم‌های باز) برای تحلیل‌های مقرون به صرفه در حجم داده‌های زیاد ایجاد شده، و راه‌حل‌های سخت‌افزاری صرف‌جویی بیشتری در هزینه‌ها می‌کنند.

همچنین پیشرفت‌های اخیر در موازی کاری و انجام محاسبات و پیچیده زمان در مورد انتظار برای تهیه گزارشات را بهتر کرده است.

موازی کاری می‌تواند در بخش‌های زیر انجام شود.

  • محیط سخت‌افزار
  • محیط‌ سیستم‌های عملیاتی
  • سیستم‌های مدیریت پایگاه داده و همه عملیات مرتبط با پایگاه داده
  • تکنیکهای و ابزارهای پرس‌وجو
  • برنامه‌های کاربردی

 

چرا سیستم‌های OLTP برای گزارشات تحلیلی مناسب نیستند

سیستم‌های عملیاتی معمولاً برای پشتیبانی از تراکنش‌ها طراحی شده‌اند، به عنوان مثال رزرو یک بلیط هواپیمایی. طراحی سیستم‌های پشتبانی از تصمیم که یک نوعی از تحلیل‌های پیچیده است، با سیستم OLTP خیلی متفاوت است در بیشتر تراکنش‌های OLTP نیاز است که یک رکورد در پایگاه داده ثبت شود اصلاح شود  یا حتی یک اطلاعات اضافی از رکوردها نگهداری شود. برای بدست آوردن پاسخ این سؤال که چه تعداد ماشین کمکی در ژانویه 2001 در بوستون خریداری شده است نیاز به انجام عملیات متفاوت در پایگاه داده نسبت به تراکنش‌هایOLTP دارد.

پایگاه داده‌های OLTP به صورت کامل نرمال‌سازی شده است و برای ذخیره داده‌های عملیاتی بصورت یکپارچه طراحی می‌شوند، یک تراکنش در یک زمان، گزارشات تحلیلی نیاز به نوعی طراحی دارند تا کاربران بتوانند داده‌های مفید خود را مستقیماً از پایگاه داده استخراج کنند، برای انجام  این کار به تکنیکهای متفاوت طراحی نیاز است (به عنوان مثال، استفاده از داده‌های چند بصری و اسکیمای ستاره‌ای با جداول ابعداد غیر نرمال).

 

تحلیل کردن داده از سیستم‌های عملیاتی

در سیستم‌های عملیاتی:

  • ساختار داده پیچیده هستند
  • سیستم‌ها برای کارایی بالا و بازده مناسب طراحی شده‌اند.
  • داده‌ها به صورت نامفهوم ارائه شده‌اند.
  • داده‌ها پراکنده هستند.
  • سیستم‌های OLTP ممکن است برای پرس‌وجوهای سنگین مناسب نباشد.

با اینکه استفاده از ابزارهای پشتبانی از تصمیم راحت‌تر، بصری‌تر و بهتر هستند، غالباً ساختارهای داده در سیتم‌های OLTP نیازمندی‌های تحلیل کاربران را پوشش نمی‌دهد.

  • ساختار داده‌های سیستم‌های عملیاتی اغلب پیچیده هستند (نوع سوم نرمال‌سازی)
  • سیستم‌ها برای کارایی بهتر طراحی شده‌اند، با قابلیت‌های تراکنش بالا به جای تحلیل اطلاعات.
  • داده‌ها همیشه بصوت با معنی برای استفاده از ابزارهای پرس‌وجو ارائه نشده‌اند.
  • داده‌های یکسان ممکن است در هر سیستم بصورت متفاوت تعریف شده باشد. به عنوان مثال، ممکن است اطلاعات مربوط به شماره تلفن مشتری در یک سیستم داخل یک ستون با 20 کاراکتر و در سیستم دیگری در ستونی با طول 15 کاراکتر نگهداری شده باشد.

مدل چند بعدی

مدل منطقی چند بعدی دارای المان‌ها زیر است:

  • شاخص‌‌ها (Measures)
  • ابعاد (Dimensions)
  • سلسله مراتب‌ها
  • سطح‌ها
  • خصوصیت‌ها

یک مدل چند بعدی می‌تواند با استفاده از جداول یا مکعب‌ها (Cvbe) پیاده‌سازی شود.

جداول

مدل ابعادی معمولاً به عنوان یک اسکیمای ستاره‌ای (Star) یا دانه برفی (snowflake) پیاده‌سازی‌ می‌شود. جداول بعد- که شامل اطلاعاتی درباره سلسله‌ی است، سطح‌ها و خصوصیت است با یک یا بیش از یک جداول  join  می‌شوند.

جداول واقعیت‌ (fact)ها، شامل مقادیر قابل اندازه‌گیری از قبیل مبلغ فروش، تعداد فروش و . . . را می‌باشند.

مکعب‌ها (Cubes) منطقی داده‌ها را در یک شبه جدول ارائه می‌دهند. اگرچه داده‌ها واقعاً در آرایه‌های چند بعدی ذخیره می‌شود، مانند جداول ابعاد، مکعب‌ها داده‌ها را در اجزاء سلسله مراتب، سطوح ها و خصوصیت‌ها نگهداری می‌کنند.

در واقع هر خانه از مکعب دارای چندین وجه است که هر وجه آن مربوط به یک بعد می‌باشد. مثلاً یک خانه از مکعب مبلغ فروش می‌تواند شامل وجوهی از قبیل زمان، محصول، محل فروش و روش فروش باشد.

 

لایه های فیزیک یک انبارداده

ناحیه موقت

در سیستم‌های انبار داده نیاز دارید تا قبل از قرار دادن داده انبارداده، داده‌ها را تمیز کنید. اغلب انبار داده‌ها از برای انجام این عملیات از ناحیه موقت استفاده می‌کنند همچنین وقتی که داده‌ها از چندین سیستم منبع مختلف استخراج می‌شوند استفاده از ناحیه موثرتر خواهد بود.

لایه داده‌ای تجزیه‌ناپذیر

این لایه مدل داده‌ای پروژه انبار داده است که داده‌ها را در نوع سوم نرمال‌سازی ذخیره می‌کند.

این لایه معمولاً شامل سطح ریز دادهاست و هیچ داده تجمیع شده‌ای را نگهداری نمی‌کند. این لایه به عنوان منبعی برای data mart وابسته و تولید داده‌های خلاصه‌سازی شده استفاده می‌شود.

لایه بهینه‌سازی داده

این لایه به عنوان «لایه پیمایش داده» انبار داده شناخته می‌شود. د راین لایه از اسکیمای پایه‌ی انبار داده داده‌های خلاصه‌سازی شده که امکان دسترسی سریع از طریق برنامه‌های تحلیلی و گزارشات را می‌دهد ساخته می‌شود. در لایه خلاصه‌سازی شده از اسکیمای ستاره‌ای یا دانه برفی به همراه با data mart و مکعب‌ها ساخته می‌شود. جالب است بدانید که مشتریان انبار داده اوراکل از قابلیت‌های مربوط به مکعب OLAP به عنوان یک قابلیت کلیدی بهبود عملکرد انبار داده استفاده کنند. مکعب‌ها می‌توانند به صورت باور نکردنی دسترسی به داده‌ها را راحتتر کنند.

مدیریت کردن انبار داده

در اوراکل g11 ابزراهایی به نام OWB و ODI برای مدیریت انبار داده تولید شده است که بهترین طراحی ممکن برای ابزار ETL است همراه با قابلیت‌های تجمیع داده است. OWB و ODI می‌تواند اسکیماها را با مدل ستاره‌ای یا دانه برفی ایجاد کند و همچنین می‌تواند مکعب‌های OLAP را بسازد.

AWM

اوراکل g11 AWR را نیز ارائه کرده است. که ابزاری است برای طراحی کردن، ایجادکردن و مدیریت OLAP.