پایگاه داده تحلیلی
پایگاه داده تحلیلی (به انگلیسی: Data warehouse) یک بانک اطلاعاتی بزرگ میباشد که از طریق آن کلیه دادههای حال و گذشته یک سازمان جهت انجام عملیات گزارشگیری و آنالیز در دسترس مدیران قرار میگیرد. پایگاه داده تحلیلی که برخی آن را انبار داده میخوانند، نقش مهمی در تصمیمگیری مدیران کمپانی برای تعیین یک استراتژی موفق دارد. پایگاه داده نقش محوری در سامانههای هوش تجاری در سازمانها ایفا میکنند.
بعضی از دادهها به منظور پردازش به یک فضای عملیاتی کوچکتر operational data store برای پردازش بیشتر وارد میشوند.
مراحل عملیاتی پایگاه داده تحلیل
در حال حاضر دو رویکرد کلی در روند پردازش دادهها در پایگاههای داده تحلیلی وجود دارد:
- ETL مخفف Extract-Transformation-Load که رویکرد سه لایه دارد که به ترتیب Integration ,Staging و Presentation نام دارد. در این رویکرد، دادهها قبل از فراخوانی به پایگاه داده تحلیلی، ساختار مناسب پیدا میکنند و سپس ذخیره میشوند.
- ELT مخفف Extract-Load-Transformation که بدون توجه به روال سه لایه ETL، دادهها را مستقیماً به پایگاه دادههای تحلیلی فراخوانی میکند و تغییر ساختار دادهها با توجه به نیاز انجام و در جداول جدید ذخیره میشود.
فراخوانی دادهها از منابع
دادههای خام از منابع اطلاعاتی مختلفی جمعآوری شده و در لایه staging وارد میشوند. منبع داده خام میتواند یک سیستم ERP، پایگاه داده یک برنامه کاربردی یا یک فایل Excel باشد. در اصل، یک پایگاه داده تحلیلی باید امکان دسترسی و پردازش انواع منابع داده اعم از ساخت یافته (مانند پایگاههای داده)، نیمه ساخت یافته (مانند فایلهای Excel) یا غیر ساخت یافته (مانند فایلهای متنی یا صفحات اینترنتی) را داشته باشد.
ایجاد یکنواختی بین دادههای وارد شده به پایگاه دادهٔ تحلیلی در دومین لایه یعنی integration انجام میشود. به عنوان مثال حذف رکوردهای تکراری یا نرمالسازی دادهها.
در لایه Presentation دادهها در دسترس کاربران قرار میگیرد. نرمافزارهای تهیه گزارش مانند Cognos ,Business Object ,SAP با دسترسی به این لایه میتوانند اطلاعات مورد نیاز مدیران و تحلیلگران را استخراج و در قالب گزارش یا Dashboard عرضه نمایند.
در لایه Presentation میتواند چندین دادهگاه وجود داشته باشد.
منابع
- ↑ "Data warehouse". Wikipedia (به انگلیسی). 2020-05-31.