הפוסט הקודם של אייל עסק במה לא לעשות. איפה לא לטעות. בפוסט הנוכחי (השני בסדרה) אייל ילווה אתכם לצד האופטימי יותר: מה חשוב לעשות ובמה חשוב להתמקד בבואנו להיערך לעולם ביג דאטה תשתיתי אפקטיבי.

תמונה1

נתחיל עם כמות המידע. אני יוצא מתוך הנחה שהגדרנו כבר צרכים עסקיים וברור לנו מה אנו רוצים להשיג מבחינת שיפור הצעות ערך או הגדלת נתח ארנק ואנו יודעים גם באיזה קהלי מטרה אנו רוצים להתמקד.

בשלב הזה עוד לפני שנחליט איזה מקורות מידע נרצה לנטר ולאסוף מהם מידע אנו חייבים להבין איך עובד בסיס הביג דאטה. והבסיס מושתת על מחסן נתונים מרכזי. אכן אפשר לחקור ישירות במערכות עם כלי BI כזה או אחר אבל ברגע שאנו מתכננים לשלב מידע ממערכות שונות ולהתרחב בכמות הדאטה גם לדאטה שנוצר למשל בעולמות הדיגיטל הרי שאנו חייבים להפנים שהגענו ל V הראשון בעולם הדאטה = Volume. ובכמות כמו בכמות בגלל שאנו ככל הנראה הולכים להכפיל ולשלש אם לא יותר מכך את כמות הדאטה כדאי שנערך עם מחסן נתונים מתאים כזה שערוך לאחסן ולשמור כמויות מידע גדולות. עד כאן זה נשמע הגיוני.

אבל האם רק קיבולת המחסן היא הפרמטר הרלבנטי לבחינה? ממש לא.

בואו ניקח מקרה בוחן לפיו ארגון מעוניין לאחסן נתונים ממערכת ה CRM שלו, להוסיף לה נתונים מאתר האינטרנט המאובטח, בשילוב נתונים ממערכות ליבה אחרות וגם קבצים שמגיעים פעם ביום ממקור כלשהו מחוץ לארגון. מבחינת כמות אכן שילוב הדיגיטל ומערכות הליבה מציגים פה מצג של כמות דאטה גדולה. אבל האם המחסן שנרכוש ערוך לחיבור מקורות שונים אליו ובמהירות? האם כל סוג שרת ומערכת מקור ניתן לחבר בקלות למחסן?

כל כמה זמן נרצה שיעבור הדאטה אל המחסן? בלילה? מדי יומיים? או שמא נפנטז על רענון בזמן אמת או בשמו השיווקי הבינלאומי – ריל טיים …האם המחסן שלנו בעל יכולת להתרענן בריל טיים ולהסתנכרן או שמא נדרש לפתרונות נוספים שישלימו אותו? ונניח שפרקנו את כל הטוב הזה בצורת הדאטה מכלל המקורות אל אותו מחסן שרק עתה רכשנו. כל מטרתנו היא לתחקר בשכבת הדאטה כדי לזקק תובנות ולמנף מידע עסקי.

האם ניתן לתחקר במחסן שלנו בכלי ה BI שיש לנו? בדיקה קטנה בשוק תגלה שלא כל כלי BI קיים מתאים לכל מחסן חדש בעידן הביג דאטה ואז נאלץ לבצע התאמות במחסן ולהוסיף שכבת תחקור מעליו. דומה הדבר לרכישה של מטבח חדש ובגלל חוסר תכנון אתה מסיים גם עם תוספת הגבהה למקרר כי זה ששירת אותך נאמנה כל השנים לא מתאים לפתח הענק שנוצר בהתקנת המטבח החדש. הנה העסקה התייקרה כרגע בעוד הוצאה לא מתוכננת.

אז איך יודעים איזה מחסן נתונים לבחור או איזה יכולות צריך שיהיה למחסן הנתונים שלנו ונוכל להיערך להשלמתן כדי לשפר ביצועים?
לפעמים תמונה אחת שווה אלף מילים אז הנה היא לפניכם. זהו ריכוז היכולות ההכרחיות למחסן נתונים בעידן החדש לארגון שחפץ להוביל וליצור יתרון יחסי בענף שלו :

ועל קצה המזלג הסבר קצר על כל יתרון ומה שעומד מאחוריו:

BIG: לא צריך להרחיב יותר מדי. גודל. מוכנות לעולם של כמות מידע עצומה. מידע דמוגרפי/ מידע פנימי/ טרנזקציות/ דפוסי גלישה/ תוכן שנצרך/ מוצרים שנקנו/ טקסטים/ קבצים. הכל מכל.

Holistic: היכולת לחבר מגוון מקורות לאותו מחסן. ערוצים ומערכות מסוגים שונים: שרתים, Web Services, אפליקציות.

Fresh (מרכיב הקסם): יכולת סנכרון מובנית ורענון המחסן עד זמן אמת . Batch זה העבר / Real Time זה ההווה והעתיד.

Fast: תמתינו אתם 35 דקות לשאילתא דחופה שחייבים להריץ עכשיו. הרי בבית כשהאינטרנט לא זז אתם ישר מתקשרים לספק ומרחיבים את הפס. אז למה להיתקע עם מחסן נתונים שאופיין ונרכש אי שם בעת באג 2000 ? מהירות הרצת הדאטה ומהירות הגשת התוצאות הם לב ליבו של מחסן נתונים מוביל.

User Friendly: בדיוק כמו UI באתר ו UX שכל כך מדברים עליהם גם המשתמשים במחסן הנתונים צריכים להנות בעידן החדש מ 2 יכולות מרכזיות : חווית משתמש קלה ונוחה לתפעול ואפשרויות ל Self Service.

Simple: ואחרון חביב מרכיב הפשטות. יכולת כל כך חשובה להשגת תוצאות ושיפור אפקטיביות עסקית וטכנולוגית. ופשטות בכל המובנים: ראשית, קלות שינוע מידע אל המחסן ומהמחסן והאם צריך עוד פתרון לכך או שהמחסן כבר מכיל יכולת כזו מובנית בתוכו. גורם שני הוא קלות התחקור בתוך המחסן עם כלי BI סטנדרטיים ו/ או כאלו שכבר יש בארגון ללא צורך בשכבה מקשרת או פתרונות יצירתיים מיותרים.

בתקווה ששפכתי מעט אור למחסן האפל ועם המלצה אישית להכיר פתרונות חדשים בשוק אפגוש אתכם גם כאן בתגובות לשאלות והכוונה וגם בטור הבא בסדרת המתח הנוכחית. בהצלחה.

ולמי שלא הספיק לקרוא את הפוסט הראשון של אייל שהווה פתיח לסדרת הפוסטים העוסקים בעולם הביג דאטה – Link

About עומר מילויצקי

אסטרטגיה דיגיטלית רב ערוצית | הערכים המקצועיים שמנחים אותי: Smart, Simple & Social.