ביג דאטה. נדמה שאין ארגון שלא מנסה להבין מה זה בכלל אומר ומה אפשר להרוויח מכל הבאזז הזה או יותר נכון מה מפספסים אם לא מצטרפים לחגיגה. כדי לעשות קצת סדר אני שמח ומתכבד לארח אצלי בבלוג את Mr. Big Data – אייל בירן, שהכין לכם מורה נבוכים לארגון שרוצה לפצח את האתגר וליישם פעילות בעולם הדטה. למעשה מדובר בפוסט ראשון מתוך סדרה של טורים של עשה ואל תעשה והעיקר שתצליח. קריאה מהנה.

אייל בירן

הטור הראשון עוסק בכמה תפיסות שגויות כדי שנדע מה לא לעשות או איפה לא לטעות:

1. ביג דאטה קשור רק לעולם הטכנולוגי. ממש לא מדויק. נכון שאם נרשום ביג דאטה בגוגל נקבל מיליוני קישורים לחומר טכנולוגי ולמגוון כלים ופתרונות אולם ביג דאטה כתפיסה חשוב שיתייחס ויתבסס על שילוב בין הגדרות ומטרות עסקיות ברורות לבין פתרונות טכנולוגיים. אין שום הגיון ליישם פתרונות של ביג דאטה עבור אחסון או להכין תשתית להיקפי דאטה גדולים מבלי להגדיר תחילה מה המטרות העסקיות שאנו רוצים להשיג ומה סוג המידע שאותו נרצה לאסוף ולאחסן.

ביג דאטה שגרתי עוסק ב V 3 מרכזיים : היקף (Velocity), מגוון (Variety) ומהירות (Volume).  כולם מושגים מעולם הדאטה הקשורים לתשתית ולסביבה הטכנולוגית. אולם ביג דאטה אפקטיבי עוסק בכלל ב V נוסף שונה לגמרי מהאחרים: ערך (Velue). מה הערך העסקי שאנו רוצים להשיג מהמידע ומה המקורות והמרכיבים שנצטרך בשביל להשיג אותו.

2.  ביג דאטה בהכרח עוסק בהיקפי מידע גדולים מאד. הגיוני אך לא מייצג. אכן במשמעותו הבסיסית המונח ביג עוסק בהיקפי מידע רחבים וגידול בכמות מידע באופן אקספוננציאלי. אולם בעולם הדיגיטלי הכל פשוט עניין של יחסיות ולאוו דווקא גודל. כמות המידע של ארגון יכולה להיות בסיסית במצב נתון כל עוד הארגון לא מפתח יכולות דיגיטליות. אולם ברגע שארגון חורט על דגלו התרחבות רב ערוצית , הוספת אפליקציה, תקשורת במייל, חדירה לעולם ה IOT ועוד הרי שסוגי המידעים שהוא ייחשף אליהם מתרחבים משמעותית.

בכל זאת, ייתכן וכמות הדאטה אינה מאד גדולה אבל פר לקוח ופר פעילות הדאטה מתרחב רב מימדית. אנו מתחילים להתייחס למידע מה CRM ומידע מהאתרים ומידע מהפייסבוק ומידע מהמובייל. לפתע הצרכן שעד רגע מסוים רכזנו לגביו רק מידע דמוגרפי והיסטורי מייצר עבורנו בפעילות הדיגיטלית שלו שכבות מידע חדשות שרק גדלות ומתרחבות.

3. יש לארגון יחידת BI אז הוא ערוך לעולם של Big Data . מדובר בתפיסה שגויה שרצוי לשנות אותה מוקדם ככל האפשר. עולם ה BI עובר מהפכה בשנה האחרונה. מעיסוק בחקר נתונים על בסיס תוצאות העבר הארגון צמא למידע עם מבט לעתיד. למעשה צורת שאילת השאלות בתוך הארגון משתנה ומתמקדת יותר בניסיון לחזות תרחישים עסקיים בעתיד. בעולם ה BI הסטנדרטי אנו עוסקים בשאלות על תוצאות שכבר קרו. כמה מכרנו? איזה מוצרים נמכרו? כמה לקוחות נכנסו לחנות או לסניף? כמה הרווח גדל?

אולם לאור ריבוי המידע הפרסונאלי שהארגון נחשף אליו בפעילות דיגיטלית משולבת עם ניתוח דאטה היכולת של הארגון מתרחבת לשאול שאלות של חיזוי וניבוי: למי נמכור את המוצר הבא? מה המוצר שמתאים לכל לקוח? מי מהלקוחות צפוי לנטוש או מי צפוי להגדיל פעילות? כדי לעבור משאילת שאלות עבר למצב של שאילת שאלות חיזוי ועתיד על יחידת ה BI לעבור טרנספורמציה כולל הערכות והכשרה לכתיבת מודלים/ תחקור בשכבות הדאטה / הצלבות מידע מערוצים שונים /יצירת פרסונאליזציה ותובנות עסקיות על בסיס הדאטה. היכולות הללו משפיעות אף על הגדרת הפונקציות שעוסקות בתחום וההתפתחות שלהן מאנליסטים ל Data.

Scientists .4 השקעות בעולם הדאטה מחייבות תקציבים גדולים ופתרונות מורכבים. ממש לא. שם המשחק הוא Start Small Think Big. עולם הביג דאטה מכיל אינסוף אפשרויות. אינסוף פתרונות. לכל חלק בו יש פתרונות שונים שניתנים ליישום על שרתים בתוך הארגון או בענן. מדובר במנעד רחב של פתרונות מצרכי אחסון דרך שינוע הדאטה ועד יכולת תחקור ועד הגשת הצעת ערך בזמן אמת. חשוב להעזר בגורמים מקצועיים שמכירים מגוון של פתרונות ולא להתרכז ביישום חד מימדי שלרוב נותן מענה חלקי בלבד. וחלקי זה תמיד בסוף יותר יקר …

5. מחסני הנתונים המסורתיים הם פתרון מספק לעולם הביג דאטה. טעות נפוצה. בעולם הדאטה הכנת מחסן נתונים מתאים חשוב לא פחות מאיתור כלי הניטור המתאים או רכישת כלי BI מתקדם. כדי שארגון יהיה ערוך לעידן בו הוא משלב מידע חיצוני ופנימי ומנהל מידע מערוצים דיגיטליים כמו גם ערוצים פיזיים ומנסה להפיק תובנות פרסונאליות על לקוחות עליו לוודא שמחסן הנתונים אליו ירכז את המידע ועליו יתחקרו האנליסטים הוא כזה שעונה לצרכים החדשים ואת אלו ניתן לחלק לחמישה תחומים. על המחסן להיות ערוך להיקפי מידע גדולים (אמרנו Big לא?)

מגוון הפתרונות רחב היקף ולרוב נמצא שארגונים משלבים מחסני נתונים סטנדרטיים עם שכבת אחסון חדשה ומבוזרת הערוכה לניהול מידע רב על המחסן להיות הוליסטי. כלומר כזה שניתן לחבר אליו ערוצים שונים ומקורות שונים במהירות וביעילות. בהקשר זה נצטרך גם להתלבט בהמשך לשאלה העסקית שאנו רוצים לענות עליה מה המקורות שינוטרו , אילו סוגי מידעים יועברו ובאיזו תדירות על המחסן להיות פשוט לטיפול ולתפעול ולתחקור עליו.

לרוב נגלה שפתרונות שעונים לצורך הראשון של גודל המידע מורכבים יותר לתחקור בהם. במקרה כזה נגלה שכבר העברנו וריכזנו מידע אך קשה לטפל בו עקב מגבלות מחסן הנתונים ולכן שווה לתכנן גם את השלב הזה כבר בהתחלה על המחסן להיות מרוענן ומסונכרן עד רמת תדירות של זמן אמת. כמובן הכל תלוי בצורך העסקי שאנו רוצים לענות עליו אבל קל להבין שב 2020 לאחר שנאסוף מידע רב מסנסורים ומעולם ה IOT לא נרצה רק אז לגלות שהמידע מסונכרן מהם למחסן הנתונים רק במהלכים ליילים ולא און ליין …..

והחשוב ביותר – על המחסן להיות מהיר ליישום ולהנגשת המידע. זמן ריצה של שאילתא שבוצעה בתוך הדאטה וכמה קל ומהיר ליישם שינויים בדאטה אלו המרכיבים שיעשו עבורכם את ההבדל בין מחסן נתונים טוב למחסן נתונים מצוין או את ההבדל בין ארגון שמנהל דאטה לבין ארגון שערוך לעידן של ביג דאטה. על כל אלו נמצא שמחסני נתונים מסורתיים מתקשים לענות ולכן חשוב להתפתח מקצועית ולהכיר פתרונות חדשים . אבל על כך ועל עוד היבטים מומלצים בעולם הדאטה העסקי ארחיב בטור הבא.

הכותב הוא אייל בירן – מנכ"ל ושותף בחברת Data Tapas, חברת ייעוץ ושירותים ייחודית שמביאה מגוון פתרונות יצירתיים ומהירים לעולמות הדיגיטל והדאטה. אייל כיהן במספר תפקידים בכירים בבנק לאומי והוביל בשנים האחרונות את עולמות הדיגיטל והדאטה בבנק.

About עומר מילויצקי

אסטרטגיה דיגיטלית שיווקית רב ערוצית | הערכים המקצועיים שמנחים אותי: Smart, Simple & Social.