מדען נתונים – Data scientist

מיהו מדען נתונים?

מדען נתונים הוא זן חדש של מומחה נתונים, שיש לו את הכישורים הטכניים לפתור בעיות מורכבות, ואת הסקרנות לחקור ולמצוא אלו בעיות צריכות פתרון. הוא צריך ידע במתמטיקה ובמדעי המחשב לצד כישורים ויכולת לזהות מגמות. מדע הנתונים תפס תאוצה בעשור האחרון עקב ביקוש גובר והולך מצד חברות ועסקים שהצטברו אצלם מאגרי נתונים גולמיים בהיקפים עצומים, ונוצר צורך לעשות בהם סדר, ולמצוא ולנצל את הפוטנציאל הטמון בהם.

הרבה ממדעני הנתונים החלו את הקריירה כסטטיסטיקאים או מנתחי נתונים. עם גדילת חברות נתוני הענק (big data) ועם גדילת מאגרי הנתונים ויכולות העיבוד שלהם, גדל והתפתח התפקיד של מדעני הנתונים. היחס לכל נושא הטיפול בנתונים מצד החברות השתנה בהדרגה ממשהו שמטופל בדרך אגב למשהו שתופס מקום של כבוד. חברות הבינו שבעזרת ניתוח נתונים וסקרנות יצירתית ניתן לתרגם רעיונות משפת ההייטק לדרכים להתפתח ולעשות כסף.

תפקידו של מדען הנתונים

תפקידו של מדען הנתונים לא בהכרח מוגדר בצורה מדויקת, והוא יכול לעסוק במגוון תחומים תחת המטריה של מדע הנתונים. באופן כללי ניתן להניח כי הוא יעסוק באחד או יותר מהתחומים הבאים:

  • איסוף כמויות גדולות של נתונים שאינם מאורגנים וארגונם לכדי פורמט שימושי.
  • פתרון בעיות עסקיות על ידי שימוש בטכניקות ובחשיבה המונעת מתוך הנתונים.
  • עבודה במגוון רחב של שפות תכנות.
  • ביצוע סקרי סטטיסטיקה וניתוח  סטטיסטי.
  • שימוש בטכניקות אנליטיקה כמו ניתוח טקסטים, למידת מכונה (machine learning) ולמידת עומק deep learning)).
  • ניהול תקשורת ושיתופי פעולה עם המחלקות הטכניות והמחלקות העסקיות במקביל.
  • חיפוש היגיון ותבניות בתוך אוסף נתונים, וזיהוי מגמות שיכולות להשפיע על השורה התחתונה של העסק.

לשם ביצוע תפקידיו משתמש מדען הנתונים בכלים ובטכניקות הבאות:

  • הדמיית נתונים (data visualization) – עריכת נתונים באופן כזה שגם מי שלא מכיר את הפרטים יוכל להתמצא בהם. טבלאות, גרפים וכיו"ב.
  • למידת מכונה – ענף של בינה מלאכותית המבוסס על אלגוריתמים מתמטיים ואוטומציה.
  • למידת עומק – למידת עומק- תת תחום של למידת מכונה, בו האלגוריתם מנתח נתונים בכמה שכבות עומק, על מנת להידמות יותר לתהליך חשיבה אנושי, כך שככל שנוספים נתונים המודל נהיה יותר ויותר מורכב, ובהתאמה גם יותר מדויק.
  • זיהוי תבניות – טכנולוגיה שמזהה תבניות בתוך מסד נתונים, לעתים קרובות באה לידי שימוש במקביל ובמקום למידת מכונה
  • הכנת נתונים – תהליך ידני או ממוחשב, בו סורקים את הנתונים הגולמיים, מנקים אותם, מתקנים אותם, מסירים נתונים שאינם רלוונטיים, וכו' כדי להפוך אותם למובנים יותר ונגישים לניתוח.
  • ניתוח טקסט – תהליך שבו בוחנים נתונים שאינם מאורגנים כדי לזהות תובנות עסקיות.

מקצוע מבוקש

מדען נתונים נחשב למקצוע מבוקש המכניס משכורת גבוהה, מה שמושך אליו אנשים מתחומי תעסוקה שונים, בין אם סטודנטים הבוחרים בזה כמקצוע וקריירה, ובין אם אנשים העושים הסבה מקצועית למדעני נתונים. באופן טבעי עוברים מתוך התחום הטכני מנתחי נתונים וסטטיסטיקאים, וגם מתחומים שאינם טכניים בהכרח, כמו כלכלה ועסקים, אנשים נמשכים לתחום מדע הנתונים. המשותף לכולם הוא הצורך לפתור בעיות, הסקרנות להבין איך דברים עובדים ומה מניע אותם, הכורח למצוא תשובות לשאלות, ואף יותר מכך, הצורך לשאול את השאלות הנכונות.


תמונה באדיבות Christina Morillo.

כתיבת תגובה