|
||||
|
||||
בכל חברה ואפילו בכל פרוייקט זה אחרת, אבל באופן כללי, בונים מערכות המסוגלות לאחזר נתונים, לבנות על גביהם מודלים סטטיסטיים ולקבל החלטות בהתאם למודלים אלו. דוגמא 1: מערכת לסיווג טקסט מקבלת מסמך (למשל ידיעה חדשותית), קובעת באיזה נושא הוא עוסק (חקלאות) ובהתאם לזאת מפנה אותו לבעלי העניין (אנשי יח"צ של איגוד החקלאים). במקרה זה אין צורך ליצור מודל באופן רציף. דוגמא 2: מערכת Real Time Bidding מקבלת בקשה להצעת מחיר עבור הזכות להציג מודעה באפליקציה ידועה שפתח באותו רגע משתמש ידוע. המודל מחשב, עבור כלל המפרסמים עבורן יש לחברה הסכמים מה הסיכוי להקלקה עבור כל אחת מן המודעות הפוטנציאליות ומציע את המכפלה המקסימלית של סיכוי בתיגמול שתקבל החברה מן המפרסם עבור הקלקה עבור הצגת מודעה. במקרה שישנה זכיה, הוא גם יכול לבדוק אם היתה בפועל הקלקה או שלא, ומוסיף מידע זה כדי לאמן מודל חדש (בזמן אמת או פעם בכמה זמן). דוגמא 3: ה-data scientist יוצר מודל Deep Learning שבהינתן קטע טקסט מזהה את השפה ומתרגם את הקטע לאנגלית (או לג'יבריש, אותו כסף :) דוגמא 4: ה-data scientist יוצר מודל שמזהה מאפייני גלישה של משתמשים נורמטביים ומתריע ברגע שהסיכוי לאנושיות נורמטיבית נמוך מסף מסויים (חשש לבוט). כשאני צריך להסביר מה אני עושה אני מתאים את התשובה לידע של השואל. לפעמים אני עונה "מלמד מחשבים איך ללמוד בעצמם", בידיעה שזה מה שיעבור להם בראש, לפעמים "בינה מלאכותית" ולפעמים "מתכנת מחשבים". |
|
||||
|
||||
בקיצור, מהנדס אלגוריתמים בתחום של למידה ממוחשבת. או יותר בקיצור, אלגוריתמאי למידה ממוחשבת,ML algorithms engineer בלעז. |
|
||||
|
||||
אלא שהרבה פעמים data scientists לא עושים שום דבר שדומה להנדסת אלגוריתמים. לעיתים קרובות (אולי בדרך כלל) העבודה שלהם כוללת בעיקר ניתוח נתונים ובניית מודלים (מתמטיים וסטטיסטיים) סביבם. לפעמים הם אפילו מתכננים ועורכים ניסויים. דווקא די סביר לתאר עבודה כזו כ-"מדע". בכל מקרה, כנראה שעם הזמן תעמיק הדיפרנציאציה בין סוגים שונים של data science, והתיחום בין תת-ההתמחויות השונות יעבור סטנדרטיזציה שתביא עימה אוסף חדש של titles מעצבנים. יש למה לחכות. |
|
||||
|
||||
בתור אלגוריתמאי מזה לא-נעים-להודות-כמה-שנים, חלק ניכר וקריטי מעבודתי הוא ניתוח נתונים, בניית מודלים (צתמטיים, פיזיקליים וסטטיסטיים), וגם ערכית ניסויים במערכות שונות כדי לבחון התאמה למודלים הנ''ל. אני מאד מוחמא מלהתקרא ''מדען'', אבל בכל זאת... |
|
||||
|
||||
**אני מודע לזה שיש אמביגיואיטי נפוץ שמאחד תחתיו 'אלגוריתמאים', שחלק ממה שמבדיל בין שתי הקבוצות זה שאחת מהן יודעת לעשות אלגוריתמים על גרף והשנייה יודעת לייצר גרפים בפייתון או Matlab (אבל יודעת לעשות FFT וטרנספורמציות, נניח). |
|
||||
|
||||
כמה הצעות: כוהן נתונים - data priest שר נתונים - data lord גנן נתונים - data gardner |
|
||||
|
||||
החלק של ה-data הוא מרכיב גדול, בעיקר כשמדובר בסביבה רבת נתונים, רבת משתנים, לעיתים כאוטית. כל הסיפור של איסוף נתונים, ארגון, חיבור מקורות מידע, ניקוי ועיבוי נתונים, הבנה של הנתונים בהקשר של הנושא הנבדק, סינון ובחירה של נתונים רלוונטיים וכו'. |
חזרה לעמוד הראשי | המאמר המלא |
מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים | |
RSS מאמרים | כתבו למערכת | אודות האתר | טרם התעדכנת | ארכיון | חיפוש | עזרה | תנאי שימוש | © כל הזכויות שמורות |