|
||||
|
||||
מה ההבדל בין "להביא לגידול במספר הסטודנטים הלומדים במוסדות המתוקצבים במקצועות הרלוונטיים להיי־טק" לבין "להביא לגידול במספר הלומדים במדעי הנתונים". אני גם לא יודע למה "מדעי הנתונים" ברבים. |
|
||||
|
||||
מדעי הנתונים: Data science באנגלית. תת תחום של מדעי המחשב שעוסק בניתוח נתונים בעזרת שיטות סטטיסטיות, כריית מידע, למידה ממוחשבת ועוד מריעין בישין. תרגום לא מוצלח. אבל גם ײמדעי המידעײ נשמע רע. ובעצם גם Data science זו לא הברקה.. יש למישהו הצעה טובה יותר? אני מבטיח להעביר את המוצלחות לײמדעני הנתוניםײ שאני מכיר. |
|
||||
|
||||
נדמה לי שמה שהטריד אותו זה ''מדעי'' ולא ''הנתונים'' |
|
||||
|
||||
אכן. |
|
||||
|
||||
"מדעי המחשב" לא מטריד אותך? |
|
||||
|
||||
''אולי נישא ושולחני'' נשמע כמו פסוק. |
|
||||
|
||||
נשמע כמו עברית של בית שני. גם מאתר ההקשרים המקראיים הזה לא מצא שום דבר על זה. |
|
||||
|
||||
אולי צדקת ממני ושולחני |
|
||||
|
||||
בשפה מקראית: שִׁבְעִים מְלָכִים בְּהֹנוֹת יְדֵיהֶם וְרַגְלֵיהֶם מְקֻצָּצִים הָיוּ מְלַקְּטִים תַּחַת שֻׁלְחָנִי כַּאֲשֶׁר עָשִׂיתִי כֵּן שִׁלַּם לִי אֱלֹהִים. |
|
||||
|
||||
יש לאלהים צורות תשלום מוזרות: 70 מלכים עם בהונות קצוצות, 72 בתולות בגן עדן... אני מעדיף פנסיה תקציבית. |
|
||||
|
||||
70 מלכים וגו זה לא התשלום, זה המוצר |
|
||||
|
||||
היום היו קוראים להם ראשי רשויות מקומיות, וזה היה הופך את כל העסק להרבה הרבה יותר קריפי. |
|
||||
|
||||
דה, כולנו מעדיפים פנסיה תקציבית. כמה חבל שזה לא בר קיימא מבחינה אקטוארית. |
|
||||
|
||||
אלהים לא מתעסק באקטואריה. הוא פוקד עוון אבות על בנים, על שילשים ועל ריבעים. דומה יותר לריבית שגובה טוני סופרנו. |
|
||||
|
||||
אח, אנלוגיה נהדרת. |
|
||||
|
||||
בואו נשים זאת על השולחן - אם אתה כבר לא באקדמיה, אתה עוסק ב'הנדסת מידע' ולא בשום מדע. ואין בזה רע, גם עיבוד תמונה, עיבוד אותות וחבריהם הם ענפי הנדסה מכובדים בעלי מסורת של מאה שנה עוד מעט. |
|
||||
|
||||
השם "הנדסת מידע" שמור לתחום אחר מ-data science. מהנדסי מידע, או מהנדסי נתונים, הם המהנדסים שבונים את התשתית לעיבוד, הפצה ואכסון מידע. הניתוח של המידע, והאלגוריתמיקה שמבוססת עליו -הם מחוץ לתחום שלהם. |
|
||||
|
||||
הבעייה היא שגם 'ניתוח נתונים' כבר תפוס, וכבר לא נותרו הרבה אפשרויות. אולי נחזור קודם לבסיס - מה בכלל עושים באמת Data scientists? |
|
||||
|
||||
בכל חברה ואפילו בכל פרוייקט זה אחרת, אבל באופן כללי, בונים מערכות המסוגלות לאחזר נתונים, לבנות על גביהם מודלים סטטיסטיים ולקבל החלטות בהתאם למודלים אלו. דוגמא 1: מערכת לסיווג טקסט מקבלת מסמך (למשל ידיעה חדשותית), קובעת באיזה נושא הוא עוסק (חקלאות) ובהתאם לזאת מפנה אותו לבעלי העניין (אנשי יח"צ של איגוד החקלאים). במקרה זה אין צורך ליצור מודל באופן רציף. דוגמא 2: מערכת Real Time Bidding מקבלת בקשה להצעת מחיר עבור הזכות להציג מודעה באפליקציה ידועה שפתח באותו רגע משתמש ידוע. המודל מחשב, עבור כלל המפרסמים עבורן יש לחברה הסכמים מה הסיכוי להקלקה עבור כל אחת מן המודעות הפוטנציאליות ומציע את המכפלה המקסימלית של סיכוי בתיגמול שתקבל החברה מן המפרסם עבור הקלקה עבור הצגת מודעה. במקרה שישנה זכיה, הוא גם יכול לבדוק אם היתה בפועל הקלקה או שלא, ומוסיף מידע זה כדי לאמן מודל חדש (בזמן אמת או פעם בכמה זמן). דוגמא 3: ה-data scientist יוצר מודל Deep Learning שבהינתן קטע טקסט מזהה את השפה ומתרגם את הקטע לאנגלית (או לג'יבריש, אותו כסף :) דוגמא 4: ה-data scientist יוצר מודל שמזהה מאפייני גלישה של משתמשים נורמטביים ומתריע ברגע שהסיכוי לאנושיות נורמטיבית נמוך מסף מסויים (חשש לבוט). כשאני צריך להסביר מה אני עושה אני מתאים את התשובה לידע של השואל. לפעמים אני עונה "מלמד מחשבים איך ללמוד בעצמם", בידיעה שזה מה שיעבור להם בראש, לפעמים "בינה מלאכותית" ולפעמים "מתכנת מחשבים". |
|
||||
|
||||
בקיצור, מהנדס אלגוריתמים בתחום של למידה ממוחשבת. או יותר בקיצור, אלגוריתמאי למידה ממוחשבת,ML algorithms engineer בלעז. |
|
||||
|
||||
אלא שהרבה פעמים data scientists לא עושים שום דבר שדומה להנדסת אלגוריתמים. לעיתים קרובות (אולי בדרך כלל) העבודה שלהם כוללת בעיקר ניתוח נתונים ובניית מודלים (מתמטיים וסטטיסטיים) סביבם. לפעמים הם אפילו מתכננים ועורכים ניסויים. דווקא די סביר לתאר עבודה כזו כ-"מדע". בכל מקרה, כנראה שעם הזמן תעמיק הדיפרנציאציה בין סוגים שונים של data science, והתיחום בין תת-ההתמחויות השונות יעבור סטנדרטיזציה שתביא עימה אוסף חדש של titles מעצבנים. יש למה לחכות. |
|
||||
|
||||
בתור אלגוריתמאי מזה לא-נעים-להודות-כמה-שנים, חלק ניכר וקריטי מעבודתי הוא ניתוח נתונים, בניית מודלים (צתמטיים, פיזיקליים וסטטיסטיים), וגם ערכית ניסויים במערכות שונות כדי לבחון התאמה למודלים הנ''ל. אני מאד מוחמא מלהתקרא ''מדען'', אבל בכל זאת... |
|
||||
|
||||
**אני מודע לזה שיש אמביגיואיטי נפוץ שמאחד תחתיו 'אלגוריתמאים', שחלק ממה שמבדיל בין שתי הקבוצות זה שאחת מהן יודעת לעשות אלגוריתמים על גרף והשנייה יודעת לייצר גרפים בפייתון או Matlab (אבל יודעת לעשות FFT וטרנספורמציות, נניח). |
|
||||
|
||||
כמה הצעות: כוהן נתונים - data priest שר נתונים - data lord גנן נתונים - data gardner |
|
||||
|
||||
החלק של ה-data הוא מרכיב גדול, בעיקר כשמדובר בסביבה רבת נתונים, רבת משתנים, לעיתים כאוטית. כל הסיפור של איסוף נתונים, ארגון, חיבור מקורות מידע, ניקוי ועיבוי נתונים, הבנה של הנתונים בהקשר של הנושא הנבדק, סינון ובחירה של נתונים רלוונטיים וכו'. |
|
||||
|
||||
לפני המון שנים היתה כתבה עם הגדרות משעשעות של מקצועות IT. זה היה ב- Datamation (ז"ל בדפוס) או אולי Computerworld. אז רק התחיל העסק הזה עם בסיסי נתונים, ובהגדרה של DBA היה כתוב משהו כמו אף אחד לא יודע מה הוא עושה אבל אף אחד לא יכול להרשות לעצמו שלא יהיה לו אחד כזה. |
חזרה לעמוד הראשי | המאמר המלא |
מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים | |
RSS מאמרים | כתבו למערכת | אודות האתר | טרם התעדכנת | ארכיון | חיפוש | עזרה | תנאי שימוש | © כל הזכויות שמורות |