בחר לך כוון

בתשובה לרון בן-יעקב, 07/08/08 16:56

עזרה

486989

ראובן • בתשובה לרון בן-יעקב

יום ה', 7/8/2008, 17:06

אני מניח שאפשר להמיר את זה ל WAV או פורמט פשוט אחר, ואז לנסות לפצח את זה. עיסוק ליום גשום.

עזרה

486991

רון בן-יעקב • בתשובה לראובן

יום ה', 7/8/2008, 17:09

תודה. קיוויתי שיש תוכנה שיכולה לעשות את זה בשבילי. פורמט האודיו לא כל כך משנה כי אין בעיה להעביר מפורמט לפורמט. מה שחשוב לי זה קובץ נתונים שמתאר את השינויים לאורך זמן.

עזרה

486995

ראובן • בתשובה לרון בן-יעקב

יום ה', 7/8/2008, 17:18

ברור. אולי יש פונקציות כאילו במטלב.

עזרה

487067

רון בן-יעקב • בתשובה לראובן

יום ה', 7/8/2008, 23:39

אתה חושב שמטלב יודע לקרא קובצי אודיו?

עזרה

487072

אלון עמית • בתשובה לרון בן-יעקב

יום ו', 8/8/2008, 0:46

מה הן "נקודות שיא בתדירות כלשהי"? מה האורך הטיפוסי של הקטעים שאתה מעוניין לחקור? אני לא חושב שאני מבין למה אתה רוצה דווקא CSV או טקסט, פורמטים מאוד לא נוחים כשמדובר ב-‏48000 מספרים בכל שנייה. יש כל מיני תוכנות DSP (נניח, SigView) שיאפשרו לך לצפות במידע בשלל דרכים ולבצע פעולות מפעולות שונות, וקשה לי לנחש מה תעשה עם קובץ CSV שלא תוכל לעשות עם תוכנה כזו.

Matlab קוראת קבצי אודיו, בהחלט. Wav ו-au על בטוח, ואולי עוד.

עזרה

487169

רון בן-יעקב • בתשובה לאלון עמית

יום ו', 8/8/2008, 17:26

אולי אני פשוט אתאר את הבעיה (התגובה הזו היא מיועדת גם בתודה לראובן וצפריר).

יש לי קובץ אודיו ואני רוצה לבדוק אם יש בקטע מסוים שינוי שניתן לכמת אותו. הכוונה לחלק את הקובץ לשלושה קטעים בני 15 או 20 שניות כל אחד ולבדוק אם הקטע האמצעי ניבדל מבחינת האודיו (לא התוכן) משני הקטעים האחרים.

חשבתי שאולי אפשר לעשות את זה ע"י השוואה בין סדרות של דציבל (או מה שזה לא יהיה) בזמן, נניח באינטרוולים של 10 או 100 לשניה. אני לא חושב שצריך 48K סימפולים בשניה. אז פשוט להזין קובץ טקסט של נתונים ל spss או אחר.

עזרה

487179

אלון עמית • בתשובה לרון בן-יעקב

יום ו', 8/8/2008, 18:56

הקשר בין הערכים הדגומים, בכל תדירות שהיא, לבין חוויית השמיעה הוא עקיף מאוד. רוצה לומר, אם תדגום פעמיים את אותה הקלטה עצמה ותביט במספרים, סביר מאוד שלא תוכל בעין בלתי-מזויינת להבחין שמדובר באותו קטע.

ייתכן שאני לא מבין למה כוונתך ב-"ניבדל מבחינת האודיו (לא התוכן)". אתה מנסה לבדוק האם מי שייצר את קובץ האודיו הזה ביצע ממש העתקה והדבקה של הערכים הדגומים? לצורך זה השיטה שלך תהיה אולי אפקטיבית, אבל לא לשום צורך אחר שאני יכול לחשוב עליו.

אגב, בראשית הפתיל הזכרת קובץ mp3. אם מה שיש בידיך הוא קובץ דחוס בדחיסה lossy (כמו mp3), אז הערכים המספריים שיש בו לא משקפים אפילו את הערכים המספריים של הדגימה המקורית, וגם לאחר פריסה יהיו הבדלים לא מבוטלים בין המספרים.

עזרה

487181

רון בן-יעקב • בתשובה לאלון עמית

יום ו', 8/8/2008, 19:25

לא. נניח שאני מקליט אותך מדקלם את התגובה הנ"ל ולוקח לך כ 30 שניות לקרוא אותה. אני רוצה לראות אם יש הבדל בין שלושה קטעים בני 10 שניות כ"א. ז"א, נניח שלקראת הסוף אתה מתעייף ומדבר בקול חלש יותר אבל מהר יותר, או אולי עושה הפסקות גדולות יותר בין המילים או המשפטים. מה שהערכים המספריים משקפים, חווית השמיעה, או תוכן הדברים אותם דקלמת לא רלוונטיים. רק אם יש שינויים בהפקת הקול.

עזרה

487184

אלון עמית • בתשובה לרון בן-יעקב

יום ו', 8/8/2008, 19:55

"חווית השמיעה" היא איך הדברים נשמעים לאוזן האנושית, להבדיל מהמספרים הדגומים עצמם. זה כולל עוצמה ("קול חלש יותר", "הפסקות ארוכות"), תדירות (גובה הקול), וגם דברים מורכבים יותר (והרבה יותר קשים לניתוח) כמו מהירות הדיבור. את אף אחד מהדברים האלה לא תוכל לראות ע"י התבוננות גרידא במספרים הדגומים, לא חשוב באיזה קצב.

מה שתצטרך לעשות הוא דגימה בקצב גבוה ואיזשהו סוג של אנליזה במישור התדר, חיפוש "פסגות" ופורמנטים, והשוואתם בין הקטעים. הפרטים של האנליזה הזו יהיו שונים מאוד בהתאם לאופי ההקלטה (דיבור, שירה, כלי נגינה בודד, תזמורת).

השוואה בין "סדרות של דציבל" (הערכים הדגומים) בקצב של 10 או 100 דגימות בשנייה לא תניב מידע מעניין כלשהו על הפקת הקול, וגם עם דגימות בקצב גבוה לא תוכל לגלות הרבה עם SPSS. דרושים כלים ייעודיים של עיבוד אותות שמע, לא אנליזה סטטיסטית.

אם אתה אכן מתעניין בדיבור (וזו לא היתה סתם דוגמה), ראה למשל כאן:

http://www.phon.ucl.ac.uk/resource/sfs/howto/formant...

עזרה

487186

רון בן-יעקב • בתשובה לאלון עמית

יום ו', 8/8/2008, 20:26

אתה מוכן להרחיב קצת על הפיסקה שמדברת על "סדרות של דציבל" ולמה היא לא תתן מידע מעניין? שוב, אני רוצה לדעת אם בקטע מסוים של ההקלטה יש שינוי בדפוס הדיבור, במיוחד בהשוואה לקטע שקודם לו. יכול להיות שבאמת עוצמה בלבד לא מספיקה וצריך לבדוק גם נניח תדידות.

הקובץ שאני מדבר הוא אכן של דיבור למיקרופון והלינק נראה מעניין, לפחות מהרפרוף החפוז. אמנם הם כותבים על בעיות שבטכניקה הראשונה, אבל אולי אנסה אותה בשביל התרגיל, למרות העבודה ידנית עם כל הבעיתיות שלה.

עזרה

487188

אלון עמית • בתשובה לרון בן-יעקב

יום ו', 8/8/2008, 21:00

100 דגימות בשנייה של אות שהתדר האופייני הבסיסי שלו (וזה בלי הפורמנטים) הוא בין 100 ל-‏300 מחזורים בשנייה הן סדרה אקראית למדי של מספרים.

[אינטואיטיבית, נסה לחשוב על גל פשוט ביותר (סינוס נקי, נניח 100 מחזורים בשנייה) ושים עליו נקודות המרווחות בערך מחזור בודד. מה מתקבל? מה קורה אם נזיז קצת את תדר הדגימה? אם נזיז קצת את הנקודה בה התחלנו לדגום?]

"שינוי בדפוס הדיבור" הוא מושג רחב מאוד. אם אתה רוצה רק להבחין בין "קול רם" ל-"קול חלש", ייתכן שתוכל לראות זאת ע"י מיצוע של דגימות בקצב נמוך. עדיין, כל תוכנת עיבוד אותות פשוטה תאפשר לך לעשות זאת הרבה יותר בקלות מאשר לטפל בקובצי CSV ע"י SPSS.

כל דבר אחר - שינויים בטון הדיבור, צרידות, עייפות, מספר מילים בדקה, מה שלא יהיה - מחייב דגימה בקצב גבוה, ניתוח תדרים והרבה עבודה נוספת. נסה להקליט את עצמך אומר "האייל הקורא" עשר פעמים רצוף תוך שמירה על גובה, טון, קצב, עוצמה וכו' אחידים ככל הניתן, ואח"כ תסתכל על דיאגרמות תדר מהסוג שיש בקישור הקודם ששלחתי. אני חושב שתמצא המון הבדלים במבנה העדין ובערכים המספריים (גם של הדגימות וגם של התדרים) מהסוג שיבלבל לחלוטין כלי סטנדרטי של ניתוחים סטטיסטיים.

עזרה

487211

רון בן-יעקב • בתשובה לאלון עמית

שבת, 9/8/2008, 3:14

תודה על ההסבר.

כן, אני רוצה להבחין בעיקר בין קול רם/חלש, שקט פתאומי או הרמת קול רגעית, נניח בגלל הבעת כאב או צחוק פתאומי (ולא אכפת לי מה גרם לשינוי הרגעי כל עוד אפשר לכמת את קיומו). איזו תוכנת עיבוד אותות יכולה לעשות את זה כך שאפשר יהיה לראות שקטע מסוים אכן שונה במובהק מהקטע שקדם לו בגלל שהוא כולל שינויים כמו הנ"ל?

עזרה

487256

אלון עמית • בתשובה לרון בן-יעקב

שבת, 9/8/2008, 19:16

אני מאוד לא מעודכן, וגם כשהייתי קצת יותר מעודכן לא הייתי מומחה. חפש משהו שאפשר להשיג בחינם כמו SFS מהקישור שהבאתי למעלה. סביר שתצטרך לעמול יותר עם תוכנה כזו מאשר עם משהו מהוקצע יותר. יש הרבה פרטים שאני לא מבין עדיין לגבי המטרות שלך - רמת הדיוק והרגישות, המגוון של השינויים שאתה רוצה לזהות - ויש להם השפעה רבה על הגודל של פרוייקט כזה. אם אתה רוצה להקדיש לזה יותר מכמה שעות הייתי ממליץ בחום לחפש מישהו שיודע משהו על speech analysis באוניברסיטה הקרובה למקום מגוריך, או בחברת התוכנה לעיבוד דיבור בה עובדת ידידתך.

עזרה

487301

רון בן-יעקב • בתשובה לאלון עמית

יום א', 10/8/2008, 6:39

אם זה בסדר מצדך אשלח לך פרטים באימייל.

עזרה

487364

אלון עמית • בתשובה לרון בן-יעקב

יום א', 10/8/2008, 20:04

אתה לא צריך לבקש רשות. שים לב לכתובת הדוא''ל בהודעה הזו.

עזרה

488879

רון בן-יעקב • בתשובה לאלון עמית

יום א', 31/8/2008, 8:47

האם קיבלת את האימייל ששלחתי לפני כמה זמן?

עזרה

487215

האייל האלמוני • בתשובה לרון בן-יעקב

שבת, 9/8/2008, 6:22

האם אתה מייצר מקצוע חדש - "אוצר הלחנה"?

חזרה לעמוד הראשי

המאמר המלא

מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים
RSS מאמרים \| כתבו למערכת \| אודות האתר \| טרם התעדכנת \| ארכיון \| חיפוש \| עזרה \| תנאי שימוש והצהרת נגישות	© כל הזכויות שמורות