בתשובה לרון בן-יעקב, 07/08/08 16:56
עזרה 486989
אני מניח שאפשר להמיר את זה ל WAV או פורמט פשוט אחר, ואז לנסות לפצח את זה. עיסוק ליום גשום.
עזרה 486991
תודה. קיוויתי שיש תוכנה שיכולה לעשות את זה בשבילי. פורמט האודיו לא כל כך משנה כי אין בעיה להעביר מפורמט לפורמט. מה שחשוב לי זה קובץ נתונים שמתאר את השינויים לאורך זמן.
עזרה 486995
ברור. אולי יש פונקציות כאילו במטלב.
עזרה 487067
אתה חושב שמטלב יודע לקרא קובצי אודיו?
עזרה 487072
מה הן "נקודות שיא בתדירות כלשהי"? מה האורך הטיפוסי של הקטעים שאתה מעוניין לחקור? אני לא חושב שאני מבין למה אתה רוצה דווקא CSV או טקסט, פורמטים מאוד לא נוחים כשמדובר ב-‏48000 מספרים בכל שנייה. יש כל מיני תוכנות DSP (נניח, SigView) שיאפשרו לך לצפות במידע בשלל דרכים ולבצע פעולות מפעולות שונות, וקשה לי לנחש מה תעשה עם קובץ CSV שלא תוכל לעשות עם תוכנה כזו.

Matlab קוראת קבצי אודיו, בהחלט. Wav ו-au על בטוח, ואולי עוד.
עזרה 487169
אולי אני פשוט אתאר את הבעיה (התגובה הזו היא מיועדת גם בתודה לראובן וצפריר).

יש לי קובץ אודיו ואני רוצה לבדוק אם יש בקטע מסוים שינוי שניתן לכמת אותו. הכוונה לחלק את הקובץ לשלושה קטעים בני 15 או 20 שניות כל אחד ולבדוק אם הקטע האמצעי ניבדל מבחינת האודיו (לא התוכן) משני הקטעים האחרים.

חשבתי שאולי אפשר לעשות את זה ע"י השוואה בין סדרות של דציבל (או מה שזה לא יהיה) בזמן, נניח באינטרוולים של 10 או 100 לשניה. אני לא חושב שצריך 48K סימפולים בשניה. אז פשוט להזין קובץ טקסט של נתונים ל spss או אחר.
עזרה 487179
הקשר בין הערכים הדגומים, בכל תדירות שהיא, לבין חוויית השמיעה הוא עקיף מאוד. רוצה לומר, אם תדגום פעמיים את אותה הקלטה עצמה ותביט במספרים, סביר מאוד שלא תוכל בעין בלתי-מזויינת להבחין שמדובר באותו קטע.

ייתכן שאני לא מבין למה כוונתך ב-"ניבדל מבחינת האודיו (לא התוכן)". אתה מנסה לבדוק האם מי שייצר את קובץ האודיו הזה ביצע ממש העתקה והדבקה של הערכים הדגומים? לצורך זה השיטה שלך תהיה אולי אפקטיבית, אבל לא לשום צורך אחר שאני יכול לחשוב עליו.

אגב, בראשית הפתיל הזכרת קובץ mp3. אם מה שיש בידיך הוא קובץ דחוס בדחיסה lossy (כמו mp3), אז הערכים המספריים שיש בו לא משקפים אפילו את הערכים המספריים של הדגימה המקורית, וגם לאחר פריסה יהיו הבדלים לא מבוטלים בין המספרים.
עזרה 487181
לא. נניח שאני מקליט אותך מדקלם את התגובה הנ"ל ולוקח לך כ 30 שניות לקרוא אותה. אני רוצה לראות אם יש הבדל בין שלושה קטעים בני 10 שניות כ"א. ז"א, נניח שלקראת הסוף אתה מתעייף ומדבר בקול חלש יותר אבל מהר יותר, או אולי עושה הפסקות גדולות יותר בין המילים או המשפטים. מה שהערכים המספריים משקפים, חווית השמיעה, או תוכן הדברים אותם דקלמת לא רלוונטיים. רק אם יש שינויים בהפקת הקול.
עזרה 487184
"חווית השמיעה" היא איך הדברים נשמעים לאוזן האנושית, להבדיל מהמספרים הדגומים עצמם. זה כולל עוצמה ("קול חלש יותר", "הפסקות ארוכות"), תדירות (גובה הקול), וגם דברים מורכבים יותר (והרבה יותר קשים לניתוח) כמו מהירות הדיבור. את אף אחד מהדברים האלה לא תוכל לראות ע"י התבוננות גרידא במספרים הדגומים, לא חשוב באיזה קצב.

מה שתצטרך לעשות הוא דגימה בקצב גבוה ואיזשהו סוג של אנליזה במישור התדר, חיפוש "פסגות" ופורמנטים, והשוואתם בין הקטעים. הפרטים של האנליזה הזו יהיו שונים מאוד בהתאם לאופי ההקלטה (דיבור, שירה, כלי נגינה בודד, תזמורת).

השוואה בין "סדרות של דציבל" (הערכים הדגומים) בקצב של 10 או 100 דגימות בשנייה לא תניב מידע מעניין כלשהו על הפקת הקול, וגם עם דגימות בקצב גבוה לא תוכל לגלות הרבה עם SPSS. דרושים כלים ייעודיים של עיבוד אותות שמע, לא אנליזה סטטיסטית.

אם אתה אכן מתעניין בדיבור (וזו לא היתה סתם דוגמה), ראה למשל כאן:

עזרה 487186
אתה מוכן להרחיב קצת על הפיסקה שמדברת על "סדרות של דציבל" ולמה היא לא תתן מידע מעניין? שוב, אני רוצה לדעת אם בקטע מסוים של ההקלטה יש שינוי בדפוס הדיבור, במיוחד בהשוואה לקטע שקודם לו. יכול להיות שבאמת עוצמה בלבד לא מספיקה וצריך לבדוק גם נניח תדידות.

הקובץ שאני מדבר הוא אכן של דיבור למיקרופון והלינק נראה מעניין, לפחות מהרפרוף החפוז. אמנם הם כותבים על בעיות שבטכניקה הראשונה, אבל אולי אנסה אותה בשביל התרגיל, למרות העבודה ידנית עם כל הבעיתיות שלה.
עזרה 487188
100 דגימות בשנייה של אות שהתדר האופייני הבסיסי שלו (וזה בלי הפורמנטים) הוא בין 100 ל-‏300 מחזורים בשנייה הן סדרה אקראית למדי של מספרים.

[אינטואיטיבית, נסה לחשוב על גל פשוט ביותר (סינוס נקי, נניח 100 מחזורים בשנייה) ושים עליו נקודות המרווחות בערך מחזור בודד. מה מתקבל? מה קורה אם נזיז קצת את תדר הדגימה? אם נזיז קצת את הנקודה בה התחלנו לדגום?]

"שינוי בדפוס הדיבור" הוא מושג רחב מאוד. אם אתה רוצה רק להבחין בין "קול רם" ל-"קול חלש", ייתכן שתוכל לראות זאת ע"י מיצוע של דגימות בקצב נמוך. עדיין, כל תוכנת עיבוד אותות פשוטה תאפשר לך לעשות זאת הרבה יותר בקלות מאשר לטפל בקובצי CSV ע"י SPSS.

כל דבר אחר - שינויים בטון הדיבור, צרידות, עייפות, מספר מילים בדקה, מה שלא יהיה - מחייב דגימה בקצב גבוה, ניתוח תדרים והרבה עבודה נוספת. נסה להקליט את עצמך אומר "האייל הקורא" עשר פעמים רצוף תוך שמירה על גובה, טון, קצב, עוצמה וכו' אחידים ככל הניתן, ואח"כ תסתכל על דיאגרמות תדר מהסוג שיש בקישור הקודם ששלחתי. אני חושב שתמצא המון הבדלים במבנה העדין ובערכים המספריים (גם של הדגימות וגם של התדרים) מהסוג שיבלבל לחלוטין כלי סטנדרטי של ניתוחים סטטיסטיים.
עזרה 487211
תודה על ההסבר.

כן, אני רוצה להבחין בעיקר בין קול רם/חלש, שקט פתאומי או הרמת קול רגעית, נניח בגלל הבעת כאב או צחוק פתאומי (ולא אכפת לי מה גרם לשינוי הרגעי כל עוד אפשר לכמת את קיומו). איזו תוכנת עיבוד אותות יכולה לעשות את זה כך שאפשר יהיה לראות שקטע מסוים אכן שונה במובהק מהקטע שקדם לו בגלל שהוא כולל שינויים כמו הנ"ל?
עזרה 487256
אני מאוד לא מעודכן, וגם כשהייתי קצת יותר מעודכן לא הייתי מומחה. חפש משהו שאפשר להשיג בחינם כמו SFS מהקישור שהבאתי למעלה. סביר שתצטרך לעמול יותר עם תוכנה כזו מאשר עם משהו מהוקצע יותר. יש הרבה פרטים שאני לא מבין עדיין לגבי המטרות שלך - רמת הדיוק והרגישות, המגוון של השינויים שאתה רוצה לזהות - ויש להם השפעה רבה על הגודל של פרוייקט כזה. אם אתה רוצה להקדיש לזה יותר מכמה שעות הייתי ממליץ בחום לחפש מישהו שיודע משהו על speech analysis באוניברסיטה הקרובה למקום מגוריך, או בחברת התוכנה לעיבוד דיבור בה עובדת ידידתך.
עזרה 487301
אם זה בסדר מצדך אשלח לך פרטים באימייל.
עזרה 487364
אתה לא צריך לבקש רשות. שים לב לכתובת הדוא''ל בהודעה הזו.
עזרה 488879
האם קיבלת את האימייל ששלחתי לפני כמה זמן?
עזרה 487215
האם אתה מייצר מקצוע חדש - "אוצר הלחנה"?

חזרה לעמוד הראשי המאמר המלא

מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים