|
||||
|
||||
הפורמט הזה, אם אכן יצליח, לא יעשה זאת בזכות האיכות שלו, אלא בזכות הפרסום לו זכה. מרחב דינמי של 24bit אכן מועיל מאד (כבר כיום משתמשים ב-24 כאשר מעבדים את השירים לפני הורדתם ל-16 ב-CD רגיל, ולדבר יתרונות רבים). אבל 96KHz הוא כבר מיותר לחלוטין - גם 48KHz מספיק (פורמט קיים כיום, להבדיל מ-44.1KHz של ה-CD הנוכחי). בזבוז נוראי של מקום. באשר לסאונד היקפי וכו': מי שישתמש ברמקולים היקפיים הנפוצים כיום להאזנה ל-DVD יזכה לחוויה מוסיקלית מפוקפקת למדי. כדי להאזין למוסיקה רב-ערוצית כהלכתה צריך ארבעה רמקולים *זהים* ולעתים גם סב-וופר. ודאי לא הצ'יקמוקים העלובים שנמכרים כיום בתור רמקולי סראונד. גם מגברי הערוצים של היום לא ממש מתוכננים להעברת מוסיקה רב ערוצית באמת. הגישה הנוכחית היא "סטראו+אפקטים", להבדיל מ"רב ערוצי מלא" (4-7 ערוצים). כל זה לא יפריע לחברות למכור לכם פטנטים מפוקפקים ואופנתיים מאד, כמובן. אני חוזה פופולאריות רבה למוצרים הנ"ל. למרבה הצער. |
|
||||
|
||||
ומה אם המוזיקה הרב-ערוצית *תוכננה* לשני רמקולים צדדיים, רמקול מרכזי, ושני רמקולים אחוריים קטנים/חלשים יותר? נדמה לי שבזאת אנו עוסקים. |
|
||||
|
||||
הוא לא מוסיקה רב-ערוצית אמיתית. בדיוק כפי שבמוסיקה סטראופונית אמיתית לא יעלה על דעתך לקנות רמקול שונה לכל צד. במצב הקיים כיום, תחום התדרים של הרמקולים "האחוריים" מוגבל, וכתוצאה לא ניתן להגיע למיצוי מלא של ריבוי הערוצים. ביחוד אמור הדבר ביצירות חדשות, שיסתמכו (אולי) על הפורמט החדש. לדוגמה, נניח שהיוצר רוצה שכלי מסוים ינוע במרחב הדמיוני. כיום, בסטראו, הוא מזיז את בקרת ה-Panning לאחד הצדדים, מתוך ידיעה ברורה שהצליל ישאר זהה במהותו בשני רמקולי הסטראו. אך מה יקרה כאשר הוא ינסה לעשות את אותו דבר בציר קדימה-אחורה במערכת היקפית קיימת? צליל הכלי ישתנה באופן לא טבעי, בדרך כלל גם לא מחמיא. כמובן שאין כל דרך לפצות על כך באולפן - אין ליוצר כל דרך לדעת אילו רמקולים יש לך בבית. הדבר היחיד עליו הוא יכול להסתמך הוא *הזהות* בין הרמקולים. אם יש למישהו כאן אפשרות, אני מציע ניסוי קטן: נגנו שיר מסוים בסטראו דרך שני הרמקולים הראשיים שלכם בלבד. כעת הקשיבו לו *רק* דרך רמקולי ה"סראונד". בדיוק. הבנתם. |
|
||||
|
||||
כשאני מאזין למוזיקה, בדרך כלל אני פונה דווקא לעבר רמקולי הסראונד, ולא לעבר הרמקולים הקדמיים (מטעמי נוחות גיאוגרפית של החדר שלי). כמובן שאני גם דואג להגביר בהתאמה את הרמקולים האחוריים. אני לא מבחין בהבדל כלשהו בין זה לבין האזנה ''רגילה''. |
|
||||
|
||||
תנסה, בדיוק כפי שתוכל, ללא מאמץ רב, להבחין בין שיר המושמע במונו לכזה המושמע בסטראו. אין לי מושג לגבי המערכת הספציפית או החדר הספציפי שלך, אבל הבדל קיים, בזאת אני בטוח. |
|
||||
|
||||
הגדלתי ועשיתי, וחיברתי מחדש את הרמקולים שלי, כך שאלו ששימשו לסראונד היו מחוברים כרמקולים קדמיים ולהפך. לא הרגשתי הבדל באיכות המוזיקה. אני נאלץ להסיק מכך שכל חמשת הרמקולים שלי הם זהים (חוץ מאורך הכבל). מכיוון שמדובר במערכת מצ'וקמקת וזולה (יחסית, משהו כמו 1500 ש"ח לכל העסק), אינני מבין על מה הטענות. הבעיה היחידה אצלי היא המיקום של הרמקולים, אבל זו כבר בעיה גיאוגרפית ולא טכנולוגית. |
|
||||
|
||||
אם יותר מכמה שניות - מה גורם לך לחשוב שאתה אכן מסוגל להשוות? מצד שני, כאשר אתה שומע את המוסיקה בזמן אמיתי ואחד הכלים נודד מרמקול אחד למשנהו, או אז גם אתה תבחין בהבדל. |
|
||||
|
||||
למה אתה בכלל שומע מוזיקה דרך הרמקולים האחוריים, ומה בדיוק מושמע דרכם? לרוב כששומעים מוזיקה, עדיף להגיד למגבר שיפסיק עם השטויות שלו. הרי ההבדל בין "אולם קונצרטים וינה א"' לבין "מועדון ג'ז ניו-אורלינס ג"' הוא בעיקר במידת העצבון שהם גורמים לך אם אתה לא יושב *בול* באמצע ואם לא כיוונת את ההשהיה בין הרמקולים הקדמיים לאחוריים בדיוק כמו שצריך. לכן גם כשבונים מערכת קולנוע ביתי משקיעים יותר ברמקולים הקדמיים - כי את המוזיקה שאתה שומע אתה שומע מהם. |
|
||||
|
||||
מוזיקה אני שומע בלי אפקטים מיותרים. מה שבוקע מהרמקולים האחוריים, עד כמה שאני מסוגל להבחין, הוא בדיוק מה שבוקע מהקדמיים. הסיבה להיפוך, כאמור, היא נוחות גיאוגרפית1. אגב, האם זה נכון שככצופים בסרט בסראונד המוזיקה בוקעת מהרמקולים האחוריים, או שזה הדמיון שלי? 1 כשאני צופה בסרט או משחק במחשב או אכפת לי לשבת על כיסא מול המסך. כשאני שומע מוזיקה, אני אוהב לקפץ, מה שמצריך שימוש בחלק ה(יחסית)פנוי של הרצפה שלי. |
|
||||
|
||||
מה דינמי במרחב של ה24 ביט? עושים המרת A/D שונה לכל שיר? |
|
||||
|
||||
אם שאלת "מה טוב ב-24BIT", התשובה היא: מרחב דינמי גדול יותר - רזולוציה גבוהה יותר של הייצוג הדיגיטלי של הצליל. גם במקרים בהם התוצאה הסופית היא 16BIT, חומר שהוקלט, מוקסס ומוסטר ב-24BIT ישמע טוב יותר. |
|
||||
|
||||
הקלטה: המרת צליל לייצוג אנלוגי (ע"ג סרט מגנטי) או דיגיטלי (ע"ג סרט, CD או מחשב). לצורך הדיון כאן מדובר בהקלטת הכלים השונים של יצירה מוסיקלית. כל כלי כזה זוכה ל*ערוץ* משלו. מיקס: שילוב כל הערוצים לכלל יצירה שלמה. קביעת העוצמה (Volume) והצידוד (Panning) של כל ערוץ, כמו גם האפקטים דרכם הוא עובר (כדוגמת EQ, Reverb, Delay, Compressor, Chorus, Distortion וכו'). התוצר הסופי של תהליך המיקס הוא השיר/קטע כולו בסטראו (כלומר, שני ערוצים: Left ו-Right). המיקס העתידי בו דובר במאמר יכיל יותר מסטראו, כמובן. משהו כמו Left, Right, RearLeft, RearRight, Center ואולי גם MidLeft ו-MidRight. בכל מקרה, הפואנטה היא זו: התוצר של תהליך המיקס הוא במידה רבה השיר הסופי, ולא ניתן לשנות בו את העוצמות והכוונונים של הכלים. מסטרינג: תהליך עיבוד המתבצע על גבי התוצר של המיקס על מנת לתת לו מעין "פיניש". בתהליך זה בדרך כלל מוגברת מאד העוצמה הכללית של השיר, מבוצע EQ מתקן כלשהו (תדרים מסוימים מונמכים או מוגברים לפי הצורך), ולעתים ננקטים צעדים נוספים. המסטרינג הוא התהליך האחרון בהחלט שעובר שיר בטרם השמעתו. זהו. רק למקרה ש. |
|
||||
|
||||
לא לא, שאלתי מה *דינמי* בתחום. למה קראת לזה "מרחב דינמי של 24 ביט". בניגוד לסתם מרחב, או מרחב סטטי. האם אתה מחליט מה אומרת כל רמת ייצוג דיגטלית כל פעם מחדש? |
|
||||
|
||||
אנו (הסאונדמנים, אמר והוציא סיגר) קוראים לו מרחב דינמי לא בגלל הדינמיות שלו אלא בגלל הדינמיות המוסיקלית שהוא מאפשר. |
|
||||
|
||||
אני לא בטוח שאתה צודק. קיצוץ לא מוצלח של חומר מ-24 סיביות לחומר של 16 סיביות יישמע גרוע יותר מאשר חומר שהוקלט היישר ל-16 סיביות. קלייב קסלר (כתב ב-Stereophile) תהה כיצד ייתכן שקלטות שהועתקו מתקליטורים נשמעו טוב יותר בווקמן שלו מעאלו שהועתקו מתקליטי ויניל. ההסבר שלו: התקליט הכיל מידע מורכב יותר ש"העמיס" על הקלטת לעומת המידע הפשוט יותר שבא מהתקליטור. |
|
||||
|
||||
אני מוסיקאי ואיש סאונד, ואני עוסק בהקלטות באופן מקצועי. כשאני מדבר כאן על הנושא, אני מדבר מנסיון. כעת: קיצוץ לא מוצלח אכן ישמע רע, ולכן דואגים לעשות קיצוץ *מוצלח*. תוצאותיו של הקיצוץ המוצלח נשמעות יותר טוב מחומר שעובד כולו ב-16BIT. זו לא דעה - זו *עובדה*. באשר להשערתו של מר קסלר, הרי שאני מוצא אותה אידיוטית במקרה הטוב. קלטת, בדיוק כתקליט, היא אמצעי אחסון *אנלוגי*. הקלטות שהועתקו מתקליטורים ישמעו טוב יותר בגלל אחת מהסיבות הבאות: א. תקליטים שחוקים ב. פטיפון מאיכות נמוכה ג. מגבר פטיפון מאיכות נמוכה ד. אי התאמה בין הפטיפון/מגבר הפטיפון למגבר הסטראו או לטייפ ה. עוצמה - בדרך כלל, בהעברה ל-CD, משתדלים להגביר את עוצמת הצליל ככל האפשר. אם מר קסלר השתמש באותו ווליום הקלטה לגבי תקליט ולגבי CD, הרי שההקלטות מה-CD ישמעו חזקות יותר ועל כן "טובות" יותר. זהו. לא עומס ולא בטיח. יתכבד מר קסלר ויקנה לעצמו פטיפון משובח וגם, אם אפשר, מוח משומש במצב טוב. |
|
||||
|
||||
אני אמנם לא איש סאונד, אבל איש עיבוד אותות אני כן, ואם מה שאתה אומר זו עובדה, אז המדובר בסתם מגבלה הנובעת מהפרקטיקה ההנדסית, לא מהתאוריה שלה. הרי גם את ה24 ביט קיבלת מאות אנלוגי, ואם במקום לעשות את הדרך אנלוגי-> 24 ביט -> 16 ביט, היית עובר ישירות מאנלוגי ל16 ביט, והיית עובד נכון, הדרך השנייה עדיפה או שווה לראשונה, בכל מובן יחיד שתבחר. כשאני כותב בכל מובן יחיד, הכוונה היא אם הקריטריון ל"מה זה טוב" שלך קבוע (לדוגמא, MMSE - מינימום שגיאה ריבועית, הוא קריטריון מקובל בעיבוד אות. פחות מקובל בעיבוד תמונה, ולא יודע איך זה בעיבוד צליל). אולי יש היום איזה מגבלת ציוד, אבל אין שום מניעה תאורטית או מעשית להצליח ישירות ב16 ביט כל מה שאתה מצליח ב24 ביט ומעביר ל16. |
|
||||
|
||||
במחשבה שנייה, אני חוזר בי. יש מניעה מעשית, ואכן עדיף לעבוד קודם ב24 ביט. כשכתבתי את ההודעה שלי קודם, הנחתי שיש לך את האות האנלוגי מראש, ואז אתה מחליט איך לעשות את הקוונטייזר (ה A/D שלך). אבל בעצם בסאונד זה בעייתי, כי שאתה מקליט אתה לא יודע מראש את פילוג האות שלך, ולא יכול להחליט על קוונטיזציה אופטימלית. וכל מדיה של שמירה אנלוגית תוסיף בעצמה עוד רעש. כך שבאמת עדיף קודם לשמור הכל ב24 ביט, שבהשוואה ל16 ביט זה אות כמעט רציף, ואז להחליט איך לעבד. |
|
||||
|
||||
האות לא סתם *מוקלט* - הוא גם צריך לעבור *עיבוד*. ופונקציות העיבוד עובדות טוב יותר ברזולוציה גבוהה יותר. חשוב על כך באופן זה: נניח שקיימים שני ערוצים וצריך לבצע מיקס (ראה בעניין זה הודעתי מלמעלה). נניח שבמיקס אתה מעוניין להנמיך את אחד הערוצים. מה פירוש להנמיך, במדיום הדיגיטלי? נכון - להוריד את מספר הביטים, את הרזולוציה. אופס! נניח, לחילופין, שאתה מעוניין להגביר תדר כלשהו (לבצע EQ). כדי לעשות זאת אתה חייב Headroom, אחרת תקבל Clipping. וב-24BIT יש לך הרבה יותר Headroom. |
|
||||
|
||||
כן, למרות שדווקא את כל פעולות עיבוד האות דווקא עדיף (מבחינת טיב) לעשות באנלוגי. קודם לעבד ואז לדגום. כמובן, שמחינה פרקטית עיבוד דיגיטלי הרבה יותר גמיש, ולא תלוי בפרמטרים של המעבד האנלוגי שבנית (גיל הרכיבים, אצוות הייצור וכד'), כך שבוחרים בו, אבל זה לא עניין של טיב. |
|
||||
|
||||
שאלת תם: יש איזה סיבה שעובדים בדיגיטיזציה FIXED POINT ולא FLOATING POINT ? נקודה צפה תפתור את הבעיות של התחום הדינמי, לא? |
|
||||
|
||||
וודאי שיש. הרי כשאתה בא לייצג משהו דיגיטלי, ובוא ניקח תמונת רמות אפור לשם הפשטות, הרי שראשית אתה אמור להחליט על טווח הייצוג - מה זה ''לבן'' ומה זה ''שחור''. אם הטווח שלך לא חסום, אז אין לך לבן (מקובל שלבן זה הערך העליון). |
|
||||
|
||||
אם אני מבין נכון, לבן זה כמות האור המקסימלית שהמסך יכול להנפיק. באודיו זה כמו האמפליטודה המקסימלות של הרמקולים(?) . האם הבעיה היא לזהות מהו הערך הזה ולכייל את המדידות כך ש 24^2 זה הערך הזה? אני חשבתי שהבעיה היא שאפילו אם זה ידוע, רוב האקשן זה בערכים הרבה יותר נמוכים ( כמו למשל 12^2 ) ולכן מפסידים רזולוציה? אם צריך כאן קורס שלם בחקר אותות אז אני מוותר, אבל אם יש הסבר יחסית קצר, אשמח לקבלו. |
|
||||
|
||||
אני חושב שהבעייה היא שלי. הייתי צריך לברר למה אתה מתכוון בנקודה צפה מול לא. כשאני אומר "נקודה צפה" אני מתכוון שעם מספר ביטים (בדרך כלל 32) אפשר לייצג ערך לא חסום (כמעט) ע"ח הדיוק. למה זה אמור לעזור לך יותר מהערך הרגיל של הביטים הללו? מספר הקומבינציות של אחדים ואפסים נשאר קבוע. בעייה של דגימה, בניסוח מתמטי, היא בעייה של העתקה מקטע ממשי, נאמר [0,1], למספר סופי של רמות, נאמר 256. בבעייה כזו, אתה צריך להחליט שני דברים - איפה מחליטים לעבור רמה, ומה מייצגת כל רמה כזו. לדוגמא, עבור דגימת תמונת רמות אפור לביט בודד, בצורה נאיבית, היית יכול לבחור שכל הערכים עד חצי עוברים לאפס, וכל הערכים מחצי לאחד עוברים לאחד. בנוסף היית יכול לומר שאפס פרושו רמת אפור של 0 (שחור), ו1 פרושו הצגה של 1 (לבן), נגיד. אבל אז תקבל תמונה מאד חדה, ולא נעימה לעין, אז אולי עדיף להחליט ש0 פרושו 1/4 (אפור כהה) ו1 פרושו 3/4 (אפור בהיר)? אולי יש לך מעט מאד נקודות עם רמת אפור גבוהה מ1/2, ולכן עדיף להחליט שכל מה שגבוה מ0.4 הוא דווקא 1, כדי לקבל תמונה ברורה יותר? והמשחק הזה הוא המשחק שמשחק הדוגם שלך. אם יש לך הרבה נקודות בערכים נמוכים, פשוט תקדיש להם הרבה רמות החלטה, ולא תהיה בעייה של רזולוציה. אבל, כל זה נכון רק אם אתה יודע מראש איך מפולג האות (איפה האקשן), ולכן עדיף לך לשמור אותו קודם ב24 ביט, בלי לשחק משחקים, ולקוות שאתה לא מאבד הרבה, ואז למצוא את הייצוג הטוב ביותר. |
|
||||
|
||||
אנחנו מסכימים בדבר ההגדרה של נקודה צפה- X ביטים מגדירים את המעריך והשאר, 32 - X, מתאר את המנטיסה. היופי בנקודה צפה זה שהדיוק היחסי נשאר לכל אורך הסקלה- בשיטת הנקודה הקבועה , אם עובדים ברזולוציה של 24 ביט ליד הקצה התחתון, ומודדים ערך של 5 , כל שגיאת עיגול תקפיץ את האות ב 20% ( 6 ל5 ). לעומת זאת, בנקודה צפה, הדיוק היחסי הוא כגודל המנטיסה לכל אורך הסקלה. נכון הדבר שבנקודה צפה אינך יכול להבדיל בין מיליון ומליון ואחד, אבל למי איכפת? לפחות אפשר להבחין בין אחד לשניים. אני עדיין חושד שהסיבה היא יותר פרוזאית - החומרה לעיבוד אות עובד ב אינטיגר. |
|
||||
|
||||
אז לא התנסחתי בבהירות מספקת. נעבוד שנייה ב8 ביט. החלטנו כבר שFF זה לבן, ו00 שחור.אף אחד לא אמר שההבדל שתראה בין 00 ו01 זהה להבדל בין 01 ו02 - ייתכן ש01 מייצג שחור-פחות-קצת, אבל 02 מייצג שחור-פחות-שלוש-קצת. פשוט כי אין המון "אקשן" ליד השחור, אז החלטנו לוותר על רזולוציה. ייתכן שליד הלבן כבר יש לנו קפיצות של קצת חצי, או קצת רבע, פשוט כי שם היה הרבה מידע. כך שאם יש לך 32 ביט, יש לך אפשרות לייצג 32^2 רמות, בלי קשר למשמעות שאתה מייחס להן - גם כך וגם כך אתה צריך לענות על השאלה מה כל קומבינציה אומרת. |
|
||||
|
||||
הבנתי שאתה אתה אומר שבפועל נקודה צפה(כמו שאני הגדרתי) זה מקרה פרטי של ההחלטת המיפוי. נזכרתי שבאמת יש שני תקנים, אירופאי ואמריקאי, למיפוי אמפליטודה של דיבור ל 8 ביט באופן כמעט לוגריתמי( חוק מו וחוק A ?). |
|
||||
|
||||
רגע, אם אני רוצה להכפיל חלק מהדגימות פי 2, אני צריך לקחת כל דגימה, לבדוק במפה מה זה אומר 1e3222 (נגיד שזה אומר 9), להכפיל פי 2 (קיבלנו 18) ואז לבדוק איזה ערך במיפוי שווה ל- 18 (אה, 200318). ואת זה אני עושה לכל דגימה בנפרד. לעומת זאת בנקודה צפה הכל נשאר ליניארי (מקסימום צריך להגדיל/להקטין את האקספוננט). הניחוש שלי ללמה משתמשים בנקודה קבועה הוא פשוט כי לא צריך יותר מכך. שבבי DSP של נקודה צפה יקרים יותר ואיטיים יותר מאחיהם בני הנקודה הקבועה. אם אפילו לא התעורר עדיין הצורך ב- 32 ביט, כנראה שהעסק עובד מספיק טוב גם כך. |
|
||||
|
||||
הממירים (A2D,D2A) עובדים עם שלמים. קשה לייצג פורמט נקודה צפה באמצעות חומרה, בייטים מתרגמים ישירות לאות חשמלי ואילו מידע FP יומר קודם לערך שהממיר יוכל לעבוד איתו. FP יועיל בדיוק פנימי של המעבד, בהקטנת שגיאות מצטברות וכו' |
|
||||
|
||||
החלק הראשון נכון (אבל למה שתרצה לעשות כזו פעולה מוזרה?), אבל מה פתאום שבנקודה צפה הכל ישאר לינארי? אתה עדיין צריך לתת פירוש לכל קומבינציה של ביטים, או שאתה נשאר עם מיפוי בקפיצה אחידה (שהוא לא כל כך רע, ומשתמשים בו במספר פורמטים. בעיקר אלה שתופסים מעט מקום). |
|
||||
|
||||
למה שארצה? נניח שאני רוצה להגביר חלק מהאות? נשמעת לי פעולה די נפוצה. בנקודה צפה אתה מקבל את כל היתרונות שבמיפוי לוגריתמי (ויותר!). המחיר הוא מרחב (עוד ביטים לייצוג האקספוננט בהנחה שהערך נשאר 24 ביט) וזמן (פעולות נקודה-צפה איטיות יותר). אמנם אתה לא מקבל בחינם כל מיפוי מוזר שתעלה על דעתך אך בהנחה שלרוב עובדים עם מיפוי סביר (כלומר חלק), אתה תהיה בסדר. אמנם אתה נשאר עם מיפוי בקפיצה אחידה, אבל הקפיצה היא הרבה יותר קטנה (ביחס של האקספוננט הקטן ביותר שאתה יכול לייצג). |
|
||||
|
||||
כשרוצים להגביר חלקים מהאות רוצים להגביר חלק מה*תדרים* שלו, לא חלק מהתמונה. מה שאתה הצעת זו פשוט הבהרה של חלק מהתמונה, בלי להשיג כל שיפור בקונטרסט, פעולה שלא תעזור לאף אחד. אבל שוין, זה סתם באופן צדדי. באשר לפסקה השנייה שלך, אתה פשוט משווה לא נכון. לא משווים בין הצגה של 24 ביט והצגה של 24 ביט + 8 ביט לאקספוננט, אלא בין זה לבין הצגה של 32 ביט, לעומתה אין שום שיפור. ברור שאם תוסיף עוד מקום לייצוג תוכל להשיג שיפור, על כך אין שום ויכוח. |
|
||||
|
||||
זה פשוט לא נכון. לפעמים אתה רוצה לבצע פעולות בזמן ולפעמים בתדר (אתה כל הזמן מדבר על תמונות, מה עושה מסנן הגברת קונטרסט בתוכנת הצפיה החביבה עליך?). גם פעולת תדר תעשה לעתים על ידי קונבולוציה בזמן הדורשת כפלים. בקשר לפסקה השניה שלך, מותר לי להשוות בין מה שאני רוצה. שים לב שהמסקנה שלי היא שכרגע בשיקול מעשי 24 ביט בנקודה קבועה עדיפים על 24+8 בנקודה צפה בגלל זמן העיבוד ומחיר החומרה. בנוסף, ל- 32 ביט בנקודה קבועה יש חסרונות גם ביחס ל- 24+8 (מה קורה כשדגימה אחת היא 0x10000000.0 והשניה היא 0x0.00000001?). על הפסקה האחרונה שלך באמת אין ויכוח. |
|
||||
|
||||
כשאתה מגביר קונטרסט אתה עושה שיוויון היסטוגרמה - אוסף את כל הפיקסלים לגרף, ומותח אותו על כל הציר. זה דומה לקוונטיזציה מחדש. בנוסף, להזכירך, בתמונות אתה לא עושה פעולות בזמן, רק במרחב. עכשיו, אתה באמת יכול להשוות בין מה שבא לך, השאלה היא אם אתה עונה על השאלה, ומה מקבלים מההשוואה שלך. מה שהקורא הנבוך שאל היה בקשר לטיב המתקבל, ובמובלע על שימוש בנקודה צפה וקבועה באותו מספר ביטים. מבחינת טיב, עדיף נקודה צפה של 32 ביט על קבועה של 24, למרות שאתה כמובן צודק בקשר לשיקולי המחיר והזמן. מה שלא נכון הוא שיש לך חסרונות לנקודה קבועה מול צפה במפר ביטים שווה - אתה כל הזמן מניח קוונטיזציה במרווח קבוע שלא לצורך. אם יש לך שתי נקודות כפי שהצגת, כנראה שאחת תצא שחורה, והשנייה לבנה, תלוי במפה שלך ובאלגוריתם הקווינטוט. |
|
||||
|
||||
היה לנו איש סאונד, היה לנו מעבד אותות, ועכשיו הזמן גם למחשבים. עיבודים ב-Floating Point לרוב גורמים לכאב לב לא קטן כשאתה מנסה לחבר מספרים גדולים למספרים קטנים. הם גם יגרמו לך לצער רב כשתנסה להשוות מספרים אחד לשני. לפעמים 3 פחות 3 זה לא 0, אלה 10 בחזקת מינוס 8. שזה אכן קרוב ל-0, אבל 0 זה לא. או בקיצור - אם ידוע לך טווח הדיוק, תקשור את הנקודה לעמוד ואל תיתן לה לצוף סתם ככה. נקודות צפות יש רק באגד. |
|
||||
|
||||
השאלה שהתכוונתי לשאול היתה : האם מקודדים אמפליטודות באופן לינארי או באופן לוגריתמי. אני מודה ששאלתי באופן עקום, אבל בהמשך הפתיל הנושא התבהר. מכיוון שבתשובתך אתה מציין את הנוחות של חיבור מספר גדול וקטן, הרי שכנראה אתה בדעה שעדיף להשתמש בקידוד לינארי. בזאת אתה עונה תשובה הפוכה ל תגובה 145985 שאומרת (למיטב הבנתי) שמשתמשים ב"נקודה צפה" אבל במובלע. על הדאגה שלא תוכל להבחין בין שני מספרים קרובים כבר עניתי שכל זמן שהשגיאה היחסית קטנה לא נראה לי שיש כאן ביג דיל. כמו כן, זכרוני החלש כל הזמן לוחש לי G.711 . אמנם זה רק טלפוניה ולא מוסיקה, אבל לפחות מישהו(ITU) חושב שיש טעם בקידוד לוגריתמי. |
|
||||
|
||||
תשובה מאוחרת לפתיל ארוך שהוצף מחדש ע"י האייל החדש: הקישור שבור, אולם למיטב זכרוני אחד השיקולים לטובת השימוש בקידוד לוגריתמי ב<wiki G.711> הוא עמידות טובה יותר בפני רעש לעומת הקידוד הלינארי הפשוט (16 סיביות, לעומת 8 בקידוד הלוגריתמי). מקטינים את הגודל פי 2 וגם זה משהו. אבל כשצריך לעשות איזשהו עיבוד לאות (לדוגמה: הגברה) ממירים אותו לקידוד לינארי, עושים מה שעושים, ומקודדים חזרה בקידוד לוגריתמי. שתי פעולות הקידוד הללו הן פשוטות למדי: חיפוש במערך של 256 בתים (מלוגריתמי ללינארי) או 65536 בתים (מלינארי ללוגריתמי). |
|
||||
|
||||
עיבוד מסוים מתבצע על האות לפני כניסתו למכשיר ההקלטה, ושאר העיבוד מתבצע לאחר מכן. באולפנים גדולים ויקרים, כמובן, יש עדיין אפשרות להקליט באופן אנלוגי מלא ולדגום למחשב רק לאחר המיקס. בכל אופן, קיימים סוגי עיבוד אותם לא ממש מעשי לבצע באופן אנלוגי. כל עיבוד הדורש Look-ahead או התייחסות לכל המידע על הערוץ (להבדיל מ-Realtime), למשל. |
|
||||
|
||||
המרת A\d? אגב מהו dc computation בהקשר הנ"ל? (סתם מנצל את הדיון להרחיב אופקים) |
|
||||
|
||||
המרת A/D זה בסך הכל Analog to Digital, או בלשון העם - דגימה. את המונח dc computation אני לא מכיר, אבל אשמח ללמוד עליו. באיזה הקשר בדיוק אתה מתכוון, ואיפה נתקלת בו? |
|
||||
|
||||
נתקלתי בו מתישהו לפני מספר חודשים כשהזדמן לידי חומר מודפס(!) שתיאר אלגוריתם שתכליתו לייצר "חתימה" מקטע אודיו. אני חושב שזה משהו שקשור לאופן שבו כל דגימה בפורמט מכווץ של מוזיקה מכילה מידע הרלוונטי גם דגימות הבאות והקודמות, אבל לא עמדתי על ההגיון1 לאשורו. 1 הנה הסבר איך זה עובד בתמונות (http://www.google.co.il/search?q=cache:wSy7W70GFSkC:...), אבל אני לא רואה איך אותה טכניקה יכולה להיות מיישמת על קול. |
|
||||
|
||||
ייתכן שאתה מדבר על קידוד דיפרנציאלי? מדובר בעקרון שיכול להיות מיושם בכל הקלטה או שידור של אות המשתנה בצורה יחסית רציפה ולא רק בתמונות וסאונד. הנחות יסוד: 1. ככל שהאות קטן יותר, הוא תופס פחות מקום (זה נכון בגלל קידודי האנטרופיה שמשתמשים בהם). 2. כל דגימה יחסית קרובה לדגימה הקודמת (בתמונה זה אומר שאין הרבה מעברים חדים בין אזורים בהירים מאוד לכהים מאוד). מסקנה: במקום לשמור את הדגימה הנוכחית במלואה, נשמור רק את ההפרש מהדגימה הקודמת. מכיוון שמדובר באות קטן יותר (לפי הנחה 2), הוא תופס פחות מקום (לפי הנחה 1) ולכן הרווחנו. בשחזור פשוט נחבר את ההפרש השמור עם הדגימה הקודמת (שכבר שוחזרה). בעיה: נניח והדגימה הקודמת נדפקה, גם כל הדגימות שאחריה נדפקות מכיוון שהן מתבססות עליה. פתרון: מדי N דגימות שומרים דגימה באופן מלא ולא באופן דיפרנציאלי כך שהרצף הדפוק נעצר. |
|
||||
|
||||
טוב, איך מכווצים תמונה אני יודע, ואני גם יכול לראות איך זה תקף לקולות. יכול להיות שאני חוזר על מה שאתה כבר יודע, אבל נתחיל מהתחלה: נניח שיש לנו תמונת רמות אפור עם 8 ביט - בייט אחד, לפיקסל (ההכללה לצבע קלה - פשוט 3 תמונות של רמות אדום, כחול וירוק). נניח שהיא בגודל של 64 על 64 פיקסל. כדי לשמור אותה ישירות (נגיד בBMP) צריך 64 בריבוע בייט. איך נכווץ? נשמור רק את השורה הראשונה ואת הטור הראשון בתמונה במלואם (64*2 בייט), ונמצא נוסחת שיערוך שאומרת לנו מה הערך בפיקסל הנוכחי כפונקציה של הפיקסל משמאלו, מעליו, ושני הפיקסלים באלכסונים העליונים. נתחיל לעבוד משמאל לימין ומלמעלה למטה, כשאנו משערכים כל פעם את הערך בפיקסל הנוכחי. עכשיו, ברור שאין נוסחת קסם שתתן לנו את התמונה - אז נשמור עבור כל פיקסל את ה*שגיאה* מהנוסחה, וכך נקבל את הערך האמיתי באותו פיקסל. אם הנוסחה טובה (וניתן תמיד למצוא את המיטבית, זו בעייה פתורה) אז השגיאה תתפוס הרבה פחות מ8 ביט, יותר לכיוון ה5, ונחסוך המון מקום. ככה, על רגל אחת, עובד כיווץ. אותו דבר אפשר לעשות בקול - אם נשמור רק N ערכים תחיליים, ונוסחה שמחשבת את הערך הנוכחי על סמך N ערכים אחורה, ונשמור רק את השגיאה מהשערוך, נוכל לחסוך מקום רב. מה זה DC computation? זה טריק כדי להוסיף עוד כיווץ על כיווץ. מסתבר (ממה שקישרת, ואם הבנתי נכון) שאם נפרק את התמונה למרכיב הDC שלה לבד, ולתדרים גבוהים בנפרד, אז את מרכיב הDC קל לשחזר ע"ס רק טור אחד עם מעט שגיאה, ואת הAC משחזרים בנוסחה נפרדת, בשיטת הזיג-זג כפי שהוצגה שם. (לשאלה מה זה תדר גבוה ונמוך בתמונות, אני לא כל כך רוצה להכנס. אבל רק כדי לתת קצת אינטואיציה - מדברים על "תדר מרחבי", לא על תדר רגיל, ולמשטחים חלקים יש תדר נמוך, בעוד לשפות של אובייקטים, לדוגמא, יש תדר גבוה) איך עושים אותו דבר לקול? אני רק משער כאן, אבל אני מניח שהכוונה היא לשמור את הDC (הממוצע של האות, במקרה זה) בנפרד, ולשחזר את האות-פחות-התוחלת, בשיטה שהצגתי קודם. |
|
||||
|
||||
אז כתוב שם: DC is the average value of the 8 x 8 original pixel values. באופן כללי יותר, זה שם לרמה של רכיב האפס בהתמרת פורייה. |
חזרה לעמוד הראשי | המאמר המלא |
מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים | |
RSS מאמרים | כתבו למערכת | אודות האתר | טרם התעדכנת | ארכיון | חיפוש | עזרה | תנאי שימוש | © כל הזכויות שמורות |