מתרגם ג'יבריש לעברית
מסדר עברית הפוכה
הפוך הקלדה אנגלית לעברית
תעתיק בין עברית לאנגלית
gibberish שגיאות קידוד
אודותינו
השאר הודעה
האתר נמצא כעת במצב "בטא", זאת אומרת שהוא בשלבי הפיתוח. לפרטים נוספים ראה את הדף אודותינו.

שגיאות קידוד

משגע אתכם כשאתם מעלים דף באינטרנט, ובמקום עברית יפה אתם נתקלים בסימנים לא מובנים? איך אתם אמורים לדעת לאיזה קידוד התכוון המחבר, כשאפילו המחשב שלכם לא יכול לפענח אותו? לכן הכנתי את הדף הזה. תתאימו את מה שאתם רואים על המסך עם הדוגמאות הבאות, ועם קצת מזל תצליחו לגלות את הקידוד הנכון.

קודם כל, קצת מידע רקע. הקידוד העברי הראשון, ISO-8859-8 היה בעיתי בכך שהניח כיוון קריאה משמאל לימין. זאת בגלל שהוא התבסס על קידוד ISO-8859-1, שהתבסס על קידוד ASCII, שהיה כתוב על ידי מתכנתים דוברי אנגלית. כידוע, דוברי אנגלית לא מודעים לקיום שפות אחרות. לא עלה על דעתם שיש שפות שלא כתובות משמאל לימין. אז, בדפים שנשמרו בקידוד ISO-8859-8 נאלצו לסדר את האותיות בסדר הפוך. אבל זה לא היה נוח לכתוב, אז המציאו קידוד ISO-8859-8-I שדומה לו, אך מניח כיוון קריאה (למעט מספרים) מימין לשמאל. באותו הזמן פיתחו י.ב.מ. ומיקרוסופט קידודים משלהם, ששמרו על האותיות בסדר הנכון. רק הקידוד של מיקרוסופט כלל גם כן את הניקוד העברי. מהסיבה הזאת, ומהצלחתה של מערכת ההפעלה של מיקרוסופט, הקידוד שלה (CP-1255) הפך להיות הקידוד הנפוץ באינטרנט. כעבור מספר שנים, ישב מהנדס בשם קן תומפסון במסעדה עם חברו הטוב רוב פיק. השניים המציאו על מפית סוג קידוד שמסוגל להציג כל אות בכל אלפבית בצורה יעילה. כך נולד הקידוד יוניקוד. היום היוניקוד הוא הקידוד המומלץ לכל סוג מסמך, לא רק בעברית אלא בכל השפות. לעומת זאת, תוכנות של מיקרוסופט (אאוטלוק, אקספלורר, פרונטפייג', וכו') מתעקשות להשתמש בקידוד המיושן של החברה. בשל כך, נגרמות בעיות רבות בהתאמת קידוד.

בשלוש הדוגמאות האלו רואים עברית הפוכה. שימו לב שבדוגמה הראשונה סימן הקריאה הוא בצד ימין ובשתי הדוגמאות האחרונות הוא בצד שמאל.
זה קידוד CP-1255 הוצג כ- ISO-8859-8
זה ISO-8859-8 הוצג כ- CP-1255
זה ISO-8859-8 הוצג כ- MacHebrew
בעית קידוד נוספת שגורמת לתופעה דומה היא ציון ISO-8859-8 במקום ISO-8859-8-I או להפך. אז תבדקו גם את האפשרות הזאת.

ארבע הדוגמות הבאות כוללות ביתים שגויים, לכן הופעת סימן היהלום. שימו לב שרק בדוגמה האחרונה מופיע סימן הקריאה בצד שמאל.
זה UTF-8 הוצג כ- CP-1255
זה UTF-8 הוצג כ- ISO-8859-8
זה CP-1255 הוצג כ- UTF-8
זה ISO-8859-8 הוצג כ- UTF-8

המצב הזה קל לזיהוי בגלל הצלבים המפרידים בין סימן לסימן.
זה UTF-8 הוצג כ- ISO-8859-1

הכתב ה"שבדי" הוא תוצאה של הצגת קידודים אחרים בתור קידוד לטיני:
זה CP-1255 הוצג כ- ISO-8859-1
זה ISO-8859-8 הוצג כ- ISO-8859-1

מצב זה הוא די נדיר. כאן רואים קידודים שונים המוצגים כקידוד של י.ב.מ.
זה CP-1255 הוצג כ- IBM-862
זה ISO-8859-8 הוצג כ- IBM-862

שני מצבים אלו גם כן נדירים. שניהם נגרמים כתוצאה מהצגת UTF-8 בתור קידודים שונים.
זה UTF-8 הוצג כ- IBM-862
זה UTF-8 הוצג כ- MacHebrew