Mojibake

Om en font inte stödjer alla tecken kan texten bli mojibake, som här där fonten saknar kanjin.

Mojibake (文字化け, moji bokstav + bake förklädnad/förvandling) är ett japanskt datorbegrepp. Det står för de trasiga bokstäver ("skräp") som kommer ut när man försöker att se text kodad med viss teckenkodning med programvara som inte är konfigurerad för det.[1]

Exempel: "文字化け" visas som "•¶Žš‰»‚¯"

Andra språk

Detta problem är inte unikt för japanska, bara svårare i detta fall. Problemet finns eller har funnits för i princip alla språk utöver engelska. På svenska har Å,Ä,Ö kodats på många olika sätt och det har ofta blivit fel. Om textfiler gjorda för DOS lästes i Windows blev åäö till †„”, och alltså smörgås blev sm”rg†s. Med enstaka tecken felkodade gick det ändå att gissa sig till vad som menades. Detta var omöjligt med japansk mojibake, där i princip alla tecken byttes ut (i en japansk standardtext används latinska tecken, romaji bara för utländska namn ).

I Ryssland kallas problemet krokoziabry (Крокозябры), och på bulgariska majmunitsa (маймуница, "aptext"). I dessa språk med kyrilliska tecken blir felkodning också lika fatal och ger i regel en helt oläsbar text. Om till exempel ordet "Крокозябры" sparas med den äldre ryska textkodningen, inte det moderna Unicode, läses det i Västeuropa ut som "ëÒÏËÏÚÑÂÒÙ")

Exempel på problem, med svenska bokstäver

Ordetkodat somläses med kodningenger resultatet
SmörgåsMS-DOSLatin-1Sm”rg†s
SmörgåsLatin-1MS-DOSSm÷rgÕs
Smörgåsmac romanLatin-1SmšrgŒs
SmörgåsLatin-1mac romanSmˆrgÂs
Smörgåshp romanLatin-1SmÎrgÔs
SmörgåsLatin-1US-ASCIISmvrges
SmörgåsUTF-8Latin-1SmörgÃ¥s
SmörgåsUTF-8mac romanSm√∂rg√•s

Källhänvisningar

  1. ^ " 14.5. What is mojibake?". Sljfaq.org. Läst 13 juli 2014. (engelska)

Källor

Media som används på denna webbplats

Question book-4.svg
Författare/Upphovsman: Tkgd2007, Licens: CC BY-SA 3.0
A new incarnation of Image:Question_book-3.svg, which was uploaded by user AzaToth. This file is available on the English version of Wikipedia under the filename en:Image:Question book-new.svg
Incomplete support for Japanese script.png
Författare/Upphovsman: OldakQuill, Licens: CC BY-SA 3.0
A screenshot showing the display of a webpage on a computer which has incomplete support for Japanese text. Taken using KSnapshot.
Character Nyu3 Cler.svg
This “女-clerical-qing.svg” vector image is depicting the character 女 (Expression error: Unrecognized punctuation character "女".-stroke traditional Kangxi radical 0女= ※) in the Clerical Qing script style.
See also Wiktionary: en, fr, ja, zh.