UTF-8: Rozdiel medzi revíziami
Smazaný obsah Přidaný obsah
gramatika |
korekcia UTF-8, ktoré podľa eng wiki kóduje max. štyrmi bajtami (32 bitmi) a nie šiestimi bajtami (48 bitmi). Rovnako Unicode ide maximálne do troj-bajtového U-10 FF FF a nie až do štvorbajtového 1F FF FF FF |
||
Riadok 6:
je špeciálne užitočné pre prenos cez 8-bitové systémy elektronickej pošty.
Používa 1 až
ide. Napríklad, len jeden UTF-8 bajt je potrebný na zakódovanie
všetkých 128 [[US-ASCII]] znakov z Unicode rozsahu U+0000 až U+007F.
Aj keď sa môže zdať neefektívne reprezentovať Unicode znaky až štyrmi bajtmi, UTF-8 umožňuje starým systémom prenášať túto
ASCII nadmnožinu. Dodatočne, dátová kompresia môže byť stále vykonaná nezávisle
od použitia UTF-8.
Zatiaľ čo pri
[[IETF]] požaduje od všetkých internetových protokolov, aby UTF-8 bolo aspoň
Řádek 25 ⟶ 24:
! UTF-8 sekvencia
|-
| U-
|-
| U-
|-
| U-
|-
| U-
|}
|