1 символ комп'ютерного алфавіту «важить» 8 бітів.
1 байт = 8 біт. Таким чином, інформаційний вага одного символу достатнього алфавіту дорівнює 1 байт.
UTF–8, порівняно з UTF-16, найбільший виграш у компактності дає для текстів на латиниці, оскільки латинські літери без діакритичних знаків, цифри та найпоширеніші розділові знаки кодуються в UTF–8 лише одним байтом, і коди цих символів відповідають їх кодам ASCII.
У таблиці Unicode використовується 2 байти, тому можна сказати, що 1 символ у комп'ютері займає 1 або 2 байти.