ASCII: объяснение и примеры

Код ASCII кодирует символы, чтобы определить их представление электронными устройствами, такими как ПК. Для этого отдельные символы преобразуются в двоичные, десятичные и шестнадцатеричные значения, которые компьютер может обрабатывать.

Что такое ASCII?

ASCII — это стандарт для представления символов электронными устройствами. Чтобы лучше понять, что это значит, необходимо знать, как работает компьютер. В компьютере вычислительные процессы всегда основаны на двоичной системе. Это означает: единицы и нули определяют процессы в компьютере. ASCII тоже основан на этой системе. Оригинальный стандарт ASCII определяет различные символы в пределах семи бит — то есть семи цифр, обозначающих либо 0, либо 1.

Определение

Кодирование символов — это американский стандартный код для обмена информацией, который является предшественником ISO 646 (международные наборы символов). ASCII — это 7-битный код, что означает, что определено 128 символов (27). Код состоит из 33 непечатаемых и 95 печатаемых символов и включает в себя буквы, знаки препинания, цифры и управляющие символы.

Восьмой бит, составляющий один полный байт, традиционно используется для проверки. Расширенные версии на основе ASCII используют именно этот бит, чтобы расширить количество доступных символов до 256 (28).

Факт

Первоначальное назначение восьмого бита — проверка данных на наличие ошибок. Бит «четности» позволяет приемнику битовой последовательности обнаружить несоответствия. Однако видимым является только то, что произошло, а не причина ошибки. Это делает проверку на четность довольно непригодной для исправления ошибок.

Каждый символ соответствует семизначной последовательности нулей и единиц, которая затем может быть представлена как десятичное число или как шестнадцатеричное. Символы ASCII можно разделить на несколько групп.

  • Управляющие символы (0-31 & 127): Управляющие символы не являются печатаемыми символами. Они используются для передачи команд на компьютер или принтер и основаны на технологии телексной связи. С помощью этих символов можно устанавливать разрывы строк или табуляции. Сегодня они в основном не используются.
  • Специальные символы (32-47 / 58-64 / 91-96 / 123-126): К специальным символам относятся все печатные знаки, которые не являются ни буквами, ни цифрами. К ним относятся знаки препинания или технические, математические символы. ASCII также включает пробел (невидимый, но печатаемый символ), и поэтому не относится к категории управляющих символов, как можно было бы предположить.
  • Цифры (30-39): Эти цифры включают десять арабских цифр от 0-9.
  • Буквы (65-90 / 97-122): Буквы разделены на два блока, первая группа содержит прописные буквы, а вторая — строчные.
Совет

Чтобы без труда перевести символы в код ASCII, стоит обратиться к таблице ASCII, которая содержит двоичные, десятичные и шестнадцатеричные значения для каждого символа.

Пример: Коды ASCII

В системе ASCII двоичные числа преобразуются в печатаемые и непечатаемые символы в соответствии с заданным стандартом.

Если вы посмотрите на таблицу ASCII, вы найдете символы, представленные для различных числовых значений.

Пример:

Двоичное число 01000001 может быть записано в десятичном виде как 65, в шестнадцатеричном — как 41. Символ, закодированный этим числом, — буква «A». Если теперь вести отсчет дальше, то вы обнаружите заглавные буквы, перечисленные в алфавитном порядке. Таким образом, слову «ASCII» будут соответствовать следующие числовые значения:

 

A

S

C

I

I

двоичный

01000001

01010011

01000011

01001001

01001001

десятичный

65

83

67

73

73

шестнадцатеричная

41

53

43

49

49

Совет

В Windows можно вводить символы Unicode — то есть символы ASCII — с помощью комбинации клавиш. Для этого, удерживая нажатой клавишу Alt, введите десятичное значение символа с помощью цифровой клавиатуры.

Код ASCII: преимущества и области применения

ASCII широко используется и сегодня, несмотря на то, что UTF-8 стал более важным при представлении текста. Однако Unicode вытесняет старый метод кодирования символов, использовавшийся в первые дни существования Интернета, только с 2008 года. Преимущество использования UTF-8 заключается в том, что код практически обратно совместим: ASCII является подмножеством UTF-8, поэтому первые 128 символов идентичны. Поскольку ASCII можно считать наименьшим общим знаменателем большинства новых форм кодирования, старый метод кодирования по-прежнему используется в электронных письмах и URL-адресах.

Факт

Теперь пользователи могут использовать Юникод при создании электронных писем, и даже домены могут использовать умляуты благодаря интернационализации доменных имен. Однако в обоих случаях перед передачей текст должен быть преобразован в ASCII. Обычно это делается автоматически, и пользователи ничего не замечают.

Кроме того, ASCII уже давно используется как в художественных, так и в технических целях: Искусство ASCII использует исключительно печатаемые символы кода ASCII для создания творческих работ. Спектр варьируется от надписей до простых фигурок и настоящих картин. Художники ASCII используют различные уровни яркости отдельных символов для создания света и тени в своих произведениях.

Краткая история кодов ASCII

Американская ассоциация стандартов (ASA, сейчас известна как ANSI, что означает «Американский национальный институт стандартов») утвердила Американский стандартный код для обмена информацией (ASCII) в 1963 году. Он устанавливает обязательную спецификацию того, как электронные устройства должны представлять символы. Поскольку стандарт является американским, его часто называют US ASCII.

Его предшественниками были азбука Морзе и коды, используемые в телексах, где стандартизированный код (например, фиксированная последовательность акустических сигналов) переводится в текст. Поскольку компьютеры не могут работать с нашим алфавитом, так как их внутренние процессы основаны на двоичной системе, был введен стандарт ASCII.

По сей день этот стандарт редко изменяется, чтобы адаптироваться к новым требованиям. Например, существуют расширенные версии, в которых используется восьмой бит, чтобы можно было представить национальные особенности, такие как немецкие умляуты (ä, ö и ü). Латиница-1 (ISO 88591-1), которая все еще популярна в Германии, основана на коде ASCII.

Однако до сих пор невозможно переключаться между латинским алфавитом и, например, арабскими символами. Для этого в настоящее время уже созданы наборы символов, основанные в основном на Unicode, такие как UTF-8. Unicode предоставляет место для более чем миллиона различных символов. UTF-8 также совместим с ASCII, кодируя первые 128 символов таким же образом.

Оцените статью
cdelat.ru
Добавить комментарий