Что представляет собой двоичное кодирование информации

Содержание:

Содержание

Что такое двоичное кодирование информации

Двоичное кодирование информации является способом представления данных с использованием двух символов или состояний. Два этих символа обозначаются как 0 и 1.

Двоичное кодирование было разработано Клодом Шеннаном в 1930-х годах с помощью переключателей, которые замыкаются при значении «истина» и размыкаются при значении «ложь», можно выполнять логические операции, присваивая «истине» число 1, а «лжи» — 0. Такая система кодирования информации называется двоичной. Именно эта форма кодирования позволяет работать компьютерам.

В двоичном кодировании в качестве основной единицы информации используется бит. Комбинируя биты, можно представлять числа, большие, чем 0 или 1, и такие наборы битов называются словами. Восьмибитные слова исторически имеют специальное название — байты.

Осторожно! Если преподаватель обнаружит плагиат в работе, не избежать крупных проблем (вплоть до отчисления). Если нет возможности написать самому, закажите тут.

Длина слова — количество битов, из которых состоит слово, - определяет максимальное число, которое может быть представлено этим словом. N отдельных битов, составляющих N-битное слово, могут быть расположены таким образом, чтобы получить 2N различных целых значений; например, двухбитное слово будет иметь 22 = 4 комбинации, и эти четыре комбинации - 00, 01, 10 и 11. Десятичное числовое значение этих слов вычисляется путем перехода от крайнего правого бита к крайнему левому, поэтому десятичными эквивалентами этих двухбитных слов являются 0, 1, 2 и 3 соответственно. Таким образом, N-разрядное слово может представлять все целые десятичные числа от 0 до 2N-1 (например, 16-разрядное слово может представлять любое целое число 0-65 535). Левый крайний бит (бит N-1) называется старшим битом (MSB), так как он вносит наибольший вклад в общее значение слова, а правый крайний бит (бит 0) - младшим битом (LSB). Такой код называется прямым двоичным кодом.

Группировка чисел в кластеры по 8 бит облегчает их чтение, подобно тому как группировка чисел в тройки помогает сделать тысячи более понятными при работе с основанием 10. Например, число «2 358 845» читается легче, чем «2358845».

16-разрядная единица информации обычно называется словом. 32-разрядная единица информации называется двойным словом (иногда dword). Для байта наименьшее возможное число — 0 (представлено восемью нулями, 00000000), а наибольшее — 255 (представлено восемью единицами, 11111111), что дает 256 различных возможных значений.

Виды

Кодирование целых чисел — целое число переводится в двоичное число, последовательность нулей и единиц.
Кодирование вещественных чисел (с плавающей запятой) в двоичной системе счисления сложнее, т.к. вещественные числа имеют дробные части и имеют очень большой или очень маленький диапазон.
Кодирование текста — процесс преобразования символов, чисел, букв и других символов в числовую или бинарную форму.
Кодирование графических представляет изображения, аудио в цифровой форме. Включает векторную и растровую графику.

Формат файла — это структура файла, которая указывает программе, как отображать его содержимое. Например, документ Microsoft Word, сохраненный в формате .DOC, лучше всего просматривать в программе Microsoft Word. Даже если другая программа может открыть этот файл, она может не обладать всеми необходимыми функциями для корректного отображения документа.

Распространенные форматы файлов

Ниже приведен список распространенных форматов файлов:

Текст — .asc .doc .docx .rtf .msg, .pdf .txt .wpd .wps
Изображение — .bmp .eps .gif .jpg .pict .png .psd .tif
Звук — .aac .au .mid .mp3 .ra .snd .wma .wav
Видео — .avi .mp4 .mpg .mov .wmv
Программа — .bat .com .exe
Сжатые файлы — .arc .arj .gz .hqx .rar .sit .tar .z .zip
Веб-страница — .htm и .html

Каким образом производится

Кодирование графической информации

CMYK, RGB, и Grayscale — это различные цветовые модели, в графическом дизайне печати и компьютерной графике.

CMYK (желтый, голубой, пурпурный, черный);
RGB (красный, синий, зеленый);
Grayscale (градации серого).

Векторная графика — это цифровое изображение, состоящее из точек, контуров, кривых и геометрических фигур. В отличие от растровой графики, в которой используется фиксированная сетка пикселей, векторные графические файлы не имеют фиксированного разрешения и могут быть изменены в размерах, растянуты и подвергнуты другим манипуляциям без потери качества.

Графические дизайнеры и иллюстраторы используют векторную графику для создания простых рисунков, логотипов, значков и иллюстраций. Отдельные символы в файле шрифта также являются векторной графикой. Технически они являются двухмерными, но наслоение различных элементов и использование текстур позволяет придать изображению трехмерный вид. Наиболее распространенным форматом векторной графики является .SVG, но также встречаются форматы .eps, .cgm, .odg и .xml.

Пути в векторной графике состоят из точек, связанных между собой. Точка на контуре может представлять собой острый угол или плавную кривую (так называемую кривую Безье). Когда контур образует замкнутый цикл, соединяя конец с началом, он становится сплошной фигурой. Для изменения ширины, стиля и цвета контура можно настроить его обводку, а также залить замкнутую форму цветом или градиентом.

Размер файла векторной графики обычно значительно меньше, чем растровой. В файле векторной графики сохраняется математическая информация, определяющая контуры и формы, а также свойства обводки и заливки. Поскольку вся эта информация хранится в виде числовых значений, а не отдельных пикселей, размер файла сложной векторной графики будет меньше, чем у растровой графики с аналогичной детализацией.

Растровая графика — это цифровые изображения, представленные в виде матрицы или сетки пикселей, обычно называемой растровой картой.

Каждый пиксель или точка имеет свой уникальный цвет, и все эти цветные точки вместе образуют изображение. Каждый пиксель растрового изображения хранится в памяти компьютера в виде одного или нескольких битов. Растровая графика с большим количеством цветов и пикселей требует большего количества битов и занимает больше памяти. Типичные форматы файлов для растровой графики — .jpg, .gif, .tiff и .bmp.

Поскольку растровая графика представлена в виде сетки, ширина и высота обычно обозначаются количеством строк и столбцов, а не конкретной единицей измерения. Размер изображения может быть описан как 640 x 480, что означает 640 пикселей в строке и 480 пикселей в столбце. Разрешение или степень четкости изображения рассчитывается путем определения количества пикселей на дюйм (PPI) или точек на дюйм (DPI). Растровая графика с более высоким разрешением имеет меньшее количество пикселей, что позволяет получить более детализированное изображение. При необходимости отображения или печати растровой графики больших размеров целесообразно использовать более высокое разрешение, чтобы изображение не выглядело зернистым.

Растровая графика состоит из маленьких квадратиков, которые, взаимодействуя друг с другом, создают узнаваемое изображение. Черно-белая растровая графика содержит только черно-белые пиксели, и для каждого пикселя требуется всего один бит в памяти. Для цветной растровой графики требуются дополнительные биты, поскольку для представления каждой из красной, зеленой и синей составляющих пикселя необходимо три значения. Глубина цвета изображения определяется количеством битов на пиксель, и с увеличением глубины цвета для отображения становится доступно больше цветов. Изображение с 8-разрядной глубиной цвета имеет 256 различных цветов, в то время как изображение с 12-разрядной глубиной цвета может содержать 4096 цветов. Графика с увеличенной глубиной цвета лучше отображает тени.

Кодирование текстовой информации

Кодирование текста — это процесс преобразования символов, читаемых человеком, в машиночитаемый формат. Когда мы создаем текстовый файл, то вводим текст с клавиатуры, и он сохраняется в файловой системе. Однако компьютер не может понять текст так, как это делает человек.

Кодирование предполагает присвоение каждому символу числового значения. Затем эти числовые значения преобразуются в двоичный код. Существуют различные стандарты кодирования текста с разным набором значений.

Кодовые точки — это просто отображение некоторых чисел на символы. Эти числа называются кодовыми точками. Например, кодовая точка 49 отображается на буквенное значение 1. Так же кодовая точка 65 сопоставляется с символом «A». Таким образом, Unicode — это не схема кодирования, а стандарт информационных технологий для кодирования, представления и работы с текстом.

Виды кодирования текста

Существует несколько различных типов кодировок текста, в том числе UTF-8, UTF-16 и другие. Наиболее широко используется кодировка UTF-8, которая представляет собой схему кодирования с переменной длиной, обратно совместимую с ASCII. Это означает, что UTF-8 может представлять все символы ASCII одним байтом, а символы не ASCII — несколькими байтами. Максимальная длина байта может составлять 4 байта.

Стандарт кодирования текста ASCII использует 7 бит для кодирования символов. Это позволяет получить 128 (или 27) уникальных значений (от 0 до 127), представляющих общеупотребительные алфавитные, цифровые и пунктуационные символы английского языка, а также набор управляющих символов, которые не представляют собой печатаемых символов и могут быть закодированы. Например, заглавная буква A представлена в 7 битах как 100 00012, 0x41 (1018), цифра 2 — 011 00102 0x32 (628), символ } — 111 11012 0x7D (1758), а управляющий символ RETURN — 000. 11012 0x0D (158). В отличие от этого, большинство компьютеров хранят данные в памяти, организованной в виде 8-разрядных байтов.

UTF-16 — еще одна схема кодирования, в которой для представления символов используются либо два, либо четыре байта, но она используется реже, чем UTF-8. К другим схемам кодирования относятся ISO-8859 и Windows-1252, которые до сих пор используются в старых системах и приложениях.

Проблемы с кодировкой текста могут приводить к ошибкам и неожиданному поведению программ. Например, если программа ожидает, что текст будет закодирован с использованием UTF-8, а получает текст, закодированный с использованием другой схемы кодирования, то программа может оказаться не в состоянии правильно интерпретировать текст.

Кодирование звуковой информации

Под кодировкой звука понимается способ хранения и передачи аудиоданных. Существует два основных типа форматов — несжатый и сжатый.

Несжатый звук в основном встречается на компакт-дисках в формате PCM. В общем случае кодирование звука означает переход от несжатого PCM к какому-либо сжатому аудиоформату. Такие файлы занимают гораздо больше цифрового пространства.

Сжатый звук делится на две группы: без потерь и с потерями:

Аудио без потерь может быть декодировано обратно в то же самое несжатое аудио. Это удобно для архивирования аудиозаписей с максимально возможным качеством.
Сжатие с потерями подразумевает некоторую потерю информации. Компьютерные алгоритмы изучают исходный звук и удаляют до 90% информации.

Битрейт определяет размер файла. Битрейт файла — это количество бит в секунду, используемых для представления звука. Так, в файле 128 кбит/с для кодирования аудиосигнала используется 128 000 бит в секунду. Обычно скорость передачи данных измеряется в кбит/с (килобитах в секунду) и мбит/с (мегабитах в секунду). Высокая скорость передачи данных сама по себе не обязательно означает высокое качество; необходимо учитывать и другие факторы, например скорость Интернета. Чем выше битрейт, тем более четким будет потоковое воспроизведение.

Битовая глубина определяет, сколько битов было записано в каждом образце. Поэтому чем выше битовая глубина, тем точнее можно передать реальный аналоговый источник звука.

При минимальной битовой глубине возможны только два варианта измерения точности звука: 0 — полная тишина и 1 — полная громкость. Чем выше битовая глубина, тем точнее закодированный звук. Например, стандартный 16-разрядный аудио компакт-диск имеет 216 (или 65 536) значений.

Частота дискретизации показывает, сколько раз в секунду записывается аудиоклип. Измеряется в герцах (Гц) или килогерцах (кГц) — 44100 сэмплов в секунду могут быть выражены как 44100 Гц.
Для цифровых аудиозаписей частота дискретизации сопоставима с частотой кадров в видеофильме. Чем больше аудиоданных (сэмплов) собрано, тем ближе записанные данные к оригинальному звуку.

Кодирование числовой информации

Таблица преобразования шестнадцатеричной / десятичной / восьмеричной / двоичной систем счисления

Шестнадцатеричная десятичная восьмеричная двоичная

0	0	0	0
1	1	1	1
2	2	2	10
3	3	3	11
4	4	4	100
5	5	5	101
6	6	6	110
7	7	7	111
8	8	10	1000
9	9	11	1001
А	10	12	1010
В	11	13	1011
С	12	14	1100
D	13	15	1101
E	14	16	1110
F	15	17	1111

Примеры

Бирюзовый цвет: Значения RGB: (64, 224, 208). Оттенок бирюзы с умеренной интенсивностью красного (64), сильной интенсивностью зеленого (224) и умеренной интенсивностью синего (208).
Если представить число 10 в двоичной системе — это 1010. В 8-битном представленим 10 будет выглядеть как 00001010.
В ASCII каждый символ представлен целым числом от 0 до 127, и каждое число имеет свой ASCII-код. Например, цифра '5' имеет символ: 5, ASCII-код: 53.

Насколько полезной была для вас статья?

Рейтинг: 5.00 (Голосов: 1)

Заметили ошибку?

Выделите текст и нажмите одновременно клавиши «Ctrl» и «Enter»