Алфавитный подход к измерению информации
ЭВМ может хранить и обрабатывать информацию только в виде комбинации электрических сигналов двух типов, которые принято обозначать 0 и 1. Любая информация представляется в ЭВМ последовательностью этих сигналов. Такие последовательности называют двоичными кодами. 0 и 1 в коде самая мелкая единица информации и называется битом.
Какой длины должна быть кодовая группа (из скольких 0 и 1 состоять).
Рассмотрим пример. Закодировать (записать) все буквы русского алфавита одинаковым количеством нулей и единиц, но так, чтобы каждой букве соответствовал особый номер.
1. Если взять только два знака: 0 и 1, то удается закодировать только 4 буквы. Поясним это: А=00 Б=01 В=10 Г=11
Это объясняется тем, что число комбинаций из двух символов (битов) 0 и 1 по два равно 22=4.
2. Попробуем взять три знака:
А=000 Б=001 В=010 Г=011
Д=100 Е=101 Ж=110 3=111
Теперь число комбинаций равно 23= 8
3. Легко догадаться, что 25=32, т.е. использование пяти знаков позволяет закодировать однозначно каждую букву русского алфавита.
Но для представления произвольной информации в ЭВМ недостаточно закодировать только буквы. Поэтому кодирование букв (заглавных и прописных латинского и русского алфавитов), цифр, знаков препинания, спецзнаков и прочее требует использования 8 знаков (1 символ записывается кодом из 8 нулей и единиц).
Двоичный 8-разрядный код позволяет закодировать 28 =256 различных символов.
Соответствие между символами и их кодами задается с помощью таблиц кодов. В ЭВМ широко используется Код Обмена Информацией - КОИ-7.
Итак:
Код - это ключ для перевода информации из одной формы в другую.
Кодирование процесс преобразования информации в совокупность символов, определяемую кодом.
Основные понятия:
Объективным способом измерения информации является алфавитный подход. Только этот подход пригоден при использовании технических средств работы с информацией.
Алфавит – это все множество символов, используемых в некотором языке для представления информации.
Мощность алфавита – это число символов в нем.
Количество информации i , которое несет один символ (информационный вес одного символа алфавита) в тексте, и мощность алфавита N связаны формулой:
2i = N
Количество информации зависит от объема текста и от мощности алфавита.
Компьютерные редакторы работают с алфавитом мощностью 256 символов.
Скорость информационного потока – это количество информации, передаваемое от источника к приемнику за единицу времени.
Скорость выражается в единицах: бит в сек (бит/с), байт в сек (б/с), килобайт в сек (Кб/с) и т.д.
Пропускная способность информационного канала – это максимальная скорость передачи информации по данному каналу.