Алфавитный  подход к измерению информации

ЭВМ может хранить и обрабатывать информацию только в виде комбинации электрических сигналов двух типов, которые принято обозначать 0 и 1. Любая информация представляется в ЭВМ последовательностью этих сигналов. Такие последовательности называют двоичными кодами. 0 и 1 в коде самая мелкая единица информации и называется битом.

Какой длины должна быть кодовая группа (из скольких 0 и 1 состоять).

Рассмотрим пример.  Закодировать (записать) все буквы русского алфавита одинаковым количеством нулей и единиц, но так, чтобы каждой букве соответствовал особый номер.

1. Если взять только два знака: 0 и 1, то удается закодировать только 4 буквы. Поясним это: А=00    Б=01    В=10   Г=11

Это объясняется тем, что число комбинаций из двух символов (битов) 0 и 1 по два равно     22=4.

2. Попробуем взять три знака:

А=000        Б=001                 В=010                  Г=011

Д=100        Е=101                  Ж=110                3=111

             Теперь число комбинаций равно  23= 8

3. Легко догадаться, что 25=32, т.е. использование пяти знаков позволяет закодировать однозначно каждую букву русского алфавита.

Но для представления произвольной информации в ЭВМ недостаточно закодировать только буквы. Поэтому кодирование букв (заглавных и прописных латинского и русского алфавитов), цифр, знаков препинания, спецзнаков и прочее требует использования 8 знаков  (1 символ записывается кодом из 8 нулей и единиц).

 Двоичный 8-разрядный код позволяет закодировать 28 =256 различных символов.

Соответствие между символами  и их кодами задается с помощью таблиц кодов. В ЭВМ широко используется Код Обмена Информацией - КОИ-7.

Итак:

Код - это ключ для перевода информации из одной формы в другую.

Кодирование  процесс преобразования информации в совокупность символов, определяемую кодом.

 

Основные понятия:

Объективным способом измерения информации является алфавитный подход. Только этот подход пригоден при использовании технических средств работы с информацией.

Алфавит – это все множество символов, используемых в некотором языке для представления информации.

Мощность алфавита – это число символов в нем.

Количество информации i , которое несет один символ (информационный вес одного символа алфавита) в тексте, и мощность алфавита N связаны формулой:

2i = N

Количество информации зависит от объема текста и от мощности алфавита.

Компьютерные редакторы работают с алфавитом мощностью 256 символов.

Скорость информационного потока – это количество информации, передаваемое от источника к приемнику за единицу времени.

Скорость выражается в  единицах: бит в сек (бит/с), байт в сек (б/с), килобайт в сек (Кб/с) и т.д.

Пропускная способность информационного канала – это максимальная скорость передачи информации по данному каналу.

В МЕНЮ

Используются технологии uCoz