Главная arrow Учебники arrow Информатика и ИКТ 10-11 класс Семакин 2012 arrow §3 Измерение информации. Объемный подход

§3 Измерение информации. Объемный подход

Информатика и ИКТ 10-11 класс Семакин, Информатика 10-11 класс Семакин, Измерение информации, Объемный подход, Как измерить объем информации, Объем информации в электронном сообщении

Вопрос об измерении количества информации является очень важным как для науки, так и для практики. В самом деле, информация является предметом нашей деятельности: мы ее храним, передаем, принимаем, обрабатываем. Поэтому важно договориться о способе ее измерения, позволяющем, например, ответить на вопросы: достаточно ли места на носителе, чтобы разместить нужную нам информацию, или сколько времени потребуется, чтобы передать ее по имеющемуся каналу связи. Величина, которая нас в этих ситуациях интересует, называется объемом информации. В таком случае говорят об объемном подходе к измерению информации.
Как измерить объем информации
Объем информации не связан с ее содержанием.
Когда говорят об объеме информации, то имеют в виду размер текста в том алфавите, с помощью которого эта информация представлена.
Объем текста в печатном издании — книге, журнале, газете — обычно измеряют в страницах. В таком случае мы считаем, что, например, книга в 500 страниц содержит больше информации, чем книга в 250 страниц.
А как вы думаете, всегда ли книга в 500 страниц содержит в два раза больше информации, чем книга в 250 страниц? Конечно, нет! Ведь разные книги могут иметь разные форматы листов. Формат листа — это его стандартный размер. Существуют различные форматы печатного листа. Кроме того, разными бывают величина шрифта, длина строки, межстрочное расстояние. Очень часто детские книги печатаются крупным шрифтом с большими интервалами между строками, да еще и с большим количеством картинок. Зачастую содержание такой книги, состоящей из нескольких десятков страниц, можно перепечатать мелким шрифтом на 2-3 страницах. Но поскольку текст в обоих случаях один и тот же, то и количество информации должно быть одинаковым. Значит, измерение информации в страницах не является универсальным.
Количество страниц в печатном издании определяет расход бумаги, а не объем информации. Разумнее измерять объем информации, заключенный в тексте, количеством знаков этого текста. Знаки — это прежде всего буквы из алфавита того языка, на котором написана книга. Но в текст входят также и знаки препинания, скобки, цифры. В тексте могут использоваться буквы других алфавитов, например английского и греческого. Пробел между словами — тоже знак. Например, на странице формата А4 (21 см х 30 см) при размере шрифта (кегле), равном 12 пунктам (стандартным единицам), и одинарном интервале между строками помещается текст объемом примерно 4000 знаков.
Определением объема информации в знаках часто пользуются в издательской практике. Например, журналисту может быть дано ограничение на объем статьи в 40 000 знаков.
Объемный способ измерения информации называют еще алфавитным подходом.
Объем информации в электронном сообщении
Выше мы говорили о телеграфном коде Бодо. В нем каждая буква алфавита кодируется пятизначным двоичным кодом. В русском алфавите 32 буквы (не считая буквы ё). Из базового курса информатики вы знаете, что если с помощью /-разрядного двоичного кода можно закодировать алфавит, состоящий из N символов, то эти величины связаны между собой по формуле:
2i = N.
Поскольку 25 = 32, то все русские буквы можно закодировать всевозможными пятиразрядными двоичными кодами от 00000 до 11111. Русский телеграфный аппарат содержит 32 клавиши с буквами. Буква «ё» пропускается, вместо нее имеется более нужная клавиша «пробел». Знаки препинания передаются словами: «зпт», «тчк». Таким образом, телеграфный аппарат при вводе переводит русский текст в двоичный код, количество символов в котором в 5 раз больше, чем в исходном тексте.
Весь английский алфавит, состоящий из 26 букв, также можно закодировать пятиразрядным двоичным кодом. В отличие от русского алфавита, остается еще 6 свободных кодов, которые можно использовать для пробела и пяти знаков препинания.
Из базового курса информатики вам известно, что в компьютерах используется двоичное кодирование информации. Для двоичного представления текстов в компьютере чаще всего используется равномерный восьмиразрядный код. С его помощью можно закодировать алфавит из 256 символов, поскольку 256 = 28. В стандартную кодовую таблицу (например, ASCII) помещаются все необходимые символы: английские и русские прописные и строчные буквы, цифры, знаки препинания, знаки арифметических операций, всевозможные скобки и пр.
В двоичном коде один двоичный разряд несет одну единицу информации, которая называется 1 бит.
При двоичном кодировании объем информации, выраженный в битах, равен длине двоичного кода, в котором информация представлена.
Более крупной единицей измерения информации является байт: 1 байт = 8 битов.
Информационный объем текста в памяти компьютера измеряется в байтах. Он равен количеству знаков в записи текста.
Одна страница текста на листе формата А4 кегля 12 с одинарным интервалом между строками (см. пример выше) в компьютерном представлении будет иметь объем примерно 4000 байтов, так как на ней помещается примерно 4000 знаков.
Помимо бита и байта, для измерения информации используются и более крупные единицы:
1 Кб (килобайт) = 210 байт = 1024 байта;
1 Мб (мегабайт) = 210 Кб = 1024 Кб;
1 Гб (гигабайт) = 210 Мб = 1024 Мб.
Объем той же страницы текста будет равным приблизительно 3,9 Кб. А книга из 500 таких страниц займет в памяти компьютера примерно 1,9 Мб.
Система основных понятий

Измерение информации - объемный подход

На бумажных носителях

На цифровых носителях и в технических системах передачи информации

Объем текста измеряется в знаках

Объем информации равен длине двоичного кода Основная единица:

1 бит - один разряд двоичного кода

 

Длина кода символа (i бит) ко­дируемого алфавита мощнос­тью N символов:

2i = N

Информационный объем текста (I), содержащего К символов:

I = К- i

 

Производные единицы

 

Байт

1 байт = 8 бит

Килобайт (Кб)

1 Кб = 1024 байт

Мегабайт (Мб)

1 Мб = 1024 Кб

Гигабайт (Гб)

1 Гб = 1024 Мб