Решение задач на тему «Кодирование текстовой информации»

Решение задач на тему «Кодирование текстовой информации»

Для представления текстовой (символьной) информации в компьютере используется алфавит мощностью 256 символов. Один символ из такого алфавита несет 8 бит информации (2 8 =256). 8 бит =1 байту, следовательно, двоичный код каждого символа в компьютерном тексте занимает 1 байт памяти.

Уровень «3»

1. Сколько бит памяти займет слово «Микропроцессор»?([1], c.131, пример 1)

Слово состоит из 14 букв. Каждая буква – символ компьютерного алфавита, занимает 1 байт памяти. Слово занимает 14 байт =14*8=112 бит памяти.

Ответ: 112 бит

2. Текст занимает 0, 25 Кбайт памяти компьютера. Сколько символов содержит этот текст? ([1], c.133, №31)

Переведем Кб в байты: 0, 25 Кб * 1024 =256 байт. Так как текст занимает объем 256 байт, а каждый символ – 1 байт, то в тексте 256 символов.

Ответ: 256 символов

3. Текст занимает полных 5 страниц. На каждой странице размещается 30 строк по 70 символов в строке. Какой объем оперативной памяти (в байтах) займет этот текст? ([1], c.133, №32)

30*70*5 = 10500 символов в тексте на 5 страницах. Текст займет 10500 байт оперативной памяти.

Ответ: 10500 байт

4. Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения из пушкинского четверостишия:

Певец-Давид был ростом мал, Но повалил же Голиафа! (ЕГЭ_2005. демо, уровень А)

400 бит

50 бит

400 байт

5 байт

В тексте 50 символов, включая пробелы и знаки препинания. При кодировании каждого символа одним байтом на символ будет приходиться по 8 бит, Следовательно, переведем в биты 50*8= 400 бит.

Ответ: 400 бит

5. Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения в кодировке КОИ-8: Сегодня метеорологи предсказывали дождь. (ЕГЭ_2005, уровень А)

В таблице КОИ-8 каждый символ закодирован с помощью 8 бит. См. решение задачи №4.

6. Считая, что каждый символ кодируется 16 битами, оцените информационный объем следующего предложения в кодировке Unicode:

Каждый символ кодируется 8 битами.

(ЕГЭ_2005, уровень А)

34 символа в предложении. Переведем в биты: 34*16=544 бита.

7. Каждый символ закодирован двухбайтным словом. Оцените информационный объем следующего предложения в этой кодировке:

В одном килограмме 100 грамм.

(ЕГЭ_2005, уровень А)

19 символов в предложении. 19*2 =38 байт

Уровень «4»

8. Текст занимает полных 10 секторов на односторонней дискете объемом 180 Кбайт. Дискета разбита на 40 дорожек по 9 секторов. Сколько символов содержит текст? ([1], c.133, №34)

40*9 = 360 -секторов на дискете.

180 Кбайт : 360 * 10 =5 Кбайт – поместится на одном секторе.

5*1024= 5120 символов содержит текст.

Ответ: 5120 символов

9. Сообщение передано в семибитном коде. Каков его информационный объем в байтах, если известно, что передано 2000 символов.

Если код символа содержит 7 бит, а всего 2000 символов, узнаем сколько бит займет все сообщение. 2000 х 7=14000 бит.

Переведем результат в байты. 14000 : 8 =1750 байт

Ответ: 1750 байт.

Уровень «5»

10. Сколько секунд потребуется модему, передающему сообщение со скоростью 28800 бит/с, чтобы передать 100 страниц текста в 30 строк по 60 символов каждая, при условии, что каждый символ кодируется одним байтом? (ЕГЭ_2005, уровень В)

Найдем объем сообщения. 30*60*8*100 =1440000 бит.

Найдем время передачи сообщения модемом. 1440000 : 28800 =50 секунд

Ответ: 50 секунд

11. Сколько секунд потребуется модему, передающему сообщения со скоростью 14400 бит/с, чтобы передать сообщение длиной 225 Кбайт? (ЕГЭ_2005, уровень В)

Переведем 225 Кб в биты.225 Кб *1024*8 =1843200 бит.

Найдем время передачи сообщения модемом. 1843200: 14400 =128 секунд.

Ответ: 128 секунд

Кодирование (декодирование) текстовой информации.

Методические рекомендации:

В задачах такого типа используются понятия:

Кодирование –отображение дискретного (прерывного, импульсного) сообщения в виде определенных сочетаний символов.

Код (от французского слова code – кодекс, свод законов) – правило по которому выполняется кодирование.

Кодовая таблица (или кодовая страница) – таблица, устанавливающая соответствие между символами алфавита и двоичными числами.

Примеры кодовых таблиц (имеются на CD диске к учебнику Н. Угринович):

КОИ-7, КОИ-8 – кодирование русских букв и символов (семи-, восьми -битное кодирование)

1) #154 неразрывный пробел.

Рис.1 Кодировка КОИ8-Р

ASCII –AmericanStandardCodeforInformationInterchange(американский стандарт кодов для обмена информацией) – это восьмиразрядная кодовая таблица, в ней закодировано 256 символов (127- стандартные коды символов английского языка, спецсимволы, цифры, а коды от 128 до 255 – национальный стандарт, алфавит языка, символы псевдографики, научные символы, коды от 0 до 32 отведены не символам, а функциональным клавишам).

Рис. 2 Международная кодировка ASCII

Unicode – стандарт, согласно которому для представления каждого символа используется 2 байта. (можно кодировать математические символы, русские, английские, греческие, и даже китайские).Cего помощью можно закодировать не 256, а 65536 различных символов. Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов

СР1251 - наиболее распространенной в настоящее время является кодировка Microsoft Windows, ("CP" означает "Code Page", "кодовая страница").

1) #160 неразрывный пробел,

2) #173 мягкий перенос.

Рис. 3 Кодировка CP1251

СР866 - кодировка под MS DOS

1) #255 неразрывный пробел.

Рис. 4 Кодировка СР866

Мас –кодировка в ПК фирмы Apple, работающих под управлением операционной системыMac OS.

#202 неразрывный пробел.

Рис. 5 Кодировка Mac

ISO 8859-5 -Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку.

📎📎📎📎📎📎📎📎📎📎