Решение задач на тему «Кодирование текстовой информации»
Для представления текстовой (символьной) информации в компьютере используется алфавит мощностью 256 символов. Один символ из такого алфавита несет 8 бит информации (2 8 =256). 8 бит =1 байту, следовательно, двоичный код каждого символа в компьютерном тексте занимает 1 байт памяти.
Уровень «3»
1. Сколько бит памяти займет слово «Микропроцессор»?([1], c.131, пример 1)
Слово состоит из 14 букв. Каждая буква – символ компьютерного алфавита, занимает 1 байт памяти. Слово занимает 14 байт =14*8=112 бит памяти.
Ответ: 112 бит
2. Текст занимает 0, 25 Кбайт памяти компьютера. Сколько символов содержит этот текст? ([1], c.133, №31)
Переведем Кб в байты: 0, 25 Кб * 1024 =256 байт. Так как текст занимает объем 256 байт, а каждый символ – 1 байт, то в тексте 256 символов.
Ответ: 256 символов
3. Текст занимает полных 5 страниц. На каждой странице размещается 30 строк по 70 символов в строке. Какой объем оперативной памяти (в байтах) займет этот текст? ([1], c.133, №32)
30*70*5 = 10500 символов в тексте на 5 страницах. Текст займет 10500 байт оперативной памяти.
Ответ: 10500 байт
4. Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения из пушкинского четверостишия:
Певец-Давид был ростом мал, Но повалил же Голиафа! (ЕГЭ_2005. демо, уровень А)
400 бит
50 бит
400 байт
5 байт
В тексте 50 символов, включая пробелы и знаки препинания. При кодировании каждого символа одним байтом на символ будет приходиться по 8 бит, Следовательно, переведем в биты 50*8= 400 бит.
Ответ: 400 бит
5. Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения в кодировке КОИ-8: Сегодня метеорологи предсказывали дождь. (ЕГЭ_2005, уровень А)
В таблице КОИ-8 каждый символ закодирован с помощью 8 бит. См. решение задачи №4.
6. Считая, что каждый символ кодируется 16 битами, оцените информационный объем следующего предложения в кодировке Unicode:
Каждый символ кодируется 8 битами.
(ЕГЭ_2005, уровень А)
34 символа в предложении. Переведем в биты: 34*16=544 бита.
7. Каждый символ закодирован двухбайтным словом. Оцените информационный объем следующего предложения в этой кодировке:
В одном килограмме 100 грамм.
(ЕГЭ_2005, уровень А)
19 символов в предложении. 19*2 =38 байт
Уровень «4»
8. Текст занимает полных 10 секторов на односторонней дискете объемом 180 Кбайт. Дискета разбита на 40 дорожек по 9 секторов. Сколько символов содержит текст? ([1], c.133, №34)
40*9 = 360 -секторов на дискете.
180 Кбайт : 360 * 10 =5 Кбайт – поместится на одном секторе.
5*1024= 5120 символов содержит текст.
Ответ: 5120 символов
9. Сообщение передано в семибитном коде. Каков его информационный объем в байтах, если известно, что передано 2000 символов.
Если код символа содержит 7 бит, а всего 2000 символов, узнаем сколько бит займет все сообщение. 2000 х 7=14000 бит.
Переведем результат в байты. 14000 : 8 =1750 байт
Ответ: 1750 байт.
Уровень «5»
10. Сколько секунд потребуется модему, передающему сообщение со скоростью 28800 бит/с, чтобы передать 100 страниц текста в 30 строк по 60 символов каждая, при условии, что каждый символ кодируется одним байтом? (ЕГЭ_2005, уровень В)
Найдем объем сообщения. 30*60*8*100 =1440000 бит.
Найдем время передачи сообщения модемом. 1440000 : 28800 =50 секунд
Ответ: 50 секунд
11. Сколько секунд потребуется модему, передающему сообщения со скоростью 14400 бит/с, чтобы передать сообщение длиной 225 Кбайт? (ЕГЭ_2005, уровень В)
Переведем 225 Кб в биты.225 Кб *1024*8 =1843200 бит.
Найдем время передачи сообщения модемом. 1843200: 14400 =128 секунд.
Ответ: 128 секунд
Кодирование (декодирование) текстовой информации.
Методические рекомендации:
В задачах такого типа используются понятия:
Кодирование –отображение дискретного (прерывного, импульсного) сообщения в виде определенных сочетаний символов.
Код (от французского слова code – кодекс, свод законов) – правило по которому выполняется кодирование.
Кодовая таблица (или кодовая страница) – таблица, устанавливающая соответствие между символами алфавита и двоичными числами.
Примеры кодовых таблиц (имеются на CD диске к учебнику Н. Угринович):
КОИ-7, КОИ-8 – кодирование русских букв и символов (семи-, восьми -битное кодирование)
1) #154 неразрывный пробел.
Рис.1 Кодировка КОИ8-Р
ASCII –AmericanStandardCodeforInformationInterchange(американский стандарт кодов для обмена информацией) – это восьмиразрядная кодовая таблица, в ней закодировано 256 символов (127- стандартные коды символов английского языка, спецсимволы, цифры, а коды от 128 до 255 – национальный стандарт, алфавит языка, символы псевдографики, научные символы, коды от 0 до 32 отведены не символам, а функциональным клавишам).
Рис. 2 Международная кодировка ASCII
Unicode – стандарт, согласно которому для представления каждого символа используется 2 байта. (можно кодировать математические символы, русские, английские, греческие, и даже китайские).Cего помощью можно закодировать не 256, а 65536 различных символов. Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов
СР1251 - наиболее распространенной в настоящее время является кодировка Microsoft Windows, ("CP" означает "Code Page", "кодовая страница").
1) #160 неразрывный пробел,
2) #173 мягкий перенос.
Рис. 3 Кодировка CP1251
СР866 - кодировка под MS DOS
1) #255 неразрывный пробел.
Рис. 4 Кодировка СР866
Мас –кодировка в ПК фирмы Apple, работающих под управлением операционной системыMac OS.
#202 неразрывный пробел.
Рис. 5 Кодировка Mac
ISO 8859-5 -Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку.