|
|
Формат текстовых файлов 2
| Примечание. Текстовые файлы, которые содержат только сим¬волы первой половины кодовой таблицы (п.2.3), часто называют файлами ASCII.
В текстовых файлах можно создавать также таблицы и не-сложные «стилизованные» рисунки. Для этих целей используют¬ся символы псевдографики и специальные символы-заполнители из второй половины кодовой таблицы (п.2.3). Необходимо пом¬нить, что таблицы и «рисунки» не меняют характера файла: лю¬бой символ «рисунка» по роли в файле ничем не отличается от обычной буквы или, скажем, точки.
Некоторые редакторы позволяют выровнять текст по левой и правой границе страницы (как в типографском тексте) и даже выполнить автоматический перенос слов. Выравнивание и пере-нос никак не изменяют анатомии текстового файла: мы просто устанавливаем для каждой строки одинаковую длину (например, 64 символа). В пределах этой длины редактор выравнивает слова, вставляя между ними дополнительные пробелы и, при возмож¬ности, выполняя перенос.
Основное достоинство текстового файла — простота и уни-версальность. Фактически — это мировой стандарт представле-ния текстовой информации. Текстовый файл «канонического» формата, о котором мы рассказали, можно подготовить и прочи¬тать всюду, на любом ПК, — в Москве, Париже или на острове Пасхи (правда, не надо забывать, что не везде есть драйверы для воспроизведения русских букв).
До сего времени текстовые файлы широко используются там, где не имеет особого значения качество воспроизведения доку-мента на бумаге: для хранения и печати всевозможной рутинной информации, для обмена данными между людьми через мировые сети, для подготовки черновиков серьезных книг и т. д. Кроме того, «канонический» формат имеют файлы настроек большин-ства современных систем (включая DOS и Windows).
Имя текстового файла «канонического» формата рекоменду-ется снабжать традиционным расширением .ТХТ.
Для создания, просмотра и модификации (редактирования) текстовых документов используются специальные прикладные программы, которые называются редакторами текстов. В мире разработаны сотни (а может быть, и тысячи) текстовых редакто-ров: большинство из них работает с «каноническими» файлами, однако наиболее совершенные программы (класса Microsoft Word) используют другие форматы, и создаваемые ими файлы нельзя считать текстовыми. Впрочем, существуют средства пре-образования (конвертирования) текстового документа из одного формата в другой (см., например, п.11.10).
Кодировка текстовых файлов. В главе 2 (п.2.3) вы узнали, что текстовая информация (если в ней имеются символы второй по-ловины кодовой таблицы) может быть представлена в двух коди-ровках - СР-866 (MS-DOS) и СР-1251 (Windows ). Поэтому, ес¬ли текстовый файл подготовлен в среде MS-DOS (например, с помощью MS-DOS Editor), его нельзя читать средствами Win-dows; и наоборот, файл .ТХТ, подготовленный в СР-1251, будет неправильно прочитан в MS-DOS. Поясним сказанное простей-шим примером.
Пусть в MS-DOS вы набрали слово «компьютер»:
компьютер
170 174 172 175 236 238 226 165 224
В текстовый файл будут занесены коды СР-866 (см. рис. 2.7): 170, 174 и т. д. Если эти коды будет читать, скажем, приложение Блокнот (см. п.9.3), он заглянет в СР-1251 и расшифрует их по своему (рис. 2.8):
6®- м о в f a
(например, 238 в СР-866 — это код буквы «ю», а в СР-1251 — код буквы «о»).
И наоборот, если это слово набрано в Блокноте, то MS-DOS (например, MS-DOS Editor), прочитает его как ъюья№_ехЁ
(последние символы, в зависимости от драйвера, могут выгля-деть иначе).
Поэтому, если читая текстовый файл, вы увидели на экране «абракадабру»,- следует разобраться, в какой среде он набран (например, файлы настроек Windows 95 кодируются в СР-1251).
В п. 11.10 мы увидим, как можно перевести текстовый файл из одной кодировки в другую.
Н Следует помнить о принципиальном отличии формата тек-стовых файлов от формата текстовых документов, изучаемых на¬ми в главах 10—11. В какой-то степени текстовыми файлами можно считать также файлы формата .RTF (п. 11.10) и HTML (п. 16.5). Например, Web-страницу в формате HTML, которая является объектом обработки обозревателей (см. главу 17), можно считать просто неким исходным текстом программы, которую интерпретирует обозреватель (почти все исходные тексты про¬грамм записываются в текстовых файлах). |
| Категория: компьютеры 4 | Добавил: sergei4 (31.10.2010)
|
| Просмотров: 526
| Рейтинг: 0.0/0
|
|
|