|
Перекодировщики - незаменимые помощники в хаосе букв, байт …
Сергей Бондарь
"А-а-а, примитивный шифр,
КаГэбЭ ничего нового с войны не придумал!"
(Реплика старого шифровальщика
из к/ф "На Дерибасовской …")
Помнится года три-четыре назад, когда российские пользователи еще только начинали осознавать, что интернет способен стать реальной альтернативой почтамту, телеграфу и телефону вместе взятым, проблема неправильной кодировки сообщений (в почтовых программах, чатах, конференциях и т. д.) встала остро и во весь свой недюжинный рост. А посылая электронное письмо, скажем, друзьям в США, Израиль, Францию или Канаду, можно было быть уверенным, что оно дойдет до места назначения в правильной кодировке только в том случае, если письмо было написано латиницей - по английски ли, или "по-турецки", как говорила моя школьная учительница английского языка, когда мы в шифровальных же целях переписывались на уроках, используя латинские буквы для написания вполне русских слов.
Ежедневно на ваш e-mail приходит, как минимум, несколько писем, вы что-то ищете и скачиваете из сети: странички, тексты, а порой и целые сайты. И очень часто получается такая неприятная вещь: скачать-то скачали, а прочитать не можете. Можно, конечно, прямо в браузере или почтовом клиенте перекодировать. Однако далеко не всегда, таким образом, что-нибудь получается, даже если основательно помучаться. Часто невозможно определить кодировку, верное направление перевода. Иногда письмо или текст перекодируются шибко умными почтовыми серверами по нескольку раз, и распознать их тогда в обычном почтовом клиенте практически невозможно.
Итак, вы получили сообщение по электронной почте и не можете его прочесть. Эта проблема успешно решается с помощью специальной утилиты - автоматического декодера таких сообщений. Вам нужно всего лишь скопировать текст в неправильной кодировке в окно такой программы через буфер обмена (clipboard), после чего остается нажать на кнопку и прочитать результат. Кодировщик автоматически подбирает схему перекодирования, приводящую к восстановлению читаемого текста на русском языке. Как известно, в различных компьютерах и операционных системах используется не менее пяти различных кодировок русских букв.
Как правило, подобные программы относятся к категории бесплатно распространяемых, являются разработками отечественных производителей, а найти их и скачать вы можете, например, по адресу www.freeware.ru. Мы же попробуем разобраться с некоторыми представителями этого класса программ.
Иероглиф 3.1
Разработчик: Михаил Морозов
www.adelaida.net/hieroglyph/hgfull31.exe
Размер: 1890 кб

Уникальность Иероглифа состоит в том, что он совмещает в себе функции сразу трех программ: переводчика транслита, перекодировщика и текстового редактора. Работает Иероглиф со всеми разновидностями текста, может перекодировать почтовые сообщения, превращать HTML в текстовый документ, менять кодировки (Windows (cp-1251), KOI (koi-8r), DOS(alt, cp-866), ISO (iso-8859-5), переводить кириллицу в латиницу и обратно (это называется транслитерацией). Именно эта возможность является одной из ключевых особенностей Иероглифа. В основе работы программы лежат алгоритмы искусственного интеллекта, коих, как утверждает автор, заложено там более 50. Эта особенность позволяет редактору фактически без ошибок интерпретировать любые варианты транслита, перекодировать тексты, видеть слова правильно независимо от неверного набора букв или лишних знаков, которые они могут содержать.
Иероглиф также позволяет автоматически переключать раскладку клавиатуры при печати, автоматически предлагать варианты исправления слов с ошибками, автоматически проверять и исправлять испорченные тексты, переформатировать старые тексты с жесткими переносами и выравниванием, а также может активизировать "горячие клавиши" в других приложениях - для запуска себя, любимого.
Поскольку вариантов транслитерации существует не так уж мало, возможен пошаговый перевод текста: программа автоматически выделяет подозрительные слова и предлагает разные варианты их перевода (правда, программа обращает внимание пользователя не во всех спорных случаях). Желаемую кодировку пользователь может выбрать и сам, а может менять их одну за другой - как больше нравится. Благодаря понятному интерфейсу, большинство базовых операций можно проводить одним щелчком мыши, не открывая ради этого бесчисленные пункты меню. Плюс ко всему, Иероглиф 3.1 поддерживает не только русский, но английский и украинский транслитерированные интерфейсы.
Как и все программные продукты, Иероглиф иногда капризничает. Так, например, при выборе пользователем режима пошагового перевода текст может перевестись сразу и целиком. Если увлечься процессом и начать экспериментировать, меняя кодировки одну за другой, содержимое вполне может стать нечитаемым, и обратно уже не перекодируется. Такое случается редко, но тем не менее. А в остальном Иероглиф вполне заслуживает того, чтобы стать первым и единственным. Не верите - скачайте и убедитесь сами.
EType Mail Decoder 2.0.001
Разработчик: Александр Горлач
www.enet.ru/~gorlach/ecoder/ecsetup_rus.exe
Размер: 185 кб

Найти что-то по-настоящему полезное в море всевозможных программ сегодня не так просто. Это касается и перекодировщиков: один работает всего лишь с двумя-тремя кодировками, другой транслит не берет, а третий или почтовые файлы не признает, или перекодированные тексты не восстанавливает. Не очень притягательно? Думаю, да. Поэтому, если хотите избежать подобных проблем, смело загружайте на свой ПК EType Mail Decoder 2.0.001, потому что все выше сказанное к нему не относится. По сути своей это мощный перекодировщик и автоматический восстановитель испорченных писем. Программа удобна, проста в обращении и поддерживает практически все используемые кодировки: KOI8-R, WIN-1251, ISO 8859-5, MSDOS-866, MAC-10007, Russkaja Latinica, quoted printable (=C2=EE=F2 =EE=ED=E0), RTF style (\'c2\'ee\'f2 \'ee\'ed\'e0), семибитную (%C2%EE%F2 %EE%ED%E0), UTF-8, UTF-7, Unicode, BinHex 4.0, UUUEncode/UUDecode, Base 64. Декодер способен автоматически восстанавливать письма, перекодированные до четырех раз, что во много раз облегчает работу с почтовыми файлами.
Практически любой вариант перекодировки может выполняться автоматически, что избавляет пользователя от многих лишних проблем, но для пытливых умов предусмотрен и ручной вариант работы. Независимо от пути кодирования, EType Mail Decoder фиксирует любую операцию, сохраняя все свои действия в файле, прочитать который можно в меню "История".
Работает декодер с двумя типами файлов: .eml и .txt. Тексты из других форматов в программу лучше всего вносить через буфер обмена, после чего их смело можно обрабатывать и сохранять. Интерфейс программы очень прост, имеет английский и русский варианты, все операции программного меню дублируются отдельными иконками на панели инструментов, что значительно ускоряет темпы работы. Декодер подойдет, наверно, любой категории пользователей, но полным чайникам я его все же не рекомендую.
Из недостатков Etype можно выделить следующие. Перевод текста из кириллицы в латиницу и наоборот возможен только в режиме ручного декодирования, составляет две отдельные операции и происходит только в кодировке Windows-1251. Время от времени программа отказывается перекодировать тексты из нескольких слов, объясняя это тем, что они слишком малы. Что ж, видимо значимость декодера не позволяет ему опускаться до мелочей.
VCW VicMan's ReCoder 1.01
Разработчик: Виктор Сажин
members.xoom.com/vicman/vrec10.exe
Размер: 377 кб

Этот перекодировщик транслирует текст из латиницы в кириллицу и обратно, а также работает с четырьмя основными кодировками: KOI8-R, WIN-1251, ISO 8859-5, MSDOS-866. ReCoder работает с любыми текстами, может декодировать многократно перекодированные документы. Если программа посчитает текст легким, она переведет его автоматически, при вводе из буфера или открытии файла. Особо сложные случаи можно попытаться раскодировать вручную, с помощью опции "Доктор" на панели инструментов. Кроме того, перед работой с транслитом в специальном пункте можно выбрать разные варианты перевода кириллицы в латиницу.
В ReCoder есть модуль под кодовым названием "Буфер", который может стать долгожданным подарком для всех, кто активно пользуется всевозможными чатами, веб-конференциями, IRC или ICQ. В последнем случае утилита интегрируется с "аськой" и работает только с ее текстами.
Размер программы также говорит в ее пользу: всего лишь 327 кб, а в простоте и доступности интерфейса вы можете убедиться сами. Как всегда, при всех достоинствах найдутся и недостатки. Например, у вас никак не получится перевести латиницу в кириллицу "одним движением руки": придется сначала кликнуть на иконке "Латиница", а затем на "WIN-1251". Не всегда поможет и "Доктор", видимо, в некоторых случаях у него не хватает образования. Есть свой бич и у "Буфера" - это настройка опций. Найти их легко, а вот настроить ой как непросто. Вам придется изрядно поломать голову, прежде чем окончательно разберетесь, что к чему. Посему - несколько советов. Прежде чем настраивать отдельные варианты перекодировки, выделите их в отдельном пункте меню. Работа с транслитом будет успешной только в том случае, если при настройке вы выберете для использования все остальные кодировки, кроме латиницы, и не забудьте про трансляцию в кириллицу. Начинающим юзерам от использования программы советую лучше воздержаться.
SNK DEcode! 3.1.3
Разработчик: SNK Software
www.snkey.net/download/de31inst.exe
Размер: 327 кб

Наглядность, простота и быстрота в современном софте - вещи, наверное, столь же несовместные, как гений и злодейство. Но если воспользоваться перекодировщиком SNK DEcode!, то можно легко убедиться в обратном. Первое, что бросается в глаза при знакомстве с программой, - это удобный интерфейс. Каждый из вариантов перекодировки выделен на панели инструментов отдельной и довольно крупной иконкой, что позволяет сразу же разобраться, что к чему. Вам даже не обязательно пользоваться обычными пунктами меню - иконки дублируют все операции. По виду окно декодера чем-то даже напоминает нетскейповский браузер. SNK DEcode! 3.1.3 перекодирует KOI8-R, WIN-1251, ISO 8859-5, MSDOS-866 и MAC-10007 в любой последовательности, возможно совершать до пяти перекодировок текста за один проход. Кроме того, программа поддерживает x-www-urlencode (текст вида I=%0F%A1), открывает att-файлы. Если заданные схемы перекодировки не устраивают, можно создать и сохранить свою собственную, с помощью специального приложения. Правда, такое сохранение станет возможным только после бесплатной регистрации программы.
Поддерживается транслит, очистка текста от HTML-тегов и лишних пробелов. Также можно помещать программу в tray и/или запускать вместе с Windows. Подобно переводчику, DEcode имеет два окна: в одно вводится текстовый фрагмент, а другое выдает уже перекодированный вариант. Скорость программы вызовет только приятное удивление, а работать с ней сможет каждый.
О недостатках. Прежде всего, это касается транслита - программа переводит символы в хаотичном порядке и прочитать полученные тексты в результате практически невозможно. Подсказок вы тоже не дождетесь. Если неизвестно, из какой кодировки в какую переводить, придется пользоваться методом тыка: в конце концов выход найдется.
Штирлиц
Разработчик: Всеволод Лукьянин
sql.download.ru/cgi-bin/download.cgi?606&rus
Размер: 950 кб

Несмотря на то, что "Штирлиц" появился на свет уже почти два года назад, он по-прежнему остается весьма популярным, и отставшим от жизни его назвать никак нельзя. И причина этого в том, что "Штирлиц" во всех отношениях стоящий перекодировщик, на редкость удачно сочетающий в себе все основные функции кодирования, которые практически невозможно найти вместе, в одной программе.
Для этого декодера доступны все русские кодировки и их сочетания, латиница, определение фрагментов с разными кодировками, Quoted printable, Unicode, HTML, Uuencode, Base64, Xxencode, Binhex, нормализация концов строк (CR, LF). "Штирлиц" может работать одновременно с несколькими файлами, ведет слежение за буфером обмена, автоматически корректирует его работу. В программу можно добавлять новые кодировки и исправлять по своему усмотрению уже существующие схемы перекодирования; это же касается и всевозможных вариантов транслита. У "Штирлица", в отличие от многих других перекодировщиков, предусмотрен вариант перевода текста из одной кодировки в другую методом Drag & Drop, это в наше время тоже большая редкость.
Но и это еще не все. Программа имеет приложение, предусматривающее пакетное перекодирование групп файлов из текущей кодировки в заданную, причем текущая определяется автоматически, в том числе и Unicode. Утилиты с пакетной кодировкой встречаются не так уж часто, а сочетающие в себе традиционное и пакетное декодирование - вообще очень большая редкость. Поэтому и здесь "Штирлиц" фактически не имеет себе равных. Программа оснащена русским и английским интерфейсами, все опции находятся только на панели инструментов и не требуют дополнительных хождений по пунктам меню.
Но, как всегда, значимость влечет за собой немало проблем, точнее, недостатков. В опциях "Штирлица" разобраться не так уж просто, особенно начинающему пользователю. Транслит возможен только из латиницы в кириллицу, а неоднократно перекодированные тексты могут так и остаться непрочитанными.
|