computery.ru

flashback

 на главную

 заложить
 подписка
 editorial

hardware

 железо
 ликбез
 support

software

 программы
 support

connect

 интернет
 телефония

history

 как это было
 market history
 письма
 случаи
 mustdie
 о журнале
 архив журнала

сервис

 комиссионка
 конференция
 драйверы
 гостевая книга
 отзывы
 почта

реклама

поиск



PageRank

 


техническая поддержка

 

Связь. Вопросы и ответы #40

FeodoR
feodor@mailandnews.com


  1. Что такое cookies? Это опасно?
  2. При посещении некоторых сайтов у меня нечитабелен текст.

 

040_1. У меня установлен файрволл Norton Internet Security, и при просмотре практически любого сайта он выдает предупреждение о сохранении каких-то cookies. Что это? Это опасно?
 

В большинстве случаев - нет. Cookies - это технология взаимодействия между сервером и клиентом, способная персонифицировать информацию, передаваемую на ваш компьютер. Например, при использовании cookies при входе на любимый почтовый сервер вполне реально показать окошко с надписью "Здравствуй, Вася". И технология эта крайне успешно применяется. Основана она на генерации некоторого маленького текстового файла, в котором закодированы предпочтения пользователя, его входное имя на какие-либо сервера, результат голосования на каком-либо сайте и т. д. В файле cookie информация может быть любой (и, чаще всего, наполовину кодированной), например:
pixelpopslot
5
schneemann.8m.com/
1600
1482425216
29456104
778171712
29455903
*
"Печенье" обычно используется в две стадии. Допустим, вы зашли на известный веб-портал Yahoo!, чтобы чего-либо найти. В процессе выбора категорий веб-сервер генерирует файл cookie со списком выбранных категорий, именем пользователя (если вы зарегистрировались) и так далее - и пересылает его на ваш компьютер.

Причем, как правило, это происходит БЕЗ ВАШЕГО ВЕДОМА. Когда вы в следующий раз посетите Yahoo!, то браузер автоматически перешлет нужное cookie на сайт Yahoo! для того, чтобы немного персонифицировать информацию для вас: отобразить ваше имя, предложить наиболее интересные сайты из выбранных ранее категорий и т. д. И опять этот процесс будет сделан без вашего ведома.

То есть ваши перемещения в интернете вполне можно отследить с помощью cookies. Неприятно? Программы-файрволлы обычно дают несколько вариантов работы с cookies. Можно, например, запретить все. Однако это не выход, так как вас перестанут узнавать многие сайты - например, www.mail.ru.

На этом портале также организована работа с cookies, и их отключение приведет к невозможности прочесть свою почту. Однако не стоит и разрешать все приходящие на ваш компьютер cookies. Особенно если вы бродите по полулегальной части интернета.

Некоторое время назад был скандал, связанный с тем, что злоумышленник, пользуясь встроенным в процессор Intel Pentium III серийным номером и технологией cookies, может перехватить большую часть информации, содержащуюся на компьютере пользователя. В настоящее время ведется консилиум по поводу тотального запрещения cookies. Хотя вероятность взлома через cookies крайне мала, стоит все-таки отслеживать их появление. Спокойнее спать потом будете.

наверх / к списку вопросов

 

040_2. При посещении некоторых сайтов у меня нечитабелен текст, хотя в подменю кодировка отмечен пункт "автовыбор". Что делать?
 

Прежде всего, снять флажок "автовыбор". В коде веб-страницы должно быть указано, в какой кодировке она сделана, - в этом случае текст будет читабелен. В противном случае вам придется выбрать кодировку вручную. Вообще же, для Рунета данная проблема имеет животрепещущий характер. Связано это с множеством кириллических кодировок и невнимательностью веб-мастеров.

Когда компьютеры начинали вхождение в жизнь пользователей, существовало не так уж и много стандартов на кодировки символов. В Советском Союзе это была КОИ-8 (код обмена информацией восьмиразрядный), в США придумали ASCII (American Standard Code for Information Interchange) - семиразрядную и, соответственно, поддерживающую всего 128 символов (27).

Впоследствии ASCII была расширена до 8-разрядной кодировки, где со 129-го символа (имеющего номер 128 - поскольку нумерация символов идет с 0) шли специфические буквы европейских языков и символы псевдографики. Про русский язык, естественно, никто и не вспоминал. С развитием компьютерных технологий появилась необходимость не только в латинских и специфичных для европейских языков символов, но и букв других языков.

Вот тут-то и начались проблемы. Было решено размещать национальные символы во второй половине таблицы, то есть после 128-го символа. Кодировок появилось достаточно много. В том числе и с поддержкой русского языка - сначала CP-866 (она же codepage 866, 866-я кодовая страница, русская MS-DOS), а с выходом Windows 95 - CP-1251 (кодовая страница 1251, windows-1251).

Таким образом, существует не менее трех официальных кодировок русского языка. (А еще есть основная кодировка ГОСТ, макинтошевская раскладка... Upgrade писал об этом подробно в #6 - прим. ред.) Поскольку кодировок оказалось много, их надо как-то различать. В документах HTML для этого существует специальный тег, который говорит браузеру, какая кодировка используется на странице.

Если этот тег не указан, то браузер определяет кодировку сам. Однако многие веб-серверы имеют ограничения на кодировку документов.

И невнимательность при написании веб-страниц приводит к нечитабельности текста. Если на сервере стоит жесткое ограничение на кодировку, например, Windows-1251, а документ написан в КОИ, то при запросе данной страницы придется вручную (на глаз) определять кодовую страницу, так как автоопределение, скорее всего, даст сбой. Кроме того, многие прокси-серверы имеют функцию перекодирования символов "на лету" или транскодирование (Accept-Charset).

Последствия автоматического перекодирования довольно печальны: может статься так, что страница или письмо по электронной почте (да-да, и почты это тоже касается) будет просто испорчена вследствие многократного перекодирования. И иногда насовсем. Например, некоторые серверы сети CompuServe перекодируют русский текст в последовательность вопросительных знаков, что, увы, не поддается расшифровке.

Однако, если все не настолько плохо, на помощь нам придут специализированные программы-перекодировщики. Существует их достаточно большое количество, программы различаются возможностями, ценами, понимаемыми кодировками и интерфейсом. Лично я пользуюсь бесплатной программой TCode, написанной Алексеем Бойко (alexboiko.chat.ru). Программа работает под всеми Windows, начиная с 95-х и имеет довольно обширные возможности.

Может раскодировать текст из DOS, Windows, KOI-8, ISO-8859-5, Base64, Quoted-Printable, RTF, HTML, UTF-8. Интерфейс программы обделен графическими наворотами и при этом крайне удобный. Достаточно скопировать кусок текста в буфер обмена и запустить программу. С большой степенью вероятности текст будет распознан.

Еще одна программа перекодировки испорченного текста под названием Trancode (www.dialognauka.ru/dsav_toolkit/trancode.htm) написана программистами из компании "Диалог-Наука" Виталием Ладыгиным и Дмитрием Лозинским. Программа бесплатна, но несмотря на бесплатность обеспечивает хорошее качество распознавания и перекодирования испорченного текста.

Есть в ней функция слежения за буфером обмена и срабатывание по горячим клавишам. Есть возможность транслитерации русского текста, то есть написание русских слов латинскими символами (те, кому приходится отправлять немереную кучу SMS с серверов без автоматической транслитерации, по достоинству оценят это свойство). Есть также возможность автоматизировать действия по перекодировке текста во многих типах окон. Однако владельцев Windows XP я хочу огорчить - Trancode под эту ОС ставиться отказывается. 

Тем, кому лень забивать себе место на жестком диске, могу предложить несколько онлайновых перекодировщиков. Это, например, перекодировщик на сайте технической поддержки провайдера МТУ-Интел (support.mtu.ru/cgi/decode.cgi). Поддерживает кодировки КОИ, Windows-1251, ISO-8859-5, DOS.
Сайт decoder.design.ru также предлагает перекодирование текста из одной кодировки в другую. Список кодировок достаточен, чтобы удовлетворить даже самых требовательных пользователей Сети.

Также данный перекодировщик поддерживает большое количество уровней вложенности, то есть когда текст был неоднократно перекодирован и стандартными средствами в чувство его привести нельзя, а не читать жалко - вам сюда.

А тех, кого не утраивает мой список, прошу зайти на сайт soft.mail.ru/Programs/Text/Decoders, где собрано большое количество программ-перекодировщиков и транслитераторов. Большинство из этих программ распространяется бесплатно. Еще можно посетить сайт hotlinks.ru/guide/44.html, где содержится приличное количество ссылок не только на перекодировщики текста, но и на переводчики. Людям, плохо владеющим иностранными языками, это, несомненно, поможет.

Однако в мире кодовых страниц грядут изменения. На данный момент активно продвигается кодировка Unicode, призванная решить проблемы с чтением текстов. В Unicode каждый символ кодируется двумя байтами, а это означает 65 536 поддерживаемых символов, что снимает проблемы с ограниченностью кодовой страницы.

Некоторые операционные системы, например Windows NT / 2000 / XP, имеют встроенную поддержку Unicode, что позволяет называть файлы любыми именами - хоть иероглифами. Проблем не будет. Но самое интересное, что консорциум ISO (International Standards Organization) разрабатывает 4-байтовую кодировку, которая станет хранилищем чуть ли не всех известных человеку символов, ведь туда можно поместить 4 294 967 295 символов!!! Интересно, как в этой куче символов искать нужный, если что...

В качестве вывода могу сказать, что, если отображаемая страница или письмо от друга нечитаемо, а подбор кодировок ничего не дает, ищите программу-перекодировщик и все станет хорошо!

наверх / к списку вопросов


Техническая поддержка

Внимание! Нашего полку прибыло! Пингвин по прозвищу "модератор" и зверек софт-модератор - подвиньтесь!

 Теперь на многочисленные вопросы читателей по связи будет отвечать монстр коннекта и модем-гуру, коему присваивается почетное звание "Жучок Багов". Все вопросы новому камикадзе вы можете задать по этому адресу: 314ter@computery.ru

архив

 

068, 046, 041, 040, 038  



При перепечатке материалов сайта ссылка на UPGRADE обязательна. 
Имена и фамилии авторов изменять не рекомендуется.

  programmer: 
  Илья Васильев
новые поступления: 
vano@veneto.ru
PR-менеджер: 
Екатерина Кожанова
  newswriters:
  Николай Барсуков
  Александр Савицкий
тех. поддержка по софту:
stnvidnoye@mail.ru;
problem@veneto.ru
менеджер тестовой лаборатории:
testlab@veneto.ru
(495) 246-7468
  content: egor_be 
 
тех. поддержка по железу:
problem@veneto.ru
отдел рекламы: (495) 745-6898, 510 58 31
Виноградов Павел, Илья Саньков
директор отдела распространения Ирина Агронова agronova@veneto.ru: (495) 681-7837, 684-5285

© © 2000-2006 Upgrade