WEB SEO LIFE

ПОРТАЛ И ФОРУМ ДЛЯ ВЕБМАСТЕРОВ

Мы в Твиттере
Анализ веб сайтов

Вы не подключены. Войдите или зарегистрируйтесь

А какую кодировку используете Вы? UTF-8 VS win-1251

Перейти вниз  Сообщение [Страница 1 из 1]

Creator


Гость
Сейчас я замечаю, что идет повальный переход на UTF-8. Даже те, у кого сайты целиком и полностью нацелены на русскоязычную аудиторию, задумываются над этим вопросом.
Лично я, еще не осознал для себя данной проблемы. Я искренне не вижу необходимости в переходе на UTF-8, допустим для ИТ.ру или этого форума, ведь аудитория русскоговорящая...

К тому же, если и переходить на интернациональную кодировку, то нужно иметь, хотя бы в планах расширение "языкового контента", только поддержки интернациональных интерфейсов не достаточно...

Собственно, что я вижу, в случае перехода на UTF-8 для моих проектов.

Минусы:

1) Увеличение размера (файлов, базы) ведь мы знаем, что на 1 символ используется от 1-4 байтов.
2) Из п.1 следует некоторое понижение производительности.
3) Необходимость замены всех строковых ф-ий.
4) Возможные проблемы с регулярными выражениями. Ждем PHP6.
5) При отправке писем, все равно придется менять кодировку на win-1251.

Плюсы:

1) Использование универсальной кодировки
2) ...

Все выше сказанное – ИМХО. Цель моего поста – разобраться с темой, поэтому очень хотел бы узнать ваше мнение о сложившейся ситуации и ваши взгляды на плюсы и минусы.

UPD: Добавлено голосование.

SLA8899


Гость
Я обеими руками за UTF-8. Попробую и вас переубедить Smile

Мне кажется, 8-битные кодировки текста - это что-то ущербное и неправильное, и должно отмереть, аналогично друхзначному способу записи года в датах (Y2K-проблема). Вся предыдущая история развития компьютерных кодировок текста нужна была только для того (и неизбежно привела к тому), что в итоге появилась одна универсальная кодировка. Единый стандарт, 100% универсальный, подходящий для общения между любыми системами и устройствами. Без боязни "потерять" часть данных при перекодировании текстов
1) Увеличение размера (файлов, базы) ведь мы знаем, что на 1 символ используется от 1-4 байтов.
Разве жалко места на сервере? Smile За многие годы ведения блога накопится ВСЕГО несколько мегабайт текста. В наше время, гораздо больше места занимает мультимедиа - видео, картинки, аудио. Когда я задумываюсь над тем, какого размера архив на YouTube.com, меня пот прошибает. Что уж там этот юникодный текст? Капля в море. Smile
2) Из п.1 следует некоторое понижение производительности.

Дольше обрабатываются SQL-запросы? Насколько дольше? Smile Есть много примеров, жутко нагруженных популярных сайтов, работающих в UTF-8, и они прекрасно справляются. Ну а для ведения небольшого блог-сайта -- вообще никаких проблем.
5) При отправке писем, все равно придется менять кодировку на win-1251.
А зачем? Smile Все современные почтовые программы и вебсервисы тоже прекрасно поддерживают UTF-8. Разве нет?

Кстати, о почтовых вебсервисах. Представьте, что вам нужно создать такой сервис. В какой кодировке предпочтительно было бы отображать все страницы сайта? Ага! То-то же! Smile) Любые кодировки писем можно БЕЗ ПОТЕРИ ДАННЫХ (и головной боли!) сконвертировать в UTF-8. А в любую другую 8-битную - нельзя.

И напоследок, подумайте, как будет выглядеть ваш сайт, если я здесь напишу комментарий, скажем, на китайском? Smile Ну это же будет очевидный "дефект", выглядящий так, как будто у вас заглючила база данных. А что, если я ХОЧУ написать какое-то иностранное слово или цитату? Или делаю copy-paste огромной статьи на русском, в котором есть ВАЖНЫЕ цитаты на иностранном? Ужас, придется перечитывать весь текст, чтоб убедиться, что он правильно отображается. НЕОБХОДИМОСТЬ ЭТОГО ЛИШНЕГО ДЕЙСТВИЯ - ЯВНЫЙ ПРИЗНАК УЩЕРБНОСТИ САЙТА! На сайте, работающем в windows-1251, использование таких не русских и не ланинских текстов просто технически невозможно. А жаль, это означает, что сайт неполноценен, недоразвит, незакончен. Не выдав никакого предупреждения об ошибке, он просто "сожрет" все иностранные цитаты. Ну чем не баг?.. Слава Богу, такие сайты уходят в прошлое, и если сайт крутится, например, на WordPress, в него можно "постить" все и вся. Это называется свобода.

tery


Гость
в плюсы - нормальная работа сервисов xml - ajax
почта в utf-8 прекрасно работает

Насчет баз: если база начинает тормозить - то надо либо оптимизировать кешированием, либо увеличивать мощности либо переходить на постгр а увеличение объемов не должно сильно сказываться на производительности

REFF6


Гость
Кодировку выбираете какую Вам удобнее. Если пишете в utf-8, например, то и на сервере потом нужно будет выставить соответствующую.

tresk7


Гость
Я для англоязычных страниц ставлю обычно "charset=iso-8859-1". А ответ на вопрос: есть ли в браузерах пользователей из-за границы кодировка "windows-1251", меня тоже всегда интересовал. По идее, русский язык - один из самых распространенных в мире. И кодировка такая должна присутствовать в браузере по умолчанию. + надо бы уточнить факт автоматически ли она распознается или все-таки юзерам доставляются какие-то неудобства.

Потому что мне, напр., не раз приходилось сталкиваться с тем, что UTF-8 не распознается браузером из-за чего вместо нормальной страницы видишь какие-то крякозябры или вообще пустую страницу как будто на ней ничего нет. Но пару раз столкнувшись с такой проблемой нашел выход в том, чтобы выбирать кодировку вручную. Правда, неопытные пользователи ведь могут и не догадаться об этом, что так нужно сделать.

Спонсируемый контент


Вернуться к началу  Сообщение [Страница 1 из 1]

Права доступа к этому форуму:
Вы не можете отвечать на сообщения