Будущее за UTF-8?

 
1 2 3 4
+
-
edit
 

Balancer

администратор
★★★★★
ab, 10.04.2004 06:31:39 :
и действительно просто так передислоцировать в ВС РФ
 


Оно даже без потерь копируется :)

"и действительно просто так передислоцировать в ВС ΠФ ОБЪЕКТОВЫЕ СΠЕДСТВА ПВО..." :)
 
Balancer, 10.04.2004 10:32:50 :
Да, Опера сохраняет без перекодирования.
Но там в страничке честно прописано
<meta http-equiv="content-type" content="text/html; charset=utf-8" />
Так что тот же html-файл преспокойно открывается в любом браузере.
 


это конечно так. но вот командировский f3 для этих файлов считай накрылся. собственно и utf-8 он как бы нормально показывает если его выбрать, но реально это будет без удаления html тэгов, а так файл смотреть это уж слишком. т.е. чисто конкретно мне от этого прогресса одно расстройство.
 
+
-
edit
 

Balancer

администратор
★★★★★
ab, 11.04.2004 06:14:08 :
это конечно так. но вот командировский f3 для этих файлов считай накрылся. собственно и utf-8 он как бы нормально показывает если его выбрать, но реально это будет без удаления html тэгов, а так файл смотреть это уж слишком. т.е. чисто конкретно мне от этого прогресса одно расстройство.
 


Так это не прогресс виноват, а отставание от него F3 :)
Ещё не так давно такое же расстройство было от Windows-кодировки, например :)
 
+
-
edit
 

-exec-

опытный

во время сохранения страницы ослом можно указать кодировку сохраняемого файла.
опера7 такой настройки во время сохранения не имеет. сама виновата.
 
Balancer, 11.04.2004 11:40:05 :
1.Так это не прогресс виноват, а отставание от него F3

2.Ещё не так давно такое же расстройство было от Windows-кодировки, например :)
 


1. дык f3 пишет один человек, а прогрессом его травят целые компании высокооплачиваемых программистов

2. очень верный пример. ну и на фиг она была нужна эта win кодировка? других пяти не хватало?
 
+
-
edit
 

Balancer

администратор
★★★★★
ab, 12.04.2004 07:55:36 :
1. дык f3 пишет один человек, а прогрессом его травят целые компании высокооплачиваемых программистов
 


Прости, но если F3 пишет один человек, то у него способностей к проектированию ну совсем никаких :) В FAR Manager'е сейчас, например, многие сотни плагинов. Только я для "F3" использую их разных штуки четыре :) И гляделка для UTF-8 и сейчас есть (Unicode Wizard), но она несовместима с HyperView :) (просмотр HTML в FAR'е в текстмоде).

>2. очень верный пример. ну и на фиг она была нужна эта win кодировка? других пяти не хватало?

Тебе не нужна была кодировка с корректной сортировкой по алфавиту? С простым преобразованием больших букв в маленькие и обратно? С неиспользованием управляющих (0x80 - 0x9F) символов?

Ты, вообще, под DOS писал когда-нить серьёзную работу с русскими строками? :D

Это в наше время мощных процессоров и гигабайтов памяти легко запихать все национальные особенности в отдельные файлы, а тогда Win-кодировка помогала высвободить ресурсы.
 

TEvg

аксакал

админ. бан
Ром не морочь голову. Каждая лишняя кодировка - это лишние глюки и сожранные ресурсы.

ЗЫ Ты еще скажи что это мелкософт экономией ресурсов озаботилась и кодировку сделала.
 
+
-
edit
 

Balancer

администратор
★★★★★
TEvg, 12.04.2004 11:28:06 :
Ром не морочь голову. Каждая лишняя кодировка - это лишние глюки и сожранные ресурсы.
 


Глюки со старым софтом - да. Только они ЗАДОЛГО до MS были :)
KOI-7, KOI-7R, KOI-8, потом уже только пяток досовских и т.д. и т.п.

Предлагаешь до сих пор всем на KOI-7 сидеть? Так там маленьких букв нет! :D Или есть маленькие, но нет латинских :lol:

>ЗЫ Ты еще скажи что это мелкософт экономией ресурсов озаботилась и кодировку сделала.

Жень, я знаю, что ты жутко предубеждён и субъективен, но напоминаю, что во времена DOS на MS наездов по твоим критериям не было :D И даже во время Win 3.1 Всё началось с Win95 :)
 
Balancer, 12.04.2004 09:59:54 :
1.В FAR Manager'е сейчас, например, многие сотни плагинов. Только я для "F3" использую их разных штуки четыре :) И гляделка для UTF-8 и сейчас есть (Unicode Wizard), но она несовместима с HyperView :) (просмотр HTML в FAR'е в текстмоде).

2.>2. очень верный пример. ну и на фиг она была нужна эта win кодировка? других пяти не хватало?
Тебе не нужна была кодировка с корректной сортировкой по алфавиту? С простым преобразованием больших букв в маленькие и обратно? С неиспользованием управляющих (0x80 - 0x9F) символов?

3.Ты, вообще, под DOS писал когда-нить серьёзную работу с русскими строками? :D

4.Это в наше время мощных процессоров и гигабайтов памяти легко запихать все национальные особенности в отдельные файлы, а тогда Win-кодировка помогала высвободить ресурсы.
 


1. окончательно убедился что не зря я фар никогда серьезно не рассматривал. оказывается кроме жуткого консольного экрана перед носом с утра до вечера, еще надо тратить время на просмотр списка сотен плагинов. и для простого дела из них не меньше 4-х выбирать. это круто. у меня в командире не одного не стоит.

2. да вот и я раньше тоже так думал - удобство, перспективность, архитектура, расширяемость. а теперь думаю - пусть какое-угодно неудобное но одно. один раз напишешь (а скорее и без тебя напишут) как с ним работать и счастье навечно. кодировки для меня не помощь, а неизбежное зло, не более.

так что мой ответ - есть, хорошо. нет - переживу. новой - не надо.

3. зачем писал понимаешь. надо так искал. и находил. такие уж вещи другие давно написали. писать в своей области надо. впрочем тогда по глупости и верно больше ерунды сам писал. да и таблица в 256 байт даже по меркам дос это несерьезно.

4.ага. высвободила. это когда всем пришлось к пяти русским до того уже поддерживаемым еще и ее добавить? отчего все стало больше и сложнее.
 
+
-
edit
 

Balancer

администратор
★★★★★
Ну, что я могу сказать. Не нравится - не ешь. А караван себе идёт... :D
 
Balancer, 12.04.2004 21:41:51 :
Ну, что я могу сказать. Не нравится - не ешь. А караван себе идёт... :D
 


не уверен. а может это каравану кажется что он идет?
 
+
-
edit
 

Balancer

администратор
★★★★★
ab, 13.04.2004 02:20:38 :
не уверен. а может это каравану кажется что он идет?
 


Посмотри на Дожили. [Balancer#13.04.04 00:54] и попробуй придумать, как такое же изобразить в алтернативной DOS-кодировке :)
 
вообще то я не китаец. и как они свои проблемы решают мне наплевать. у них и с набором с клавы иероглифов непросто. так сами виноваты. пусть свою ос делают или на нормальный язык переходят.

теперь посмотрим конкретно. была нужда в win рус кодировке? реально нет. собственно и в русских дос нужды не было. уже был кои-8.

а сколько человеческих сил и времени (как программеров так и юзеров) было потрачено на борьбу с этим разнообразием русских кодировок - это же чудовищно. расстреливать за такое вредительство надо.

что сейчас. обещали юникод - решение всех проблем. что имеем - UTF-8, UTF-16BE, UTF-16LE, UTF-32BE or UTF-32LE + поддержку старых никто себе позволить отменить не может.

а конкретно UTF-8 это вообще, если глянуть пошире, полный бред. ну нет уже сейчас смысла заводить новую кодировку, заточенную под поддержку английского. ибо реально он уже нужен меньшинству пользователей. люди хотят работать на своих языках. и это правильно.
 
+
-
edit
 

Balancer

администратор
★★★★★
ab, 13.04.2004 18:38:57 :
вообще то я не китаец. и как они свои проблемы решают мне наплевать.
 


Хорошо, приземлённая практическая проблема. Прямо сегодня всплыла. Есть официальный сайт С.Лема - Official site for the author Stanislaw Lem

При нём есть форум - 404 Not Found

Там есть русский и польский разделы.
Предложи альтернативу UTF-8, при которой на одном форуме можно будет писать и по-русски и по-польски. Поляки твою кодировку 1251 ну никак не одобрят :D

>теперь посмотрим конкретно. была нужда в win рус кодировке? реально нет. собственно и в русских дос нужды не было. уже был кои-8.

Ну, здрасьте, KOI8 - это, вообще, смешно по тем временам. Алфавит ЮАБЦДЕФ - это, конечно, очень по-русски.

>что сейчас. обещали юникод - решение всех проблем. что имеем - UTF-8, UTF-16BE, UTF-16LE, UTF-32BE or UTF-32LE + поддержку старых никто себе позволить отменить не может.

Реально прижился только UTF-8. Все новые протоколы рассчитаны на UTF-8. Расписать почему, или сам сообразишь?

>а конкретно UTF-8 это вообще, если глянуть пошире, полный бред. ну нет уже сейчас смысла заводить новую кодировку, заточенную под поддержку английского.

Какого ещё английского? Ты про однобайтовые английские буквы, что ли? А разметку на XML/HTML чем будем делать? Двухбайтовой кодировкой? Хочешь, чтобы я за трафик Авиабазы не по $80 каждый месяц платил, а по $120? $140? :D

Кроме того, с UTF-8 я могу работать сносно из любого старого редактора (не читать по-русски, а именно работать, например, программу редактировать), чего не скажешь про любой другой юникод.

>ибо реально он уже нужен меньшинству пользователей. люди хотят работать на своих языках. и это правильно

Угу, вот только всё чаще встречаются случаи, когда языки нужно смешивать. Сегодняшний пример - выше. Или когда нужны спецсимволы. Вспомни, как много воплей было о пропавшей из 1251 псевдографики. А в UTF-8 она есть... И много чего ещё есть...

Ну и я молчу про то, что систем, работающих на более чем двух языках я повидал премного. Или даже буквально на двух. Но, например, немецком и русском. Ну и как их смешивать в однобайтовой кодировке?
 
Balancer, 13.04.2004 19:56:20 :
1. Там есть русский и польский разделы.
Предложи альтернативу UTF-8, при которой на одном форуме можно будет писать и по-русски и по-польски. Поляки твою кодировку 1251 ну никак не одобрят :D

2.>теперь посмотрим конкретно. была нужда в win рус кодировке? реально нет. собственно и в русских дос нужды не было. уже был кои-8.
Ну, здрасьте, KOI8 - это, вообще, смешно по тем временам. Алфавит ЮАБЦДЕФ - это, конечно, очень по-русски.

3.>что сейчас. обещали юникод - решение всех проблем. что имеем - UTF-8, UTF-16BE, UTF-16LE, UTF-32BE or UTF-32LE + поддержку старых никто себе позволить отменить не может.
Реально прижился только UTF-8. Все новые протоколы рассчитаны на UTF-8. Расписать почему, или сам сообразишь?

4>а конкретно UTF-8 это вообще, если глянуть пошире, полный бред. ну нет уже сейчас смысла заводить новую кодировку, заточенную под поддержку английского.
Какого ещё английского? Ты про однобайтовые английские буквы, что ли? А разметку на XML/HTML чем будем делать? Двухбайтовой кодировкой? Хочешь, чтобы я за трафик Авиабазы не по $80 каждый месяц платил, а по $120? $140? :D

5.Кроме того, с UTF-8 я могу работать сносно из любого старого редактора (не читать по-русски, а именно работать, например, программу редактировать), чего не скажешь про любой другой юникод.

6. Ну и я молчу про то, что систем, работающих на более чем двух языках я повидал премного. Или даже буквально на двух. Но, например, немецком и русском. Ну и как их смешивать в однобайтовой кодировке?
 


1. юникод. нормальный. как он был задуман - 16 бит.

2. да на хрена мне вообще знать как они там в таблице стоят. было бы нормально сделано никто бы и знал как там стоит. есть функции типа - sort, tolower, toupper, capitаlize и все.

3. да какая мне разница что прижилось. поддерживать надо все - это уже проходили.

4. именно про них. а насчет забот о траффике - так караван идет и тенденция обратная - никто реально не экономит - картинки, звуки, анимации и т.п. так и прут.

5. а караван опять идет

6. да зачем же в однобайтной то. просто не надо было этого ублюдка утф-8 вводить. а теперь то действительно избавиться от него шансов нет.
 
+
-
edit
 

Balancer

администратор
★★★★★
ab, 13.04.2004 22:04:06 :
1. юникод. нормальный. как он был задуман - 16 бит.
 


Ну-ну. И кто ВСЮ инфраструктуру работы с файлами под него переделывать будет? С UTF-8 можно работать как с обычной однобайтовой кодировкой, а вот с UTF16 - нет.

>да на хрена мне вообще знать как они там в таблице стоят. было бы нормально сделано никто бы и знал как там стоит. есть функции типа - sort, tolower, toupper, capitаlize и все.

Вот как раз о функции sort и речь. Представь, что тебе нужно мегабайт строк отсортировать. Ты будешь перед каждой сортировкой во временную кодировку перекодировать, или каждый символ перед сравнением перекодировать? На это ТАКИЕ ресурсы уйдут, что проще в качестве русского официального алфавита ввсети ЮАБСДЕФ... :D ... или придумать нормальную кодировку, с расположением букв по порядку.

>3. да какая мне разница что прижилось. поддерживать надо все - это уже проходили.

Зачем всё поддерживать? Ну куда мне сейчас, например, DOS-кодировка может понадобиться? Где?

>4. именно про них. а насчет забот о траффике - так караван идет и тенденция обратная - никто реально не экономит - картинки, звуки, анимации и т.п. так и прут.

Это тебе так кажется.

>5. а караван опять идет

Правильно. В сторону UTF8 :)
Все новые Интернет-протоколы на UTF-8 работают.
Jabber и ICQ с недавних пор - UTF-8
PHP, встроенная - UTF-8
MySQL с версии 4.1 - UTF-8
LiveJournal и т.п. - UTF-8
OCaml, и, вообще, поддержка мультибайтовых строк в новых языках - UTF-8
На MacOS X - UTF-8
OpenLDAP - UTF-8
Linux RH с 8-й версии по умолчанию UTF-8
И т.д. т.п...
Сейчас UTF-8 применяется намного шире, чем Windows-1251 :D:D:D

Так куда караван идёт?

>6. да зачем же в однобайтной то. просто не надо было этого ублюдка утф-8 вводить. а теперь то действительно избавиться от него шансов нет.

Нет, ты не понял вопроса, что ли. Я спрашиваю, как в однобайтовой кодировке реализовать хотя бы одновременную поддержку немецкого и русского?
 

Lerm

втянувшийся
Ни одна русская кодировка не может считаться нормальной, т.к. нет общеупотребительной кодировки, в которой буква 'Ё' стояла бы на своём законном месте! А все потому, что 33-1=32. Очень уж красиво... :D

Хотя: 10+26*2+33*2=128. :D И первые 16 букв совпадают со своими шестнадцатиричными кодами...
You live and learn. Or you don't live long.  
+
-
edit
 

Balancer

администратор
★★★★★
Lerm, 14.04.2004 00:12:51 :
Ни одна русская кодировка не может считаться нормальной, т.к. нет общеупотребительной кодировки, в которой буква 'Ё' стояла бы на своём законном месте! А все потому, что 33-1=32. Очень уж красиво... :D
 


Ну, что делать, если даже всякие литературоведы эту букву избегают и т.п. :)

Впрочем, на сегодня это уже не так актуально. Сортировка исправно работат в том же UTF8? Исправно. И слава Богу :)

>Хотя: 10+26*2+33*2=128. :D И первые 16 букв совпадают со своими шестнадцатиричными кодами...

А знаки препинания, всякие математические символы и т.п.? :)
 

Lerm

втянувшийся
Ну, что делать, если даже всякие литературоведы эту букву избегают и т.п. :)
 


Тем хуже для литературоведов...

Впрочем, на сегодня это уже не так актуально. Сортировка исправно работат в том же UTF8? Исправно. И слава Богу :)
 


В Unicode 'Ё' всё равно не на своём месте. А сортировать можно было и в КОИ8... При желании.

А знаки препинания, всякие математические символы и т.п.? :)
 


Во второй половине таблицы. Проблема будет только в том, что код пробела больше кода символов.
You live and learn. Or you don't live long.  
Lerm, 14.04.2004 09:45:50 :
Впрочем, на сегодня это уже не так актуально. Сортировка исправно работат в том же UTF8? Исправно. И слава Богу :)
 


В Unicode 'Ё' всё равно не на своём месте. А сортировать можно было и в КОИ8... При желании.
 


да стоит ли препираться. и так понятно, что если бы программеры были вменяемыми людьми то мы бы не имели того что имеем.
 
+
-
edit
 

Balancer

администратор
★★★★★
ab, 14.04.2004 22:22:35 :
если бы программеры были вменяемыми людьми
 


Ладно, я понял тебя. Это уже не лечится.
 
Balancer, 14.04.2004 22:04:39 :
ab, 14.04.2004 22:22:35 :
если бы программеры были вменяемыми людьми
 


Ладно, я понял тебя. Это уже не лечится.
 


доктор, ну как вы не понимаете, они же уже делают непрямоугольные окна черного цвета. и они хотят выкинуть букву ё. как же мы русские будем без нее то? это ж просто ё... что творится.

АААААААААА!!!! доктор, я все понял вы с ними заодно! вот почему вы велели надеть на меня эту смирительную рубашку и колоть этот мерзкий аминазин! а я всего то сказал что ненавижу утф-8 (и утф-9 и утф-11 тоже, и новую систему цитирования и то что они говорят про электронику и радиолокацию). я хотел их убить, но они везде и в Jabber ив ICQ и в PHP и в MySQL и даже в Linux RH с 8-й версии по умолчанию UTF-8

но я все равно своего добюсь. я напишу спам и биллу гейтсу и линусу (и пусть он велит убить эту восьмую красную шапочку) и васе пупкину. и они меня послушают, вот увидите. вы еще у меня увидите утф-64. вот тогда я послушаю что вы скажете.
 

Lerm

втянувшийся
ab, 15.04.2004 06:40:59 :
доктор, ну как вы не понимаете, они же уже делают непрямоугольные окна черного цвета. и они хотят выкинуть букву ё. как же мы русские будем без нее то? это ж просто ё... что творится.

АААААААААА!!!! доктор, я все понял вы с ними заодно! вот почему вы велели надеть на меня эту смирительную рубашку и колоть этот мерзкий аминазин!
 


Воистину! :D:D:D
You live and learn. Or you don't live long.  
+
-
edit
 

Balancer

администратор
★★★★★
by Balancer: перенос из Сколько в мире языков? [Balancer#24.10.04 12:41]


RUS_7777>в «Словаре китайских иероглифов» в восьми томах, вышедшем в свет в 1889 году, насчитывается около 20 миллионов иероглифов.

Да... И кто-то когда-то говорил, что 64К символов Unicode хватит на всех :D
Впрочем, разум восторжествовал и сейчас основной кодировкой позиционируют UTF-8 :)
 
Это сообщение редактировалось 24.10.2004 в 12:42
RU Balancer #22.10.2004 11:18  @Dmitry_A#22.10.2004 05:30
+
-
edit
 

Balancer

администратор
★★★★★
Dmitry_A>Роман, не переживай, Юникода на всех хватит ;) .[»]

В виде UTF-8 - да. А классический двухбайтовый Юникод - уже сейчас не хватает :) Т.е. в UTF-8 есть куча групп символов, которые в Unicode просто не влезли.
 
1 2 3 4

в начало страницы | новое
 
Поиск
Поддержка
Поддержи форум!
ЯндексЯндекс. ДеньгиХочу такую же кнопку
Настройки
Твиттер сайта
Статистика
Рейтинг@Mail.ru