?

Log in

No account? Create an account

Предыдущая запись | Следующая запись

Шей да пори — не будет пустой поры. Вот уже который раз даю себе честное благородное слово начать писать сугубо положительно, конструктивно и доброжелательно. Но куда уж там!

Вот нужно мне .doc преобразовать в .html. Естественно, это все умеют. И MS Word, и OpenOffice Writer, и AbiWord, и много кто. Но если по поводу итогов работы первого и так всё понятно &mdsah; привычка программистов этой конторы любые гланды удалять сугубо автогеном и исключительно через задний проход — имманентная их черта; то с OO и прочими я даже слегка растерялся.

Ну почему после преобразования заголовка я вижу конструкции вида
<H1>Заголовок </H1><H1></H1><H1>произведения</H1>

? Недостаточно мозгов, чтобы выкосить подобные огрехи?

Почему все теги пишутся заглавными буквами? Господа, вы хоть немного читаете спецификации XHTML и планы развития языка разметки?

Почему вся типографика вида двойных угловых кавычек и длинных тире остаётся как есть, а не переводится в HTML entity? Что, господа программисты не в курсе, что есть &laquo; и тому подобное?

Почему вместо того, чтобы все стили определить в заголовке, и далее использовать классы, эти умники помимо огромной шапки стилей в заголовке фаршируют каждый тег чёртовой уймой встроенных стилей? Религия не позволяет делать всё НЕ через одно место?

Я, конечно, понимаю, что буквально десятком регулярных выражений вся эта жуткая свалка превращается в причёсанный и умытый HTML, но доколе, блин?

...Вот так и приучаешься к осознанию: хочешь, чтобы что-то работало как следует — делай всё сам. Жаль только, что жизнь коротка, а в сутках всего 24 часа.

Если не сказано иначе, все записи в этом журнале подпадают под следующую лицензию:
Creative Commons Attribution-Noncommercial-No Derivative Works 3.0 Unported License
О распространении моих произведений в электронном виде

Comments

( 9 мнений — Высказать мнение )
vorchunn
25 окт, 2010 17:07 (UTC)
Во-во, мне регулярно по работе приходится с этим конвертированным ужасом бороться. Впрочем, те же cms-ы аналогично код громоздят ;/
temmokan
25 окт, 2010 22:23 (UTC)
CMS да, тоже как сделают... Такое ощущение, что производство нормального, читабельного HTML там считают лютым эстетством.
(Удалённый комментарий)
temmokan
25 окт, 2010 22:25 (UTC)
Ну, если говорить про себя самого, то я в итоге написал для LyX самодельные конвертеры в HTML/RTF и тоже чувствую себя спокойно. TeX особенно легко во что угодно конвертируется, вследствие структуры.

Однако и там тоже не всё в порядке с преобразованием - известные мне конвертеры в упомянутые два формата тоже плодят жуткий ужас. Действительно, трансляция безо всякой оптимизации полученного представления.
baogun
25 окт, 2010 18:50 (UTC)
а может, это следствие багов внутренней разметки в текстовом процессоре? Ибо, по логике, преобразование должно производиться as is, без самодеятельности, иначе на каждый чих не наздравствуешься. Т.е. "мусор" должен быть убираем всегда, вне зависимости от формата сохранения. И глядишь, "толстый" RTF окажется более стройным. Было бы интересно узнать, насколько мусорный и неоптимизированный получается текст в самом редакторе...
temmokan
25 окт, 2010 22:29 (UTC)
Строго говоря, форматы все неоднозначны. Если я ещё как-то могу представить, что DOC и HTML взаимозаменяемы (и то придётся тучу служебной информации в DOC куда-то прятать - в комментарии? а обратно как?) в смысле передачи информации, то не все прочие пары форматов таковы.

А потому, если глядеть с точки зрения пользователя, надо давать опцию оптимизировать под конечный формат с предупреждением, что форматы неравноценны и часть информации (стили и пр.) может быть потеряна.

Упомянутые "врезки" закрывающего-открывающего тега демонстрируют, что и во внутреннем представлении творится такой бардак, что лучше не интересоваться лишний раз.
starcat13
11 ноя, 2010 12:16 (UTC)
работают с лозунгом "HTML должен читать браузер, а не человек"? :(
temmokan
12 ноя, 2010 14:07 (UTC)
Угу, видимо. Иначе трудно понять, отчего всё именно так.
starcat13
16 ноя, 2010 03:48 (UTC)
скорее всего хватает работы в других местах, а качество HTML'я волнует совсем немного людей (которым еще и весьма сложно угодить, к тому же)
( 9 мнений — Высказать мнение )

Профиль

2012, Осень
temmokan
Константин Бояндин
Проза жизни

Метки

За последний месяц

Август 2017
Вс Пн Вт Ср Чт Пт Сб
  12345
6789101112
13141516171819
20212223242526
2728293031  

Статистика


Разработано LiveJournal.com
Designed by Lilia Ahner