?

Log in

No account? Create an account

Предыдущая запись | Следующая запись

Шей да пори — не будет пустой поры. Вот уже который раз даю себе честное благородное слово начать писать сугубо положительно, конструктивно и доброжелательно. Но куда уж там!

Вот нужно мне .doc преобразовать в .html. Естественно, это все умеют. И MS Word, и OpenOffice Writer, и AbiWord, и много кто. Но если по поводу итогов работы первого и так всё понятно &mdsah; привычка программистов этой конторы любые гланды удалять сугубо автогеном и исключительно через задний проход — имманентная их черта; то с OO и прочими я даже слегка растерялся.

Ну почему после преобразования заголовка я вижу конструкции вида
<H1>Заголовок </H1><H1></H1><H1>произведения</H1>

? Недостаточно мозгов, чтобы выкосить подобные огрехи?

Почему все теги пишутся заглавными буквами? Господа, вы хоть немного читаете спецификации XHTML и планы развития языка разметки?

Почему вся типографика вида двойных угловых кавычек и длинных тире остаётся как есть, а не переводится в HTML entity? Что, господа программисты не в курсе, что есть &laquo; и тому подобное?

Почему вместо того, чтобы все стили определить в заголовке, и далее использовать классы, эти умники помимо огромной шапки стилей в заголовке фаршируют каждый тег чёртовой уймой встроенных стилей? Религия не позволяет делать всё НЕ через одно место?

Я, конечно, понимаю, что буквально десятком регулярных выражений вся эта жуткая свалка превращается в причёсанный и умытый HTML, но доколе, блин?

...Вот так и приучаешься к осознанию: хочешь, чтобы что-то работало как следует — делай всё сам. Жаль только, что жизнь коротка, а в сутках всего 24 часа.
Подписаться на Telegram канал temmokan

Если не сказано иначе, все записи в этом журнале подпадают под следующую лицензию:
Creative Commons Attribution-Noncommercial-No Derivative Works 3.0 Unported License
О распространении моих произведений в электронном виде

Comments

( 8 мнений — Высказать мнение )
vorchunn
25 окт, 2010 17:07 (UTC)
Во-во, мне регулярно по работе приходится с этим конвертированным ужасом бороться. Впрочем, те же cms-ы аналогично код громоздят ;/
temmokan
25 окт, 2010 22:23 (UTC)
CMS да, тоже как сделают... Такое ощущение, что производство нормального, читабельного HTML там считают лютым эстетством.
(Удалённый комментарий)
temmokan
25 окт, 2010 22:25 (UTC)
Ну, если говорить про себя самого, то я в итоге написал для LyX самодельные конвертеры в HTML/RTF и тоже чувствую себя спокойно. TeX особенно легко во что угодно конвертируется, вследствие структуры.

Однако и там тоже не всё в порядке с преобразованием - известные мне конвертеры в упомянутые два формата тоже плодят жуткий ужас. Действительно, трансляция безо всякой оптимизации полученного представления.
baogun
25 окт, 2010 18:50 (UTC)
а может, это следствие багов внутренней разметки в текстовом процессоре? Ибо, по логике, преобразование должно производиться as is, без самодеятельности, иначе на каждый чих не наздравствуешься. Т.е. "мусор" должен быть убираем всегда, вне зависимости от формата сохранения. И глядишь, "толстый" RTF окажется более стройным. Было бы интересно узнать, насколько мусорный и неоптимизированный получается текст в самом редакторе...
temmokan
25 окт, 2010 22:29 (UTC)
Строго говоря, форматы все неоднозначны. Если я ещё как-то могу представить, что DOC и HTML взаимозаменяемы (и то придётся тучу служебной информации в DOC куда-то прятать - в комментарии? а обратно как?) в смысле передачи информации, то не все прочие пары форматов таковы.

А потому, если глядеть с точки зрения пользователя, надо давать опцию оптимизировать под конечный формат с предупреждением, что форматы неравноценны и часть информации (стили и пр.) может быть потеряна.

Упомянутые "врезки" закрывающего-открывающего тега демонстрируют, что и во внутреннем представлении творится такой бардак, что лучше не интересоваться лишний раз.
starcat13
11 ноя, 2010 12:16 (UTC)
работают с лозунгом "HTML должен читать браузер, а не человек"? :(
temmokan
12 ноя, 2010 14:07 (UTC)
Угу, видимо. Иначе трудно понять, отчего всё именно так.
starcat13
16 ноя, 2010 03:48 (UTC)
скорее всего хватает работы в других местах, а качество HTML'я волнует совсем немного людей (которым еще и весьма сложно угодить, к тому же)
( 8 мнений — Высказать мнение )

Профиль

2012, Осень
temmokan
Константин Бояндин
Проза жизни

Метки

За последний месяц

Сентябрь 2018
Вс Пн Вт Ср Чт Пт Сб
      1
2345678
9101112131415
16171819202122
23242526272829
30      

Статистика


Разработано LiveJournal.com
Designed by Lilia Ahner