?

Log in

No account? Create an account

Предыдущая запись | Следующая запись

В данном конкретном случае речь пойдёт о программах-конверторах, из формата в формат.

Тексты свои давно уже пишу и правлю в LyX. Всем хорош процессор, одно "но": преобразование из формата в формат работает безобразно - словом, как со всеми прочими текст- и документ-процессорами.

В конце концов, пришлось самому написать скрипт для конвертирования файлов .lyx в формат RTF. А потому огромная просьба ко всем, кто может скачать девяностокилобайтный архив - скачать, распаковать и попробовать открыть файл .rtf внутри вашим офисным приложением (AbiWord, Microsoft Word, OpenOffice Writer и т.д.). И посмотреть, нет ли там внутри странностей - нерусских букв, "битого" форматирования, прочего мусора. Затем сохранить, и вновь открыть той же программой - и посмотреть, что получится.

У меня под рукой оказалось не так много текст-процессоров, чтобы с уверенностью сказать, что конвертируется всё приемлемо. Если в принципе то, что получается, читабельно, я доведу конвертор до состояния, когда он перенесёт и стили, и всё прочее, что можно перенести.

Вот этот файл: n02s.zip (90 кб), в качестве "подопытного кролика" взята "Муза киберпанка". Если не сложно было проверить, оставьте комментарий и укажите, чем открывали и нормально ли читался файл.

Заранее огромное спасибо!

Обновление: вот другая версия того же файла, обработанная улучшенным вариантом конвертора: n02s-rtf.zip (90 кб).
Подписаться на Telegram канал temmokan

Если не сказано иначе, все записи в этом журнале подпадают под следующую лицензию:
Creative Commons Attribution-Noncommercial-No Derivative Works 3.0 Unported License
О распространении моих произведений в электронном виде

Comments

( 52 мнения — Высказать мнение )
leha_sparrow
6 авг, 2010 04:13 (UTC)
Ворд из 2003 офиса открыл, хоть и с небольшим скрипом. Читается нормально, форматирование на месте. В скобках замечу, что в качестве верстальщика я _такое_ форматирование считаю своим злейшим врагом. В самом ворде читать нормально, если бы я читала в ворде зачем-то.
leha_sparrow
6 авг, 2010 04:15 (UTC)
(перечитав сообщение, в ужасе) еще помимо этого стили????? Мать моя, женщина, ворд и так ругательски ругается на макросы несколько минут их преодолевает.
(без темы) - temmokan - 6 авг, 2010 04:46 (UTC) - Развернуть
(без темы) - alexrat - 6 авг, 2010 05:16 (UTC) - Развернуть
(без темы) - temmokan - 6 авг, 2010 05:18 (UTC) - Развернуть
(без темы) - leha_sparrow - 6 авг, 2010 06:49 (UTC) - Развернуть
(без темы) - temmokan - 6 авг, 2010 04:44 (UTC) - Развернуть
(без темы) - leha_sparrow - 6 авг, 2010 06:53 (UTC) - Развернуть
alexrat
6 авг, 2010 05:12 (UTC)
Word 2003
Открылось нормально. Явных косяков: бредовая кодировка, "битое" форматирование и мусора, - не видно.
Хотя само форматирование наводит на размышления? А почему собственно?
Это так и задумано, что после каждого абзаца пустая строка? Или это косяк?
Это так и задумано, что все диалоги начинаются с трёх минусов? Или это косяк?
И почему:
--- Уже, - подтвердил Василий, уже совершенно автоматически ставящий автографы. - Но пока не скажу, о чём.
А не:
--- Уже, --- подтвердил Василий, уже совершенно автоматически ставящий автографы. --- Но пока не скажу, о чём.
Или что подразумевается под одним, двумя, тремя дефисами?
temmokan
6 авг, 2010 05:17 (UTC)
Re: Word 2003
Три дефиса - это то, что станет, в окончательной версии, длинным тире (mdash).
Два - коротким (ndash).

В начале прямой речи у меня длинное тире, дефис обрамляет слова автора. Все прочие тире в тексте короткие. Это тоже всё настраивается без парвки исходного текста.

Кодировка - в смысле бредовая? Что сообщает Word?

Пояснение: отступы, расстояния между параграфами - это то, что библитека-генератор выставляет по умолчанию. В следующей итерации исправлю и преобразование, и стили параграфа.

Спасибо!
Re: Word 2003 - alexrat - 6 авг, 2010 05:21 (UTC) - Развернуть
Re: Word 2003 - temmokan - 6 авг, 2010 05:28 (UTC) - Развернуть
Re: Word 2003 - alexrat - 6 авг, 2010 05:35 (UTC) - Развернуть
Re: Word 2003 - leha_sparrow - 6 авг, 2010 06:55 (UTC) - Развернуть
Re: Word 2003 - temmokan - 6 авг, 2010 07:25 (UTC) - Развернуть
alexrat
6 авг, 2010 05:23 (UTC)
Ещё открыл файл OOo 3.1.1. Полёт нормальный. Что не удивительно :)
temmokan
6 авг, 2010 05:29 (UTC)
Прежние версии именно он не желал открывать - не прощает ошибок форматирования. Что хорошо.
fhtagn_ussr
6 авг, 2010 06:44 (UTC)
Ubuntu 10.01
OOo 3.2.0
Все работает.
gilgatech
6 авг, 2010 09:04 (UTC)
Очень ценный тест
Вордом 2007))
Никаких кракозябр, кроме агриппин и аристархов нету. После сохранения тоже))
temmokan
6 авг, 2010 09:24 (UTC)
Re: Очень ценный тест
Mamma mia! А что стало с Аристархом?
И спасибо за помощь!
morthan2006
6 авг, 2010 16:43 (UTC)
Нормально открылось OpenOffice.org pro 3.2.1. Несколько напрягает разделение абзацев пустыми строками. В LyX или TeX такое уместно (как и в моём любимом asciidoc), но при конвертации в RTF я бы, наверно, пустые строки убирал.

Ещё: почему в начале диалога длинное тире, а дальше обычное? Я везде ставлю длинное тире, за исключением диапазонов (там — короткое) и дефисов. И кавычки почему-то не типографские. Так было в оригинале или при конвертировании поплыло?

Кстати, попадался ли вам на глаза pandoc? Я им совсем недавно конвертировал свой ЖЖ в формат OpenOffice. :-)
temmokan
7 авг, 2010 02:05 (UTC)
Пустые вставки я ликвидировал (в тексте заметки, чуть ниже, ссылка на новый вариант текста), это мой косяк. Похоже, библиотеку для создания RTF тоже придётся писать самому.

Кавычки и тире тоже теперь должны быть правильными. Правда, дефисы вокруг авторской речи ещё остались, но это уже сам исходник надо править.

pandoc попадался мне в поисках, но отзыв были противоречивыми. Главная пакость, что абсолютное большинство конверторов в RTF написаны людьми, только смутно понимающими, что бывают языки помимо английского. Как итог - "мусорный", набитый ненужными вставками конечный файл. Тот, что я делаю своим скриптом, как минимум читается пока что разными версиями Word/OO без запинок.

С третеьй стороны, заодно и Хаскель в памяти освежить. :)

Edited at 2010-08-07 02:06 (UTC)
(без темы) - kondrlan - 6 авг, 2010 16:53 (UTC) - Развернуть
temmokan
7 авг, 2010 01:55 (UTC)
Спасибо. Я уже дополнил конвертор, в тексте заметки новый вариант того же файла, с учётом замечаний.
nut79
7 авг, 2010 07:04 (UTC)
Всё нормально.
olgeria
7 авг, 2010 10:02 (UTC)
исключительно приятно видеть чужое творчество там, откуда ушла.

без шуток и подначек. честно. исключительно приятно.
(может быть приятно потому, что ушла, когда мой смысл этого дела иссяк, - неважно!)

это как бы для хозяйки: какое счастье, что кто-то сварил борщ, и это не я!
temmokan
7 авг, 2010 12:40 (UTC)
Спасибо на добром слове - а "откуда ушла" - это про что именно?
leha_sparrow
9 авг, 2010 14:16 (UTC)
Обновление
Существенно лучше.
temmokan
9 авг, 2010 14:57 (UTC)
Re: Обновление
Спасибо. Что ещё мешает или можно было бы улучшить?
Re: Обновление - temmokan - 9 авг, 2010 15:12 (UTC) - Развернуть
dropinweb
9 авг, 2010 17:51 (UTC)
Доброго времени суток!
Открыл в Abiword, Debian.

Открылся нормально, сразу. Вопросы по типографике:
1) Длинное тире в начале диалога - там, вроде бы, короткое должно быть?
(Сейчас покопался в Википедии - в начале диалогов ставится тоже длинное, но я уже как-то привык в макетах книг делать вначале именно короткое - имхо, эстетичнее длинного)
2) Соответственно, короткое внутри текста и дефис после знаков препинания - имхо, длинное тире...
(Опять же, попробуйте между точкой (запятой) и длинным пробелом НЕ ставить пробела - оно, конечно, может быть и не правилам, но намного красивше...)
3) Три точки вместо многоточия. Это, конечно, достаточно спорный момент, но мне, например, очень нравится именно цельное многоточие вместо трёх точек.
4) У разделитель частей (три дефиса через пробелы), может быть, есть смысл добавить отступы до и после. Также и у цифирок-начал глав. Только у них перед - больше, а после - меньше.

Ещё по мелочи - выключка текста слева, висящие кое-где слова...
temmokan
10 авг, 2010 00:40 (UTC)
Спасибо, что нашли время проверить!

1. Вот тут спорный момент. Поставить любое из них несложно; я, в свою очередь. привык к длинному.
2. Дефис вокруг авторской речи надо заменить на тире, тут не спорю - это не для конвертора задача, а задача правки исходного текста.
3. Тут буду отстаивать три точки - визуально они просто лучше заметны, чем многоточие одним символом (…, …)
4. Подумываю, не заменить ли дефисы там повсюду на звёздочки. Как минимум, заметнее.

Выключка текста - что именно имеется в виду? Висящие слова - надо пристальнее глянуть, это может быть дефект исходного файла.

Спасибо!
(без темы) - dropinweb - 10 авг, 2010 05:01 (UTC) - Развернуть
(без темы) - temmokan - 10 авг, 2010 16:57 (UTC) - Развернуть
( 52 мнения — Высказать мнение )

Профиль

2012, Осень
temmokan
Константин Бояндин
Проза жизни

Метки

За последний месяц

Ноябрь 2018
Вс Пн Вт Ср Чт Пт Сб
    123
45678910
11121314151617
18192021222324
252627282930 

Статистика


Разработано LiveJournal.com
Designed by Lilia Ahner