Задача: конвертировать содержание документа в XML.
Проблема уже неоднократно поднималась на форуме, но так и не получила логического завершения, т.к. приемлемое решение не найдено.
Простейшие преобразования - bold, italic, underline - освоились без проблем. Картинки, принадлежащие параграфу, тоже, но с ограничениями (не знаю как определить выравнивание картинки относительно параграфа). Простые линки осилил. Столкнулся с траблой на линке с картинкой, который InlineShape. Отдельная коллекция есть, а как определить где именно в тексте этот линк? И как сохранить картинки в JPG? В BMP GSerg падсказал http://bbs.vbstreets.ru/viewtopic.php?t=8674&highlight=saveas, но тоже не знаю где взять объект Clipboard.
Кроме того при переборе посимвольно неприлично большие затраты по времени: на простейший документ около пяти минут.
Ешё: не все символы записываются в XML корректно. Всякие умляуты преобразуются в базовую буковь (é --> e, ü --> u), а некоторые просто знаками вопроса отображаются и всё. А, например, вертикальный перевод строки пишется в XML, но потом этот XML не читается, т.к. невалиндный символ .
Короче, у кого что есть сказать по теме - прошу.