View previous topic :: View next topic |
Author |
Message |
Dec
Joined: 07 Sep 2006 Posts: 466
|
|
Back to top |
|
|
Ник
Joined: 15 Dec 2004 Posts: 1256 Location: Москва
|
(Separately) Posted: Tue Jul 17, 2007 11:17 Post subject: |
|
|
Спасибо, я этот плагин хорошо знаю - он не даёт информации об объектах - а именно это и нужно... _________________ Xubuntu 20.10 |
|
Back to top |
|
|
Dec
Joined: 07 Sep 2006 Posts: 466
|
(Separately) Posted: Tue Jul 17, 2007 11:40 Post subject: |
|
|
В контексте decStorageWCX вордовский документ всего лишь набор файлов и директорий. Как понять, что какой-то файл является OLE объектом. |
|
Back to top |
|
|
Ник
Joined: 15 Dec 2004 Posts: 1256 Location: Москва
|
(Separately) Posted: Tue Jul 17, 2007 12:09 Post subject: |
|
|
А там написано:
Директория "ObjectPool".
Если объектов нет - эта директория пустая.
Если объекты есть, то внутри - директории с именами "номеров" (подчерк и номер) объектов.
В них - файлы разные - и в их числе объекты и описания.
В файле #001CompObj (как правило) - имя объекта и имя породившего его приложения.
Иногда описание объекта пишется в #0003META (может в старых версиях MSO? или, скорее, зависит от типа связи - в том числе насколько старая программа-источник OLE - надо разбираться, у меня META присутствует в объектах, вставленных из Micrografx ADC Graphic Suit 1995(?) года, но ни в более ранних, ни в более поздних объектах этого нет - может, особенность конкретного пакета?).
В этой же директории файл самого объекта - можно вынуть, переименовать и посмотреть (вот простор для написания листер-плагина просмотра внутренних объектов ):
Если объект Excel (таблица или диаграмма) - файл самого объекта Wordbook (для старых(?) версий просто Book - или дело в типе связи или в Уникоде?).
Если объект Word - файл самого объекта WordDocument (сюда попадает и так наз. "рисунок Word" (мне не удалось его вытащить отдельно как именно рисунок) - но в этом случае описание именно "Microsoft Word Picture MSWordDoc Word.Picture.6").
Для Microsoft Equation 3.0 - объект Equation Native.
Для Visio - объект VisioDocument.
Для Micrografx Designer - объект DesignerDoc.
В остальных случаях, что есть у меня, файл содержания объекта - Contens.
Кстати, хорошо бы было добавить и список объектов для файлов OpenOffice.org - версий 1.* и 2.* - там файл это архив и внутреннее строение открыто документировано. _________________ Xubuntu 20.10 |
|
Back to top |
|
|
Ник
Joined: 15 Dec 2004 Posts: 1256 Location: Москва
|
(Separately) Posted: Tue Jul 17, 2007 18:10 Post subject: |
|
|
Кстати, теоретически директория "ObjectPool" должна присутствовать во всех Word файлах - но, если нет объектов, она будет пустой.
В файлах Excel, если нет объектов, я эту директорию не заметил, но нашёл вот что: директорию "_VBA_PROJECT_CUR\", в которой лежит описание "VBAProject".
Ещё - теоретически может существовать объект в объекте. У меня таких файлов нет, но, ИМХО, нужно делать отдельную логическую переменную для отображения соответствующей информации (есть объект в объекте или нет). _________________ Xubuntu 20.10 |
|
Back to top |
|
|
Alextp
Joined: 06 Feb 2005 Posts: 4957
|
(Separately) Posted: Mon Aug 13, 2007 20:58 Post subject: |
|
|
Dec
можно приспособить decstorageWCX для конвертации DOC -> TXT (из командной строки)?
Или можно сделать отдельную утилиту DocToTxt.exe,
на базе плагина, (с параметрами "имя вх. файла", "имя вых. файла"), которую можно было бы включить в поставку плагина DocSearch(TextSearch).wdx? Спасибо. _________________ UniViewer - CudaText - LogViewer
|
|
Back to top |
|
|
|
|
You cannot post new topics in this forum You cannot reply to topics in this forum You cannot edit your posts in this forum You cannot delete your posts in this forum You cannot vote in polls in this forum
|
Powered by phpBB © 2001, 2005 phpBB Group
|