View previous topic :: View next topic |
Author |
Message |
Ник
Joined: 15 Dec 2004 Posts: 1256 Location: Москва
|
(Separately) Posted: Sat Sep 23, 2006 12:26 Post subject: [Plugin request] WCX-плагин для OpenOffice.org и MSO 2007 |
|
|
Всем привет!
Понадобилось мне тут как-то сделать ряд небольших файлов (в значительной степени повторяющегося содержания) и переслать коллеге.
Сделал файлы ООо, экспортнул в MS Word, заархивировал в пакет и послал мылом.
Затем обратил внимание на суммарный размер использованных файлов ООо и размер получившегося архива файлов Ворд - архив Ворд был существенно меньше.
Для проверки заархивировал исходные файлы ООо - архив оказался значимо больше архива файлов Ворд с тем же содержанием...
Почему так - понятно: при вычислении словаря используется содержание файла - в случае файлов ООо уже готовый архив, в случае МС Ворд внутри файла "видны" одинаковые слова в Уникоде - которые и "гребутся" в словарь как одно вхождение.
Т.к. всё больше и больше софта переходит на принцип организации файла: пакет XML, архивированный ZIP (МСО 2007, ООо, SVGZ, новый формат Fiction Book явно тоже будет такой и т.п.), - то мне подумалось, что правильная модель архивации таких файлов была бы следующей:
1) Берём файлы, проверяем - архив ли это, есть ли внутри ХМЛ.
2) Разархивируем такие файлы во временную директорию, каждый в свою - со служебными именами директорий.
3) Делаем список имён исходных файлов и список соответствующих им директорий.
4) Все эти директории и файл из (3) архивируем в один архив и сжимаем.
ИМХО - будет существенно меньший архив - хотя его создание больше (что ещё непонятно - за счёт возрастания скорости построения словаря) займёт времени и потребует больше дискового пространства.
Если ещё взять как итоговый архиватор-компрессор не ZIP, а что-то типа 7-zip, то вообще будет просто песня  _________________ Xubuntu |
|
Back to top |
|
 |
Alextp

Joined: 06 Feb 2005 Posts: 4957
|
(Separately) Posted: Thu Sep 28, 2006 14:58 Post subject: |
|
|
Будет существенно меньший архив, но только: как ты потом файлы будешь просматривать в ООо? Распаковывать по отдельности, зиповать, переименовывать в ODT?
Для пользователя такой подход пока не годится... _________________ UniViewer - CudaText - LogViewer
|
|
Back to top |
|
 |
Ник
Joined: 15 Dec 2004 Posts: 1256 Location: Москва
|
(Separately) Posted: Thu Sep 28, 2006 15:22 Post subject: |
|
|
Назовём такой тип архивации super-solid и предупредим, что без специального разархиватора - просмотр файлов в архиве невозможен.
А разархиватор будет выбирать нужную директорию и ЗИПовать её во временный файл - или вызывать встроенный в разархиватор просмотрщик...
Мне бы такое очень подошло - когда несколько тысяч офисных документов с довольно ограниченным словарём - думаю, что архив будет довольно компактный.
Дополнение:
Только что проверил на небольшом количестве маленьких файлов ООо:
Если делать ЗИП - экономии нет, архив даже больше, но, если делать 7-Зип, то сжатие улучшается в 2, 3 и даже 6 раз!!! _________________ Xubuntu |
|
Back to top |
|
 |
Alextp

Joined: 06 Feb 2005 Posts: 4957
|
(Separately) Posted: Thu Sep 28, 2006 15:46 Post subject: |
|
|
Ясно, идея ясна. Преимущества solid-архивации налицо.
Вот что: почему бы тебе не предложить это сообществу ООо? Можно сделать что-то типа "Подшивки документов" - спец. программка небольшого размера, которая собирает документы в один архив с солид-архивацией, с расширением ODZ например. В МС-Офисе есть подшивщик, почему же в ООо его нет? А идея в том, чтобы сделать архив подшивщика солидным... |
|
Back to top |
|
 |
Ник
Joined: 15 Dec 2004 Posts: 1256 Location: Москва
|
(Separately) Posted: Thu Sep 28, 2006 15:53 Post subject: |
|
|
Я много работал с байендерами в МСО - они себя не оправдывают (кроме диких глюков и полного коллапса ряда файлов): затруднён просмотр, поиск и прочее.
Гораздо проще делать отдельные папки для отдельных проектов.
К тому же, в байендере редко бывает больше 20-30 разнообразных документов - а это не то число, которое даёт ощутимый выигрыш в размерах.
Для "окупающегося" выигрыша нужно - ИМХО - 100-200 однообразных документов... _________________ Xubuntu |
|
Back to top |
|
 |
Alextp

Joined: 06 Feb 2005 Posts: 4957
|
(Separately) Posted: Thu Sep 28, 2006 16:50 Post subject: |
|
|
А чем плагин для TC будет лучше байндера? Тот-же байндер, только ограниченный TC. |
|
Back to top |
|
 |
Ник
Joined: 15 Dec 2004 Posts: 1256 Location: Москва
|
(Separately) Posted: Thu Sep 28, 2006 17:31 Post subject: |
|
|
Тем, что им можно сохранять плотные архивы, которые в принципе можно распаковать вручную (если нужен один файл) - перепаковал одну директорию ЗИПом и дал нужное имя и расширение.
Думаю, что это будет полезно не для ООо конкретно, а для паковки всех файлов внутреннего формата XML-ZIP и XML (ООо, МСО2007, SVGZ, FB2Z и прочего - до фига всего).
Главное - мне кажется, что сейчас (в связи с развитием мощности компов) многие будут переходить с формата XML (он быстро распространяется) на формат XML-ZIP и я просто предлагаю путь создания сильно(?) плотного архива с малыми (или средними) проблемами распаковки и возможностью доступа без чрезмерно специального софта. _________________ Xubuntu |
|
Back to top |
|
 |
Alextp

Joined: 06 Feb 2005 Posts: 4957
|
(Separately) Posted: Thu Sep 28, 2006 17:57 Post subject: |
|
|
Quote: | Тем, что им можно сохранять плотные архивы, которые в принципе можно распаковать вручную (если нужен один файл) - перепаковал одну директорию ЗИПом и дал нужное имя и расширение. |
Ну так формат архивов можно сделать таким, каким ты хочешь, а "морду" (интерфейс) - как у байндера.
Quote: | Думаю, что это будет полезно не для ООо конкретно, а для паковки всех файлов внутреннего формата XML-ZIP и XML (ООо, МСО2007, SVGZ, FB2Z и прочего - до фига всего). |
Ну да, потом можно будет и другие форматы поддержать (какие ты назвал)
Quote: | и я просто предлагаю путь создания сильно(?) плотного архива с малыми (или средними) проблемами распаковки и возможностью доступа без чрезмерно специального софта | .
Это я понял
Но "морда" не помешает. |
|
Back to top |
|
 |
Ник
Joined: 15 Dec 2004 Posts: 1256 Location: Москва
|
(Separately) Posted: Thu Sep 28, 2006 18:29 Post subject: |
|
|
Про байндер я на форуме ООо вопрос задал, но раньше версии 3 этого не будет - т.е. пару лет точно...
А плагин - ИМХО - может пригодиться (даже без гуёвой морды) уже сейчас. _________________ Xubuntu |
|
Back to top |
|
 |
|