View previous topic :: View next topic |
Author |
Message |
funduk
Joined: 16 Aug 2005 Posts: 1513 Location: Санкт-Петербург
|
(Separately) Posted: Sat Aug 18, 2007 18:39 Post subject: |
|
|
Stepan_Lameroff wrote: | FiltDump от Microsoft (лежала приблуда в Platform SDK )
Передается имя файла, результат выводит в stdout.
Работает кривовато (имеется в виду качество извлечения текста), но быстро. | Быстро до офигения! Однако, я так понял, что в документах, содержащих гиперссылки, оные в текст не переводятся, а просто игнорируются. А есть такие утилиты, которые не игнорируют их? |
|
Back to top |
|
|
Alextp
Joined: 06 Feb 2005 Posts: 4957
|
|
Back to top |
|
|
Alextp
Joined: 06 Feb 2005 Posts: 4957
|
(Separately) Posted: Mon Aug 20, 2007 03:26 Post subject: |
|
|
funduk wrote: | я так понял, что в документах, содержащих гиперссылки, оные в текст не переводятся, а просто игнорируются. А есть такие утилиты, которые не игнорируют их? |
В ридми в секции Converters 4 конв. для DOC / 2 для HTML (надо смотреть). |
|
Back to top |
|
|
Ник
Joined: 15 Dec 2004 Posts: 1256 Location: Москва
|
(Separately) Posted: Fri Aug 24, 2007 19:52 Post subject: |
|
|
Всё-таки остаётся проблема поиска в DjVu.
Выяснилось, что в них можно добавлять текстовый слой - WinDjVu этот слой видит - я у себя несколько таких файлов нашёл.
На разных форумах предлагается для поиска использовать dtSearch + плагин от Лизарда - но эта утилита сугубо платная...
Ни у кого нет никаких идей по поиску в DjVu файлах? Формат-то вроде открытый... _________________ Xubuntu 20.10 |
|
Back to top |
|
|
Athari
Joined: 19 Dec 2004 Posts: 81 Location: Казань
|
(Separately) Posted: Fri Aug 24, 2007 22:10 Post subject: |
|
|
Quote: | добавлены кодировки UTF16, UTF16LE, UTF16BE |
Не думаешь добавить полноценную поддержку всех кодировок, которые держит Винда? _________________ «Today is the first day of the rest of your life» |
|
Back to top |
|
|
Alextp
Joined: 06 Feb 2005 Posts: 4957
|
(Separately) Posted: Fri Aug 24, 2007 22:14 Post subject: |
|
|
Athari wrote: | Не думаешь добавить полноценную поддержку всех кодировок, которые держит Винда? |
Нет пока.
С кодировками я буду возиться в Universal Viewer. вот где можно развернуться. _________________ UniViewer - CudaText - LogViewer
|
|
Back to top |
|
|
Ник
Joined: 15 Dec 2004 Posts: 1256 Location: Москва
|
(Separately) Posted: Sat Aug 25, 2007 02:15 Post subject: |
|
|
По поводу поиска в FB2:
Владимир Оловянников, автор листер-плагина (PDF)Filter любезно подсказал мне, как правильно запустить скрипт от FB2 to Any в командной строке.
Указанная им команда отлично работает для его листер-плагина, но перенести на данный плагин я её не смог - конверсия не производится.
Что может быть неверно в данной команде:
Quote: | FB2=wscript.exe /B /NoLogo "c:\Program Files\FB2 to Any\fb2txt_commandline.vbs" "{In}" "{Out}" {CP:UTF8} |
Может, плагин не понимает опций функции или имени скрипта как аргумента? _________________ Xubuntu 20.10 |
|
Back to top |
|
|
Alextp
Joined: 06 Feb 2005 Posts: 4957
|
(Separately) Posted: Sat Aug 25, 2007 02:22 Post subject: |
|
|
Могу обновить плагин, чтобы при ошибке запуска конв. он писал в лог командную строку.
Тогда просто будешь видетьЮ что там запускается. _________________ UniViewer - CudaText - LogViewer
|
|
Back to top |
|
|
Ник
Joined: 15 Dec 2004 Posts: 1256 Location: Москва
|
(Separately) Posted: Sat Aug 25, 2007 02:57 Post subject: |
|
|
Да, так, наверное, было бы легче его отладить... _________________ Xubuntu 20.10 |
|
Back to top |
|
|
Alextp
Joined: 06 Feb 2005 Posts: 4957
|
(Separately) Posted: Sat Aug 25, 2007 03:01 Post subject: |
|
|
Обновил до 1.3.6
Если не поможет, присылай архив: скрипт + FB2... |
|
Back to top |
|
|
Alextp
Joined: 06 Feb 2005 Posts: 4957
|
(Separately) Posted: Sat Aug 25, 2007 03:15 Post subject: |
|
|
А этот использовать через GetTextIFilter - ссылка в readme..
Last edited by Alextp on Sat Aug 25, 2007 03:37; edited 1 time in total |
|
Back to top |
|
|
Ник
Joined: 15 Dec 2004 Posts: 1256 Location: Москва
|
(Separately) Posted: Sat Aug 25, 2007 03:29 Post subject: |
|
|
Спасибо
Не работает всё равно - по-моему, ошибка в самом скрипте и (или) стилевом файле:
Quote: | Windows Script Host
Script: c:\Program Files\FB2 to Any\fb2txt_commandline.vbs
Line: 90
Char: 1
Error: The stylesheet does not contain a document element. The
stylesheet may be empty, or it may not be a well-formed XML document
Code: 80004005
Source: FB2_to_TXT.FB2TXTExport |
Конвертация в RTF работает отлично, но двойная конвертация - изврат, ИМХО.
Подождём его ответа. Не хотелось бы самому копаться в стилевом файле... _________________ Xubuntu 20.10 |
|
Back to top |
|
|
Ник
Joined: 15 Dec 2004 Posts: 1256 Location: Москва
|
(Separately) Posted: Sat Aug 25, 2007 03:40 Post subject: |
|
|
Alextp wrote: | использовать через GetTextIFilter |
Спасибо, но он на .NET - я такой софт принципиально не использую - после того, как выкачал пачку обновлений безопасности для него чуть ли не больше его самого...
Пусть Билл Г. свой отстой пользует...
А фильтры к нему - платные - кроме DjVu.
Может, автор перепишет на чём другом - было бы круто...? _________________ Xubuntu 20.10 |
|
Back to top |
|
|
Alextp
Joined: 06 Feb 2005 Posts: 4957
|
(Separately) Posted: Sat Aug 25, 2007 03:43 Post subject: |
|
|
Может ему каталог(текущий) надо задавать? |
|
Back to top |
|
|
Alextp
Joined: 06 Feb 2005 Posts: 4957
|
(Separately) Posted: Sat Aug 25, 2007 03:46 Post subject: |
|
|
Ник wrote: |
Спасибо, но он на .NET - я такой софт принципиально не использую - после того, как выкачал пачку обновлений безопасности для него чуть ли не больше его самого...
Пусть Билл Г. свой отстой пользует...
|
))
Тут кто-то постил другой IFilter конвертер. |
|
Back to top |
|
|
|