View previous topic :: View next topic |
Author |
Message |
me45ion
Joined: 07 Dec 2010 Posts: 9
|
(Separately) Posted: Tue Dec 07, 2010 05:21 Post subject: Поиск файлов, содержащих контрольные слова |
|
|
Такая проблема - надо найти все файлы типа *.doc и *.rtf, содержащие хотя бы одно из слов из заданного списка.
Все бы ничего, но тотал ищет внутри вордовских файлов, только если стоит галочка Unicod, а тут вроде удобно использовать регулярные выражения (чтобы задать несколько слов), но галка ставится либо в юникод либо в регулярные выражения и в этом случае не ищет среди вордовских файлов. |
|
Back to top |
|
 |
Avada

Joined: 01 Aug 2008 Posts: 10415 Location: Россия, Саратов
|
(Separately) Posted: Tue Dec 07, 2010 09:53 Post subject: |
|
|
me45ion
Третья вкладка, поиск с установленным плагином TextSearch.
Формат правила:
textsearch — Text — Рег. выраж. — (xxx|yyy)
(Значением подставить свой набор слов.)
В файле TextSearch.ini в верхней части есть строки для указания диапазона кодировок. Ввести, например, что-то такое:
Code: | RTF={CP:RTF} {CP:UTF16}
DOC={CP:ANSI} {CP:OEM} {CP:KOI8} {CP:UTF16} | (Поскольку расширение DOC теоретически могут иметь разные файлы.)
Подробности в файле Readme.html плагина. Обсуждение плагина на форуме — здесь. _________________ Даже самая богатая фантазия
Не представит себе наши безобразия. |
|
Back to top |
|
 |
me45ion
Joined: 07 Dec 2010 Posts: 9
|
(Separately) Posted: Tue Dec 07, 2010 11:22 Post subject: |
|
|
Огромное спасибо |
|
Back to top |
|
 |
Flasher

Joined: 06 Nov 2009 Posts: 14229 Location: Москва
|
|
Back to top |
|
 |
me45ion
Joined: 07 Dec 2010 Posts: 9
|
(Separately) Posted: Wed Dec 08, 2010 00:20 Post subject: |
|
|
Сегодня пробовал на 5 компьютерах, результат в общем негативный - очень медленно с одной стороны, если область поиска большая - зависает наглухо (на всех машинах повис), если файл с картинками тоже долго тупит. Во время тестов "на кошках" порой не находил ничего, жму второй раз - оп, находит. Находил каким то образом текст в файле, в котором только 17 картинок.
Еще большой минус - когда файлов много и они не маленькие, трудно понять, а чего из всего огромного регэкспа он там накопал в данном конкретном файле.
В общем обидно что штатный поиск в юникод работает только на одно слово. Буду разбираться, может где то чего не так сделал.
Пока обошелся утилиткой FileSeek 2.0 (не сочтите рекламой это фриваре, имхо в духе хорошего софта), как бы ее к тоталу прикрутить - ибо в ней как раз оказались реализованы все мои запросы, плюс - при выборе файла показывает кусок текста и подсвечивает слово, которое нашел. И скорость на высоте, в разы быстрее тотала (пробовал одинаковый регэксп на одинаковую область - тотал либо медленнее, либо ничего не находит, либо виснет наглухо - загружает камень на 50% и висит, причем раз от раза на одно и то же разный результат почему то) ((. |
|
Back to top |
|
 |
Avada

Joined: 01 Aug 2008 Posts: 10415 Location: Россия, Саратов
|
(Separately) Posted: Wed Dec 08, 2010 09:44 Post subject: |
|
|
me45ion
Надо всё-таки учитывать, что утилита специализированная, а для TC эта задача нетривиальная и вообще, как было показано, реализуется только обходными путями. _________________ Даже самая богатая фантазия
Не представит себе наши безобразия. |
|
Back to top |
|
 |
Batya

Joined: 15 Dec 2004 Posts: 2224 Location: Москва, Россия
|
(Separately) Posted: Wed Dec 08, 2010 10:44 Post subject: |
|
|
[off]
Я в XP при необходимости искать по содержимому doc-файлов пользовался встроенным в винду расширенным поиском. Достаточно удобно.
А в Windows 7 (у меня Максимальная) поиск какой-то отстойный.
[/off] _________________ Нет, я не сплю. Я просто медленно моргаю. |
|
Back to top |
|
 |
Alextp

Joined: 06 Feb 2005 Posts: 4957
|
(Separately) Posted: Wed Dec 08, 2010 17:45 Post subject: |
|
|
Можно поменять настройки Textsearch. выше - не то
- для rtf надо только rtf={CP:RTF}
- для doc (Ворда) - надо вызов конвертера (прописано в ini уже). _________________ UniViewer - CudaText - LogViewer
|
|
Back to top |
|
 |
me45ion
Joined: 07 Dec 2010 Posts: 9
|
(Separately) Posted: Thu Dec 09, 2010 14:25 Post subject: |
|
|
Batya, в виндовом поиске нельзя задать поиск даже по нескольким альтернативным словам, не говоря уже о более сложных запросах, а у меня десяток компов и ГБты информации, таким макаром на неделю тупой работы. А вопрос связан с гос секретами, поэтому голова болит вдвойне.
Avada,
Не в претензию к разрабу, просто мое имхо, что для софта категории файловый манагер, поиск не должен быть нетривиальной задачей.
И просто академический вопрос: если реализавана штатная возможность любого поиска, а по юникоду по одному слову, то отсутсвие регэкспов в юникоде это следствие технических сложностей или концепция?
Alextp, спс |
|
Back to top |
|
 |
Avada

Joined: 01 Aug 2008 Posts: 10415 Location: Россия, Саратов
|
(Separately) Posted: Thu Dec 09, 2010 14:32 Post subject: |
|
|
me45ion wrote: | Не в претензию к разрабу, просто мое имхо, что для софта категории файловый манагер, поиск не должен быть нетривиальной задачей. |
Смотря какой поиск, ибо "поиска вообще" не существует. И, кстати, если уж на то пошло, в абсолютном большинстве известных мне альтернативных файловых менеджеров (общим числом около двух десятков) функция поиска реализована гораздо в более скромных пределах, чем в TC.
me45ion wrote: | И просто академический вопрос: если реализавана штатная возможность любого поиска, а по юникоду по одному слову, то отсутсвие регэкспов в юникоде это следствие технических сложностей или концепция? |
Затрудняюсь ответить. Возможно, этому где-то когда-то давалось какое-то объяснение, но я сходу его не помню. _________________ Даже самая богатая фантазия
Не представит себе наши безобразия. |
|
Back to top |
|
 |
CaptainFlint

Joined: 14 Dec 2004 Posts: 6193 Location: Москва
|
(Separately) Posted: Thu Dec 09, 2010 15:10 Post subject: |
|
|
me45ion wrote: | то отсутсвие регэкспов в юникоде это следствие технических сложностей или концепция? |
Если не ошибаюсь, это ограничение используемой Гислером библиотеки регэкспов. _________________ Почему же, ё-моё, ты нигде не пишешь "ё"? |
|
Back to top |
|
 |
me45ion
Joined: 07 Dec 2010 Posts: 9
|
(Separately) Posted: Fri Dec 10, 2010 02:28 Post subject: |
|
|
Avada wrote: | Смотря какой поиск, ибо "поиска вообще" не существует. И, кстати, если уж на то пошло, в абсолютном большинстве известных мне альтернативных файловых менеджеров (общим числом около двух десятков) функция поиска реализована гораздо в более скромных пределах, чем в TC. |
С этим не спорю.
CaptainFlint, понял, значит есть проблема в программной реализации.
Всем спасибо за помощь, для себя считаю вопрос решенным. Пока недоразобрался с TextSearch, повесил на кнопку ту искалку. |
|
Back to top |
|
 |
|
|
You cannot post new topics in this forum You cannot reply to topics in this forum You cannot edit your posts in this forum You cannot delete your posts in this forum You cannot vote in polls in this forum
|
Powered by phpBB © 2001, 2005 phpBB Group
|