View previous topic :: View next topic |
Author |
Message |
Mailk
Joined: 16 Jan 2010 Posts: 251
|
|
Back to top |
|
|
Skif_off
Joined: 28 Nov 2012 Posts: 1232
|
(Separately) Posted: Mon Oct 24, 2016 13:51 Post subject: |
|
|
Mailk
Вы проверяли, плагин работает с xdoc2txt линейки 2.х? |
|
Back to top |
|
|
Mailk
Joined: 16 Jan 2010 Posts: 251
|
(Separately) Posted: Mon Oct 24, 2016 15:45 Post subject: |
|
|
Skif_off wrote: | Mailk
Вы проверяли, плагин работает с xdoc2txt линейки 2.х? |
тот последний не ставил еще, а предыдущий работал искал.. |
|
Back to top |
|
|
Skif_off
Joined: 28 Nov 2012 Posts: 1232
|
(Separately) Posted: Mon Oct 24, 2016 15:58 Post subject: |
|
|
Mailk
"Предыдущий" - это xdoc2txt 2.16 или xdoc2txt 1.52? |
|
Back to top |
|
|
Mailk
Joined: 16 Jan 2010 Posts: 251
|
(Separately) Posted: Mon Oct 24, 2016 16:03 Post subject: |
|
|
2.14 я давал ссылку |
|
Back to top |
|
|
Skif_off
Joined: 28 Nov 2012 Posts: 1232
|
(Separately) Posted: Wed Oct 26, 2016 23:17 Post subject: |
|
|
Mailk
А в TextSearch.ini строка с xdoc2txt оставлена всё та же
Code: | %COMSPEC% /C Conv\XDoc2txt\xdoc2txt.exe "{In}" > "{Out}" |
? |
|
Back to top |
|
|
Dimsok
Joined: 17 Aug 2014 Posts: 663
|
(Separately) Posted: Thu Oct 27, 2016 23:45 Post subject: |
|
|
Тем временем в экстрактор текста от Балаболка добавилась поддержка pdb, wpd, tcr форматов |
|
Back to top |
|
|
Mailk
Joined: 16 Jan 2010 Posts: 251
|
(Separately) Posted: Fri Oct 28, 2016 19:44 Post subject: |
|
|
Skif_off wrote: | Mailk
А в TextSearch.ini строка с xdoc2txt оставлена всё та же
Code: | %COMSPEC% /C Conv\XDoc2txt\xdoc2txt.exe "{In}" > "{Out}" |
? |
у меня такой .*ini и как он правилен не знаю...
[Converters]
TXT={CP:ANSI} {CP:UTF8} {CP:UTF16}
HTM={CP:ANSI} {CP:UTF8}
HTML=HTM
XML={CP:UTF8} {CP:ANSI}
;MS RTF
;RTF={CP:RTF}
WRI={CP:RTF}
;Adobe Acrobat
PDF=Conv\gettext\GetText.exe "{In}" "{Out}"
HLP=PDF
XLS=PDF
PPT=PDF
;DOC=PDF
PPS=PDF
XDOC=%COMSPEC% /C CONV\XDOC\XDOC2TXT.EXE "{In}">"{Out}"
mht=XDOC
doc=XDOC
docx=XDOC
;xls=XDOC
xlsx=XDOC
xlsm=XDOC
;ppt=XDOC
pptx=XDOC
pptm=XDOC
rtf=XDOC
CHM=Conv\Chm\FiltDump.exe -b -o "{Out}" "{In}" {CP:UTF16}
;CHM=%COMSPEC% /C ..\..\wcx\Total7zip\7zG.exe e "{In}" *.htm* -x!images\ -so > "{Out}" -r {CP:ANSI} {CP:UTF8}
DJVU=Conv\Djvu\djvutxt.exe "{In}" "{Out}" {CP:UTF8}
DJV=DJVU
FB2=wscript.exe /B /NoLogo Conv\fb2txt\fb2txt_commandline.vbs "{In}" "{Out}" |
|
Back to top |
|
|
Dimsok
Joined: 17 Aug 2014 Posts: 663
|
(Separately) Posted: Sun Nov 27, 2016 22:40 Post subject: |
|
|
У кого-нибудь остались ifilters от Citeknet? Во всём инете не сыскать. |
|
Back to top |
|
|
BigBadHort
Joined: 15 Jan 2017 Posts: 3
|
(Separately) Posted: Sun Jan 15, 2017 14:31 Post subject: Ошибка у balabolka_text.exe |
|
|
Dimsok wrote: |
cross-plus-a.___/balabolka_text.zip
Работает в разы шустрей, правда не столько форматов поддерживает.
Поддерживаемые форматы файлов: AZW, AZW3, CHM, DOC, DOCX, EPUB, FB2, HTML, MHT, MOBI, ODT, PDF, PRC, RTF, TXT |
С сайта убрали balabolka_text.exe
Единственная которую нашел в сети 1.04 от 2013 года
Настроил все по вашему образцу - все находит но выдает ошибку (с противным блямканьем на каждом файле) - "This archive is not a valid Zip archive"
Причем по заголовку окна с ошибкой, видно что выдает ошибку balabolka_text.exe
(картнку не смог вставить)
Помогите исправить эту ошибку!!
Может у вас версия balabolka_text.exe поновее - прсьба выложить в обменник
з.ы.
вот мой конфиг
Code: | [Converters]
TXT={CP:ANSI} {CP:UTF8} {CP:UTF16}
HTM={CP:ANSI} {CP:UTF8}
HTML=HTM
XML={CP:UTF8} {CP:ANSI}
;MS RTF
;RTF={CP:RTF}
WRI={CP:RTF}
;Adobe Acrobat
;PDF=Conv\GetTextIFilter\GetTextIFilter.exe "{In}" "{Out}"
;HLP=PDF
;XLS=PDF
;PPT=PDF
;;DOC=PDF
;PPS=PDF
XDOC=%COMSPEC% /C Conv\XDoc2txt\xdoc2txt.exe -8 "{In}" > "{Out}" {CP:UTF8}
mht=XDOC
odt=XDOC
doc=XDOC
docx=XDOC
xls=XDOC
pdf=XDOC
;xls=XDOC
xlsx=XDOC
xlsm=XDOC
ppt=XDOC
;ppt=XDOC
pptx=XDOC
pptm=XDOC
rtf=XDOC
;CHM=Conv\Chm\chm2htm.bat -b -o "{Out}" "{In}" {CP:UTF16}
;CHM=%COMSPEC% /C ..\..\wcx\Total7zip\7zG.exe e "{In}" *.htm* -x!images\ -so > "{Out}" -r {CP:ANSI} {CP:UTF8}
DJVUT=Conv\djvutxt\djvutxt.exe "{In}" "{Out}" {CP:UTF8}
djv=DJVUT
djvu=DJVUT
Balabolka_text=cmd /c Conv\balabolka\balabolka_text.exe -f "{In}" -o > "{Out}"
FB2=Balabolka_text
MOBI=Balabolka_text
AZW=Balabolka_text
EPUB=Balabolka_text
PRC=Balabolka_text
CHM=Balabolka_text
;RTF=Balabolka_text
Balabolka_text_7z=cmd /c Conv\balabolka_text\7z.exe e "{In}" -so|Conv\balabolka\balabolka_text.exe -i -o > "{Out} {CP:ANSI}
ZIP=Balabolka_text_7z
RAR=Balabolka_text_7z
7Z=Balabolka_text_7z
;FB2=wscript.exe /B /NoLogo Conv\fb2txt\fb2txt_commandline.vbs "{In}" "{Out}" | [/code] |
|
Back to top |
|
|
Dimsok
Joined: 17 Aug 2014 Posts: 663
|
(Separately) Posted: Sun Jan 15, 2017 16:20 Post subject: |
|
|
Quote: | С сайта убрали balabolka_text.exe |
А это что?
http://www.cross-plus-a.com/blb2txt.zip
Добавлено спустя 7 минут:
BigBadHort
Если какой-то файл не скачивается, надо для начала проверить домен на работоспособность, и уже искать через него. |
|
Back to top |
|
|
BigBadHort
Joined: 15 Jan 2017 Posts: 3
|
(Separately) Posted: Sun Jan 15, 2017 19:02 Post subject: Теперь все нормально стало |
|
|
Спасибо! Теперь все нормально стало |
|
Back to top |
|
|
BigBadHort
Joined: 15 Jan 2017 Posts: 3
|
(Separately) Posted: Sun Jan 15, 2017 22:47 Post subject: |
|
|
А может быть в одном pdf файле сразу две кодировки?
Преобразую с помощью blb2txt в текстовый файл, а поучается смесь из читаемого и не читаемого
Code: | Компания Common Craft выбрала видео. И хотя этот способ вполне удовлетво- ряет нас и нашу аудиторию, он лишь один из многих, подходящих для представле- ния объяснений таким образом, чтобы они сумели привлечь внимание. Подобных средств так много, что выбор может показаться тяжелой работой. Следующая глава поможет в выборе способа, соответствующего ограничениям, которые накладывает на вас ваша аудитория, и имеющемуся набору инструментов.
ÎÁÚßÑÍÅÍÈÅ Â ÐÀÁÎÒÅ: ÊÈÒ ÏÈÐÑ È INTEL
Êèò Ïèðñ ñòàë çâåçäîé êîðïîðàöèè Intel, ïîòîìó ÷òî óìååò îáúÿñíÿòü ñîòðóäíèêàì ñëîæ- íûé ìèð êîìïåíñàöèé ïðîñòûìè ñëîâàìè. Ìû âìåñòå ðàáîòàëè íàä ìíîæåñòâîì âè- äåîïðîåêòîâ, è îí ñòàë îäíèì èç íàøèõ ñàìûõ óâàæàåìûõ ïàðòíåðîâ. Íàøà ñîâìåñò- íàÿ ðàáîòà ñ åãî êîëëåãîé Ìèøåëü Äæåéìñ ïîëó÷èëà â 2011 ãîäó çîëîòóþ íàãðàäó IABC Quill*. ß ïîïðîñèë Êèòà ðàññêàçàòü î ìåòîäèêå åãî îáúÿñíåíèé. |
|
|
Back to top |
|
|
Dimsok
Joined: 17 Aug 2014 Posts: 663
|
|
Back to top |
|
|
Skif_off
Joined: 28 Nov 2012 Posts: 1232
|
(Separately) Posted: Wed Jan 18, 2017 18:58 Post subject: |
|
|
Подскажите, пожалуйста, что не так: при поиске получаю ошибку
Quote: | Cannot convert file "path\file.docx" to "C:\TempTextSrch.txt".
Command: "C:\Windows\system32\cmd.exe /C Conv\XDoc2txt\xdoc2txt.exe "path\file.docx" > "C:\TempTextSrch.txt"". |
%TEMP%=C:\Temp, в TextSearch.ini
Code: | XDOC=%COMSPEC% /C Conv\XDoc2txt\xdoc2txt.exe "{In}" > "{Out}"
...
docx=XDOC |
ТС 8.52а, Win7x32 |
|
Back to top |
|
|
|