Посоветуйте программу для извлечения текста из веб-страниц
Select messages from
# through # FAQ
[/[Print]\]

Total Commander -> Программное обеспечение

#1: Посоветуйте программу для извлечения текста из веб-страниц Author: BeardFury78 PostPosted: Sat Jan 21, 2017 19:01
    —
Пожалуйста, максимально простую и бесплатную или триальную, (можно коммерческую, если есть кряк в сети).
Чтобы можно было закидывать в проект список url-ов и программа извлекала бы тексты из веб-страниц полностью или с условиями, с регэкспами.
Пробовал искать в интернете такие программы, везде или не то, или слишком сложные с кучей настроек, или умеют только по одному веб-адресу работать, а не скопом, или только платные. Может кто-нибудь знает такие программы?

#2:  Author: FlasherLocation: Москва PostPosted: Sat Jan 21, 2017 19:41
    —
У меня скрипт скачивания в т.ч. и это (без условий) умеет делать. Могу в ЛС скинуть.

#3:  Author: BeardFury78 PostPosted: Sat Jan 21, 2017 19:48
    —
Flasher
Пожалуйста, скиньте.

#4:  Author: Dimsok PostPosted: Sat Jan 21, 2017 19:53
    —
Если что, можно Pandoc, Calibre попробовать.

#5:  Author: BeardFury78 PostPosted: Sat Jan 21, 2017 19:58
    —
Dimsok
Про Pandoc речь идет об этом? https://ru.wikipedia.org/wiki/Pandoc
Что-то по описанию не похоже на искомое. Или если вы имели в виду другую программу, скиньте ссылку на эту.
Про Calibre знаю, но в первый раз слышу чтобы можно ею подобным образом пользоваться. Подскажите, каким образом можно это сделать.

#6:  Author: FlasherLocation: Москва PostPosted: Sat Jan 21, 2017 20:07
    —
BeardFury78
Скинул. Cool

#7:  Author: Dimsok PostPosted: Sat Jan 21, 2017 20:40
    —
https://manual.calibre-ebook.com/news.html

https://www.mobileread.com/forums/showthread.php?t=121439

Это у них рецепты называется.

Добавлено спустя 18 минут:

А вот твой запрос и решение с pandoc:
http://softwarerecs.stackexchange.com/questions/31208/tool-to-extract-text-from-multiple-urls-and-place-in-a-file

#8:  Author: BeardFury78 PostPosted: Sat Jan 21, 2017 21:00
    —
Dimsok
Ок, попробую, но Flasher уже скинул вариант попроще.



Total Commander -> Программное обеспечение


output generated using printer-friendly topic mod. All times are GMT + 4 Hours

Page 1 of 1

Powered by phpBB © 2001, 2005 phpBB Group