View previous topic :: View next topic |
Author |
Message |
Baz
Joined: 06 Mar 2006 Posts: 34
|
(Separately) Posted: Fri Dec 11, 2009 16:47 Post subject: Хранение электронных книг |
|
|
1)Если подумать, то зачем нужен Fine Reader? Любую информацию удобнее хранить в Pdf, а для экономии места в Djvu.
2)Лежат у меня 3гб книг в формате pdf - хочется сократить их размер хотя бы до 500 мб, а лучше до 50. Для этого нужно качественно перевести их в текст, но fine reader и solid converter работают плохо - много ошибок (не править же мне вручную несколько тысяч страниц)
3) Вот задумался я о том в каком формате хранить книги и что делать с другими форматами, а именно:
а)исходные картинки занимают слишком много места - невероятно много.
б)pdf великоват - если бы можно было его качественно перевести в текст или пережать в тот же pdf, но значительно меньшего размера.
в)формать djvu - занимает очень мало места, но вместе с ненужной информацией может потеряться и нужная, например нечёткие картинки уничтожаются так же, как и текстура бумаги.
г)Идальным вариантом был бы чистый текст вроде ворда, но даже такой гигант как fine reader делает ошибки при распознавании обычного текста. При этом совершенно не распознаёт формулы, и в целом плохо работает со всем что не является текстом. |
|
Back to top |
|
|
Rodny
Joined: 24 Jan 2007 Posts: 949 Location: Могилёв, Беларусь
|
(Separately) Posted: Fri Dec 11, 2009 17:22 Post subject: |
|
|
А в чём вопрос? Есть ли идеальный формат для электронных книг, в который можно без проблем конвертировать все остальные?
Так ведь нету, сам же всё расписал
Могу только заметить по поводу 3б, что Adobe Acrobat позволяет некоторую оптимизацию pdf проводить. |
|
Back to top |
|
|
Baz
Joined: 06 Mar 2006 Posts: 34
|
(Separately) Posted: Fri Dec 11, 2009 17:46 Post subject: |
|
|
Это и были вопросы, но перепишу суть ещё раз:
1-2)Текст это хорошо, но действительно ли нужно пытаться распознать книгу, или пусть лежит себе в своём 50-500 метровом pdf? Важны ли мне как обычному пользователю малый размер и редактируемость (глупо конечно, но это реальный вопрос с которым я сейчас не могу разобраться)?
3)Идеальный формат это опять же текст скажем в ворде - какая программа способна сделать это хорошо и появится она ваобще когда нибудь? |
|
Back to top |
|
|
Lev
Joined: 02 Mar 2005 Posts: 392
|
(Separately) Posted: Fri Dec 11, 2009 17:50 Post subject: |
|
|
А не лучше найти какой-нибудь форум OCR-щиков? Там подобные вопросы рассматриваются в сотнях тем и тысячах ответов. |
|
Back to top |
|
|
Tol!k
Joined: 01 Apr 2008 Posts: 1727 Location: Арзамас
|
(Separately) Posted: Fri Dec 11, 2009 17:55 Post subject: |
|
|
Baz
1-2) Ну, за тебя на эти вопросы никто не ответит.
3) Сейчас — никакая; Появится, но очень не скоро.
А пока я бы выбрал djvu+OCR |
|
Back to top |
|
|
Моторокер
Joined: 06 May 2005 Posts: 1517 Location: г. Пермь (читается Перьмь)
|
(Separately) Posted: Sat Dec 12, 2009 22:30 Post subject: |
|
|
1. FineReader нужен для распознавания текста - более подробное почитай описание на сайте. Цели же могут быть какими угодно - залповый ввод данных в БД, автоматизация документооборота, быстрое получение редактируемого текста из бумажного.
2. Запиши на DVD, либо купи винт, либо скоростной интернет. Сколько книг из этих 3 Гб за этот год ты хотя бы открыл? Говорить об экономии места, когда такой объём данных скачивается за день, а то и меньше, как-то бессмысленно что-ли..
3. Хранить в том формате, в каком скачал, чтобы не внести ещё больше искажений. Если в книге нет картинок, и есть альтруизм, попытаться распознать. _________________ плагины для Total Commander, статьи Graphics Converter; NSCopy; SEO HTML; KillOK; Плагин на Delphi
ПармаСруб - строительство домов и бань в Перми |
|
Back to top |
|
|
iNorbert
Joined: 03 Mar 2008 Posts: 221
|
(Separately) Posted: Sat Dec 12, 2009 22:48 Post subject: |
|
|
Что ворд, что пэдээф, что дежавю. Везде есть текстовый слой, поэтому проблема только лишь в трудоемкости полного распознавания. А тут уже все от людей зависит. Создавайте сообщество фанов-маньяков и сканируйте от души. А жалеть места под три гига можно при каких-то имеющихся вариантах. При отсутствии этих самых вариантов - терпеть. Что и предлагаю сделать автору Не в обиду будет сказано. |
|
Back to top |
|
|
|