Формат DjVu (от французского "дежавю") — это специальный формат для хранения и сжатия отсканированных документов. Применяется для тех документов, в которых присутствует много схем, рисунков, формул и т.д. Содержит полностью идентичное изображение документа вместе с изображением бумажного носителя. Но обеспечивает полноценный поиск благодаря наличию в этом формате текстового содержания. Широко используется для библиотек и архивов. Для чтения документов в этом формате можно использовать программу STDU Viewer (она понимает не только формат дежавю, но и многие другие), а для преобразования в формат PDF - STDU Converter. В Word полноценного преобразователя не знаю, но есть много разных конвертеров из дежавю в PDF, а из него в Word (например, WonderShare PDF to Word).
Программы лучше "ABBYY Fine Reader" не встречал, и сканировать и распознать и ошибки проверить и в любой формат сохранить, а уж таблицы распознать вообще адекватно кроме FR ни одна программа не смогла.
Если нужно оцифровать большую печатную книгу, да ещё и с иллюстрациями, то оптимальный вариант Djvu - степень сжатия и скорость загрузки страниц на порядок выше чем pdf. Именно по этой причине большие библиотеки оцифровывают книги в этот формат.
На мобильных устройствах почти все приличные читалки открывают все распространённые форматы в том числе и Djvu и PDF.
Можно конечно и попроще сделать, сканировать книгу в любой формат, любой программой (хоть и идущей в комплекте со сканером), а затем перевести в djvu программой "DjVuSolo".
Выбор формата в данном случае зависит от самой книги. "DJVU" - для объёмных книг с обилием изображений, "PDF" - универсальный формат, но большое количество изображений делает его тяжелым тормозным (особенно на мобильных устройствах). Формат "TXT" не поддерживает нормальное форматирование в результате читать будет не удобно.
Лучшей программой для конвертирования PDF в DOC является ABBYY PDF Transformer. Еще есть неплохая бесплатная программа First PDF и конвертер PDF в DOC онлайн которые находятся здесь.
Конвертирование DJVU в DOC осуществляется сложнее: так как в формате DJVU по простому говоря информация сохранена в виде изображений, то его сначала нужно распознать (любой программой для распознавания текста, например ABBYY FineReader) и уже потом скопировать полученный текст в Word. Но можно поступить иначе: DJVU-документ можно сначала перевести в PDF (например с помощью doPDF или PDF Creator), а потом PDF конвертировать в DOC.
PDF - универсальный формат документов, шрифты, картинки и страницы целиком выглядят одинаково на любом гаджете.
EPUB - xml-документ. Считается самым распространенным.
djvu - еще один из многостраничных растровых форматов. Так как показывает картинки, то не имеет возможности поиска.
MOBI - xml-документ. Созданный специально для Kindle.
Если мне нужно взять из PDF -файла отдельные страницы,я щелкаю правой кнопкой мыши на файл,открываю его с помощью Adobe Photoshop,выделяю отдельные страницы галочками в окошке миниатюр и сохраняю их как отдельные файлы.
Итак,беру 6 страницу,нажимаю ОК. Страница появляется уже в большем масштабе. Далее,иду в ФАЙЛ-СОХРАНИТЬ КАК и сохраняю на рабочем столе или в специальную папку,придумав файлу новое имя. Те же манипуляции провожу с другими нужными страницами из файла PDF.