Для распознавания текста я пользуюсь Readiris Pro 9. Но это для других картинок. А в PDF открываю как обычно акробатом, Затем - Редактирование/выделить все/копировать в буфер. Остается только открыть какой-нибудь редактор и вставить содержимое буфера. Все очень быстро и корректно.
В Linux некоторые просмотрщики документов позволяюют делать копипаст из файлов в форматах pdf. В таком случае можно скопипастить весь документ в обыкновенный текстовый редактор и там редактировать. После этого файл можно как бы "распечатать" в pdf.
В Windows тоже имеются программы для корректировки файлов в этом формате. Посмотрите в эту сторону:
http://soft.mydiv.net/win/collections/show-PDF-redaktory.html
RTF = Reach Text Format
Это достаточно простой формат, практически текстовой + управляющие символы (например\b)
Посмотрите на Википедии http://ru.wikipedia.org/wiki/Rich_Text_Format
DOC - более сложный, двоичный, формат (Word 97—2000.)
DOCX - формат, основанный на XML (MS Word 2007)
Сказать бы "по расширению", но видимо оно и отсутствует, иначе вопроса не возникло бы.
Давайте попробуем посмотреть на содержание файла, можно просто открывая файл блокнотом (в режиме "Все файлы *.*").
Для формата DOC первые символы будут "РП"
DOCX - "PK"
TXT - скорее всего, если нет ошибки в кодировке, просто сам текст
RTF - "{\rtf1"
Теоретически, можно просто попробовать открыть документ WinWord'ом - он сам будет предлогать подобрать верный формат и кодировку.
А зачем?..
DjVu Вы всё равно ничем не сконвертируете, это весьма самодостаточный формат. Вроде бы можно его конвертировать с помощью продуктов от Adobe, но, согласитесь, задействовать для конвертации мощнейшую прогу распознавания текстов - чересчур уж экстремально.
Если подразумевается комфортное чтение на, скажем, планшете, то проги FBReader, CoolReader и AllReader отлично отображают все перечисленные Вами форматы, кроме DjVu. Для последнего я бы рекомендовал EBookDroid. Прога умеет делить двойные развороты и настраивать цвет фона. Имеется в виду, конечно, Android-планшеты.
Для чтения с дисплея на компе с Windows отлично подходят те же CoolReader и AllReader.
Если же Вас интересует катологизация библиотеки, в и-нете частенько предлагается Calibre. Я пробовал - не понравилось...
На мой взгляд, лучшая прога для этих целей - ICE Book Reader. Вот она-то как раз и конвертирует почти все текстовые форматы (кроме pdf и djvu), правда, в свой собственный формат. Но это даже удобно. Можно собрать личную библиотеку в одной папке, да ещё и легко отсортировать её по категориям.