Вам понадобится
  • - DjVu Editor;
  • - Microsoft Office.
Инструкция
1
Форматы pdf и djvu чаще всего являются лишь фотографиями, т.е. сканированной версией журнала или книги. Для выделения текста таких электронных копий необходимо использовать специальное программное обеспечение, которое способно распознавать изображения и проявлять в них текстовую основу.
2
Для чтения djvu-файлов можно воспользоваться любой программой-просмотрщиком, в качестве примера будет использована утилита DjVu Editor. Для качественного отображения только текста воспользуйтесь опцией «Черно-белый режим отображения» в настройках программы. Теперь вам необходимо произвести экспорт нужных страниц для последующего распознавания.
3
Нажмите верхнее меню «Печать» и в открывшемся окне выберите принтер Microsoft Office Document Image Writer. С его помощью вы можете создать виртуальную книгу с нужными для вас страницами. Другими словами, вам необходимо создать многостраничный tiff-файл. В открывшемся окне перейдите к вкладке «Дополнительно», выберите соответствующий формат и дважды нажмите кнопку «ОК».
4
Распознавание получившегося графического файла можно осуществить через стандартную утилиту Document Imaging внутри комплекта Microsoft Office. Для быстрого запуска файла необходимо нажать правой кнопкой мыши на нем в окне «Проводника Windows», выбрать раздел «Открыть с помощью» и щелкнуть мышкой по пункту Microsoft Office Document Imaging.
5
После автоматического распознавания содержимого загруженного изображения вам необходимо скопировать нужный текст. Для этого левой кнопкой мыши выделите область нужного размера и в контекстном меню выберите пункт «Копировать». Теперь откройте MS Word и вставьте текст из буфера обмена. Вам осталось привести его к читаемому виду и начать им пользоваться.