Как из PDF сделать обычный чисто текстовый формат или другой формат понятный читалкам (озвучивателям текстов), например формат FB2?
Это интересует потому, что книги я не читаю, а слушаю на беспроводные наушники в дороге, в транспорте, даже во время работы. Не тратя на это свободное время. В 2024 году, например так "прослушал" ~200 книг. Но учебные и технические книги обычно есть лишь в формате PDF, которые читалки не воспринимают.
Пдф может быть с текстовым слоем, который можно просто выделить и скопировать, а затем вставить в текстовый редактор и сохранить там нужно в формате, а может быть просто отсканированным изображением, которое нужно распознать, чтобы из набора пикселей получить машиночитаемый текст. Для Аэтого используют компьютерные программы и мобильные приложения распознавания текста. На компьютере У меня много лет стоит программа ABBYY Fine Reader, а когда мне подарили электронную читалку серии Amazon Kindle, то для перекодирования текстов в подходящий ей формат я нашёл программу Calibre.
Забыл сказать, редактирование файлов pdf с текстовым слоем уже давно доступно как дополнительная платная функция таких программ как foxit PDF editor, которые бесплатно дают просмотреть PDF файл, сделать на нём пометы поверх текста и прослушать его, только у меня на Андроиде в нём прослушивание прерывистое, по крайней мере на русском, но может быть Вам повезёт, и у вас оно будет плавно, и тогда когда конвертировать файл не придётся вообще. Аналогично просмотр бесплатно у меня в мобильном приложении microsoft 365, а вот преобразование с pdf в word там платное в отличие от мобильного приложения самого microsoft word, где без редактирования можно и прослушать. На компьютере стоит текстовый редактор Балаболка, который позволяет прослушивать введённый в окно редактирования текст и сохранять его синтезированное чтение в формате аудиозаписи. Для этого на компьютере необходимо иметь голосовые движки с поддержкой нужного вам языка. На Андроиде с помощью речевых сервисов Google работает мобильное приложение с таким же функционалом текстового редактора без форматирования, но с прослушиванием и сохранения аудиозаписи, которое в магазине приложений от Google носит русское название "Текст в речь" и разработано фирмой alpaca. Соответственно на Андроиде можно зайти в Проводник или аналогичное приложение Files,, найти нужный вам pdf-файл, нажать возле него на три точки, выбрать пункт меню "открыть с помощью" и там выбрать одно из перечисленных мной предложений. Если выбрать "Текст речь", то из PDF с текстовым слоем будет извлечён текст, под которым будет треугольная кнопка воспроизведения и стрелочка вниз для создания аудиозаписи в формате mv3 для отложенного прослушивания или пересылки аудиофайла. В настройках приложения и смартфона нужно выбрать соответствующий язык и убедиться, что для него установлены соответствующие голосовые пакеты.
!
!При выборе в приложение Файлы пункта открыть с помощью microsoft word на android появляется выбор из двух пунктов: открыть или преобразовать из PDF в word. Выберите пункт преобразовать.
!
После открытия преобразованного файла в приложении word или microsoft 365 в нижнем правом углу появляется команда озвучки текст прочитать вслух:
!
Есть такая шняга под названием ABBYY FineReader (разные версии, у меня стоит 12-я), которая заточена аккурат для того чтобы из PDF делать (в частности) Word (в формат RTF). Не факт, что перевод будет гладким, возможно придется его сперва править, переводя с русского машинного, на русский же человеческий... Есть и более легкие версии типа Free PDF to Word Converter.
А уж из Word-а в FB2 Есть масса конверторов. Например BookReader. Это условно-бесплатная шняга, но довольно часто содержит в себе вирус (или это антивирус так считает и удаляет скачанных файл). Потому лучше конвертировать RTF в FB2 в режиме онлайн.
Я, правда, не знал, что FB2 можно слушать и обычно делал обратную конверсию.