Форум
» Назад на решение задач по физике и термеху
Регистрация | Профиль | Войти | Забытый пароль | Присутствующие | Справка | Поиск

» Добро пожаловать, Гость: Войти | Регистрация
    Форум
    Информационные технологии
        Преобразование PDF в DjVu
Отметить все сообщения как прочитанные   [ Помощь ]
» Добро пожаловать на форум "Информационные технологии" «

Переход к теме
<< Назад Вперед >>
Несколько страниц [ 1 2 3 4 5 6 ]
Модераторы: paradise, KMA
  

VF



Administrator

При конвертировании я использую последовательностью Acrobat -> TIFF -> DjVu. Советую при сохранении в TIFF отключить компрессию (чтобы меньше загружать процессор), поставить монохромный режим (если конечно книга не цветная) и разрешение на 300 dpi. Некоторые книги в PDF защищены от изменения, поэтому просто так сохранить их в TIFF не удасться. Для этого нужно использовать программу внешняя ссылка удалена небезызвестной Elcomsoft . Незарегистрированная версия сохраняет лишь 10% страниц, так что поищите для нее ключ. Скрыть 36 байт информации (именно такова его длинна) в Интернет сложно . Но если вы его не найдете - напишите мне, я поделюсь.

Затем в DjVu Solo (внешняя ссылка удалена) открываете сначало первый TIFF, потом счелкаете на нем и выбераете "Insert Page(s) After...", добавляя все оставшиеся страницы, кроме первой. Если страниц более 500, то эту процедуру нужно выполнить несколько раз. Учтите, что страницы добавляются достаточно медленно и может возникнуть впечатление, что программа зависла, но это не так. Когда все страницы добавятся, выбераете сохранения. Чтобы получить книгу из одного файла - режим Bundled. Задаете имя файла, выбирате разрешение (я всегда оставлял 300) и решим - Scanned (если есть цветные рисунки или полутона) или Bitonal (если используется только 2 цвета, как в большинстве сканов книг).

Существует и другой способ, хорошо подходящий для файлов, уже размещенных в Интернет. Для конвертирования можно использовать сервер внешняя ссылка удалена, но он не может обработать некоторые PDF, которые хорошо читаются Акробатом, а иногда просто не конвертирует без всяких сообщений.

Lizardtech выпускает конвекторы для командной строки, с помощью которых можно сконвертировать PDF в DjVu без промежуточных действий, но стоят они около 5000 $. Но если увидете их в "свободном доступе", пожалуйста, сообщите мне

Всего сообщений: 3110 | Присоединился: май 2002 | Отправлено: 12 мая 2003 18:11 | IP
VF



Administrator

Если книга состоит из нескольких PDF-файлов (предельный случай: одна страница - один файл), их предварительно нужно собрать вместе. Если имена файлов цифровые и в начало некоторых их них нужно добавить нули (7.pdf -> 007.pdf), то воспользуйтесь утилитой fzero. Объединять PDF-файлы можно полной версией Adobe Acrobat (открыть первый из них, а затем "перетащить" на него остальные файлы), но гораздо быстрее это делает внешняя ссылка удалена.

При необходимости в Acrobat можно удалить лишние страницы (Document -> Delete Pages...) и/или повернуть страницы (Document -> Rotate Pages...).

Преобразование с помощью внешняя ссылка удалена может занять много времени (рекорд для некоторых моих файлов составил 4 часа, но в основном они конвертируются значительно быстрее), поэтому можно поступить так: дождаться загрузки файла на сервер, записать номер, который был ему автоматически присвоен, и не дожидаясь результатов конвертирования начать закачивать другой файл. Когда все файлы закачены, можно идти в каталог внешняя ссылка удалена (где NNNNNN - первые 6 цифр в номере, присвоенном файлу) и забирать полученные документы djvu. Учтите, что преобразование занимает некоторое время и файлы в этом каталоге появятся не сразу. Если каких-то файлов нет, то стоит проверить их наличие через несколько часов.

Есть другой вариант - воспользоваться внешняя ссылка удалена (автор - castleofmusic), автоматизирующим процесс закачивания, преобразования и скачивание полученных файлов. Если во время конвертирования  у Вас, как и у меня, из-за таймаута часто останавливается обновление страницы, то скрипт будет работать не эффективно, т.к. не сможет получить итоговый результат. Поэтому, более предпочтительным будет предыдущий способ.

Всего сообщений: 3110 | Присоединился: май 2002 | Отправлено: 5 окт. 2003 15:34 | IP
castleofmusic


Удален

по поводу моего скрипта. Там стоит таймаут 10 часов. Я уже напоролся на это. Сервер any2djvu бывает загружен файлами и иногда конвертирует книги медленно. Дополнительная информация о процессе перевода в дежавю в моём файле (castleofmusic.nm.ru/short_log.txt)

Всего сообщений: N/A | Присоединился: N/A | Отправлено: 10 окт. 2003 10:18 | IP
labslo


Удален

Меня интересует обратный процесс из DJVU->PDF или DJVY->PS ?

Всего сообщений: N/A | Присоединился: N/A | Отправлено: 13 окт. 2003 18:05 | IP
VF



Administrator

labslo
А смысл? Благодаря внешняя ссылка удалена формат DjVu хорошо поддерживается на разных платформах. Перевод только увеличит объем файлов.

В принципе, можно перевести с помощью печати Distiller'ом, но у меня не получилось - полезли сообщения об ошибках.

Всего сообщений: 3110 | Присоединился: май 2002 | Отправлено: 14 окт. 2003 17:44 | IP
VF



Administrator

О добавлении русского текста в DjVu файл (взято из внешняя ссылка удалена):


Способ получения под *nix (под win32, возможно использование под
cygwin, теоретически можно скомпилировать и напрямую под win32, но с
ходу не получилось)

Шаг1
с внешняя ссылка удалена берем DjVuLibre

Шаг2
инсталлируем

Шаг3
Создаем djvu файл любым способом который Вам нравится (я использую
cjb2, есть вариант под win32 внешняя ссылка удалена
конвертация из формата pbm

Шаг4
Создаем текст который будем подкладывать под djvu
Пример:
0283tif_0_3.txt
---------------
(page 0 0 1445 847
(line 88 799  288 751 "062897" )

(line 1199 802  1401 747 "539.13")

(line 394 704 822 644 "Золотухин Н." )
(line 293 596 1444 537 "Статистическая физика. Ч. 1.  Л., 1938")
)
--------------
здесь первый ключ (page - геометрия страницы, line - геометрия
текстовой строки) определяют структурные объекты
страницы, четыре цифры это координаты блока текста в формате

x1 y1 x2 y2

x1 y1 - верхний левый угол
x2 y2 - нижний правый угол
(в документации ошибочно указан формат x1 x2 y1 y2)
Координаты x указываются от левой границы изображения. Координаты y
указываются от нижней границы изображения.

Текст заключают в двойные кавычки. Текстовый файл сохраняют в формате
utf8.

В идеале можно создавать напрямую из FineReader, при этом есть две
проблемы: смена формата пакета от версии к версии и отсутствие лицензии
на разработку сторонних программ (доступны только при покупке
серверной инсталляции)

Шаг5
Запускаем команду
djvused -v 0283tif_0_3.djvu -s

Далее в командой строке djvused выдаем последовательно команды:
select 1
set-txt 0283tif_0_3.txt
save
^C

Комментарий:
Выбор 1 страницы
сохранение созданного текста под djvu
сохранение djvu

Шаг5
Используем созданный djvu


Всего сообщений: 3110 | Присоединился: май 2002 | Отправлено: 18 окт. 2003 14:58 | IP
VF



Administrator

Провел сравнение бесплатных DjVu-кодеров. Замечания, предложения и дополнения принимаются в этой теме форума

Всего сообщений: 3110 | Присоединился: май 2002 | Отправлено: 9 нояб. 2003 12:39 | IP
neofit


Удален

Интересно, почему-то думал, что СОЛО в два раза хуже, чем  сайт, а оно не уступает. Зачем нужен сайт тогда???

Про перевод обратно не согласен --  нужен для подстраховки обязательно, чтобы не оказаться  с кучей файлов в никем не поддерживаемом формате. Еще в идеале было бы здорово, если бы перевод машинно сгенерированных текстов в ДЖВЮ и обратно был  1-1, чтобы не боятся унифицировать формать библиотеки, иначе приходится держать и ДЖВЮ и PDF и  PS.GZ.

Всего сообщений: N/A | Присоединился: N/A | Отправлено: 7 дек. 2003 17:46 | IP
VF



Administrator

neofit

Интересно, почему-то думал, что СОЛО в два раза хуже, чем  сайт, а оно не уступает. Зачем нужен сайт тогда???

Any2djvu удобен при преобразовании PDF - не нужно делать промежуточные действия, описанные в моем первом сообщении. Кроме этого, некоторое время назад сервер использовался как хостинг для электронных книг

Если нужно сконвертировать в djvu множество графических файлов, то проще использовать DjVu Solo.


Про перевод обратно не согласен --  нужен для подстраховки обязательно, чтобы не оказаться  с кучей файлов в никем не поддерживаемом формате.

Исходники просмоторщика есть... Сложно представить ситуацию, что документы нельзя будет читать и конвертировать в графику.


Еще в идеале было бы здорово, если бы перевод машинно сгенерированных текстов в ДЖВЮ и обратно был  1-1, чтобы не боятся унифицировать формать библиотеки, иначе приходится держать и ДЖВЮ и PDF и  PS.GZ.

Для разных алгоритмов сжатия с потерями такое не возможно. Если есть текстовой оригинал, то оставляйте его и PDF, если скан - за DjVu можно не волноваться

Всего сообщений: 3110 | Присоединился: май 2002 | Отправлено: 7 дек. 2003 18:35 | IP
castleofmusic


Удален

ещё any2djvu делает OCR для латинских букв. (для русских не делает). Есть коммерческий редактор от lizardtech, который тоже это делает. В принципе any2djvu был бы не очень нужен, если бы существовали в свободном доступе нормальные средства создания дежавю файлов. Кодировщик из библиотеки djvulibre даёт плохое сжатие, это просто игрушка, хотя остальные утилиты оттуда вроде нормальные.

Всего сообщений: N/A | Присоединился: N/A | Отправлено: 7 дек. 2003 18:44 | IP

Отправка ответа:
Имя пользователя   Вы зарегистрировались?
Пароль   Забыли пароль?
Сообщение

Использование HTML запрещено

Использование IkonCode разрешено

Смайлики разрешены

Опции отправки

Добавить подпись?
Получать ответы по e-mail?
Разрешить смайлики в этом сообщении?
Просмотреть сообщение перед отправкой? Да   Нет
 

Переход к теме
<< Назад Вперед >>
Несколько страниц [ 1 2 3 4 5 6 ]

Форум работает на скрипте © Ikonboard.com