Форум
» Назад на решение задач по физике и термеху
Регистрация | Профиль | Войти | Забытый пароль | Присутствующие | Справка | Поиск

» Добро пожаловать, Гость: Войти | Регистрация
    Форум
    Информационные технологии
        Преобразование PDF в DjVu
Отметить все сообщения как прочитанные   [ Помощь ]
» Добро пожаловать на форум "Информационные технологии" «

Переход к теме
<< Назад Вперед >>
Несколько страниц [ 1 2 3 4 5 6 ]
Модераторы: paradise, KMA
  

VF



Administrator

При конвертировании я использую последовательностью Acrobat -> TIFF -> DjVu. Советую при сохранении в TIFF отключить компрессию (чтобы меньше загружать процессор), поставить монохромный режим (если конечно книга не цветная) и разрешение на 300 dpi. Некоторые книги в PDF защищены от изменения, поэтому просто так сохранить их в TIFF не удасться. Для этого нужно использовать программу Advanced PDF Password Recovery небезызвестной Elcomsoft . Незарегистрированная версия сохраняет лишь 10% страниц, так что поищите для нее ключ. Скрыть 36 байт информации (именно такова его длинна) в Интернет сложно . Но если вы его не найдете - напишите мне, я поделюсь.

Затем в DjVu Solo (2,1 Мб) открываете сначало первый TIFF, потом счелкаете на нем и выбераете "Insert Page(s) After...", добавляя все оставшиеся страницы, кроме первой. Если страниц более 500, то эту процедуру нужно выполнить несколько раз. Учтите, что страницы добавляются достаточно медленно и может возникнуть впечатление, что программа зависла, но это не так. Когда все страницы добавятся, выбераете сохранения. Чтобы получить книгу из одного файла - режим Bundled. Задаете имя файла, выбирате разрешение (я всегда оставлял 300) и решим - Scanned (если есть цветные рисунки или полутона) или Bitonal (если используется только 2 цвета, как в большинстве сканов книг).

Существует и другой способ, хорошо подходящий для файлов, уже размещенных в Интернет. Для конвертирования можно использовать сервер Any2DjVu, но он не может обработать некоторые PDF, которые хорошо читаются Акробатом, а иногда просто не конвертирует без всяких сообщений.

Lizardtech выпускает конвекторы для командной строки, с помощью которых можно сконвертировать PDF в DjVu без промежуточных действий, но стоят они около 5000 $. Но если увидете их в "свободном доступе", пожалуйста, сообщите мне

Всего сообщений: 3109 | Присоединился: май 2002 | Отправлено: 12 мая 2003 18:11 | IP
VF



Administrator

Если книга состоит из нескольких PDF-файлов (предельный случай: одна страница - один файл), их предварительно нужно собрать вместе. Если имена файлов цифровые и в начало некоторых их них нужно добавить нули (7.pdf -> 007.pdf), то воспользуйтесь утилитой fzero. Объединять PDF-файлы можно полной версией Adobe Acrobat (открыть первый из них, а затем "перетащить" на него остальные файлы), но гораздо быстрее это делает pdcat.

При необходимости в Acrobat можно удалить лишние страницы (Document -> Delete Pages...) и/или повернуть страницы (Document -> Rotate Pages...).

Преобразование с помощью any2djvu может занять много времени (рекорд для некоторых моих файлов составил 4 часа, но в основном они конвертируются значительно быстрее), поэтому можно поступить так: дождаться загрузки файла на сервер, записать номер, который был ему автоматически присвоен, и не дожидаясь результатов конвертирования начать закачивать другой файл. Когда все файлы закачены, можно идти в каталог http://any2djvu.djvuzone.org/djvu/NNNNNN (где NNNNNN - первые 6 цифр в номере, присвоенном файлу) и забирать полученные документы djvu. Учтите, что преобразование занимает некоторое время и файлы в этом каталоге появятся не сразу. Если каких-то файлов нет, то стоит проверить их наличие через несколько часов.

Есть другой вариант - воспользоваться скриптом (автор - castleofmusic), автоматизирующим процесс закачивания, преобразования и скачивание полученных файлов. Если во время конвертирования  у Вас, как и у меня, из-за таймаута часто останавливается обновление страницы, то скрипт будет работать не эффективно, т.к. не сможет получить итоговый результат. Поэтому, более предпочтительным будет предыдущий способ.

Всего сообщений: 3109 | Присоединился: май 2002 | Отправлено: 5 окт. 2003 15:34 | IP
castleofmusic


Удален

по поводу моего скрипта. Там стоит таймаут 10 часов. Я уже напоролся на это. Сервер any2djvu бывает загружен файлами и иногда конвертирует книги медленно. Дополнительная информация о процессе перевода в дежавю в моём файле (castleofmusic.nm.ru/short_log.txt)

Всего сообщений: N/A | Присоединился: N/A | Отправлено: 10 окт. 2003 10:18 | IP
labslo


Удален

Меня интересует обратный процесс из DJVU->PDF или DJVY->PS ?

Всего сообщений: N/A | Присоединился: N/A | Отправлено: 13 окт. 2003 18:05 | IP
VF



Administrator

labslo
А смысл? Благодаря http://djvu.sourceforge.net/ формат DjVu хорошо поддерживается на разных платформах. Перевод только увеличит объем файлов.

В принципе, можно перевести с помощью печати Distiller'ом, но у меня не получилось - полезли сообщения об ошибках.

Всего сообщений: 3109 | Присоединился: май 2002 | Отправлено: 14 окт. 2003 17:44 | IP
VF



Administrator

О добавлении русского текста в DjVu файл (взято из рассылки):


Способ получения под *nix (под win32, возможно использование под
cygwin, теоретически можно скомпилировать и напрямую под win32, но с
ходу не получилось)

Шаг1
с http://djvu.sourceforge.net/ берем DjVuLibre

Шаг2
инсталлируем

Шаг3
Создаем djvu файл любым способом который Вам нравится (я использую
cjb2, есть вариант под win32 http://www.planetdjvu.com/djvulibre/cjb2.zip)
конвертация из формата pbm

Шаг4
Создаем текст который будем подкладывать под djvu
Пример:
0283tif_0_3.txt
---------------
(page 0 0 1445 847
(line 88 799  288 751 "062897" )

(line 1199 802  1401 747 "539.13")

(line 394 704 822 644 "Золотухин Н." )
(line 293 596 1444 537 "Статистическая физика. Ч. 1.  Л., 1938")
)
--------------
здесь первый ключ (page - геометрия страницы, line - геометрия
текстовой строки) определяют структурные объекты
страницы, четыре цифры это координаты блока текста в формате

x1 y1 x2 y2

x1 y1 - верхний левый угол
x2 y2 - нижний правый угол
(в документации ошибочно указан формат x1 x2 y1 y2)
Координаты x указываются от левой границы изображения. Координаты y
указываются от нижней границы изображения.

Текст заключают в двойные кавычки. Текстовый файл сохраняют в формате
utf8.

В идеале можно создавать напрямую из FineReader, при этом есть две
проблемы: смена формата пакета от версии к версии и отсутствие лицензии
на разработку сторонних программ (доступны только при покупке
серверной инсталляции)

Шаг5
Запускаем команду
djvused -v 0283tif_0_3.djvu -s

Далее в командой строке djvused выдаем последовательно команды:
select 1
set-txt 0283tif_0_3.txt
save
^C

Комментарий:
Выбор 1 страницы
сохранение созданного текста под djvu
сохранение djvu

Шаг5
Используем созданный djvu


Всего сообщений: 3109 | Присоединился: май 2002 | Отправлено: 18 окт. 2003 14:58 | IP
VF



Administrator

Провел сравнение бесплатных DjVu-кодеров. Замечания, предложения и дополнения принимаются в этой теме форума

Всего сообщений: 3109 | Присоединился: май 2002 | Отправлено: 9 нояб. 2003 12:39 | IP
neofit


Удален

Интересно, почему-то думал, что СОЛО в два раза хуже, чем  сайт, а оно не уступает. Зачем нужен сайт тогда???

Про перевод обратно не согласен --  нужен для подстраховки обязательно, чтобы не оказаться  с кучей файлов в никем не поддерживаемом формате. Еще в идеале было бы здорово, если бы перевод машинно сгенерированных текстов в ДЖВЮ и обратно был  1-1, чтобы не боятся унифицировать формать библиотеки, иначе приходится держать и ДЖВЮ и PDF и  PS.GZ.

Всего сообщений: N/A | Присоединился: N/A | Отправлено: 7 дек. 2003 17:46 | IP
VF



Administrator

neofit

Интересно, почему-то думал, что СОЛО в два раза хуже, чем  сайт, а оно не уступает. Зачем нужен сайт тогда???

Any2djvu удобен при преобразовании PDF - не нужно делать промежуточные действия, описанные в моем первом сообщении. Кроме этого, некоторое время назад сервер использовался как хостинг для электронных книг

Если нужно сконвертировать в djvu множество графических файлов, то проще использовать DjVu Solo.


Про перевод обратно не согласен --  нужен для подстраховки обязательно, чтобы не оказаться  с кучей файлов в никем не поддерживаемом формате.

Исходники просмоторщика есть... Сложно представить ситуацию, что документы нельзя будет читать и конвертировать в графику.


Еще в идеале было бы здорово, если бы перевод машинно сгенерированных текстов в ДЖВЮ и обратно был  1-1, чтобы не боятся унифицировать формать библиотеки, иначе приходится держать и ДЖВЮ и PDF и  PS.GZ.

Для разных алгоритмов сжатия с потерями такое не возможно. Если есть текстовой оригинал, то оставляйте его и PDF, если скан - за DjVu можно не волноваться

Всего сообщений: 3109 | Присоединился: май 2002 | Отправлено: 7 дек. 2003 18:35 | IP
castleofmusic


Удален

ещё any2djvu делает OCR для латинских букв. (для русских не делает). Есть коммерческий редактор от lizardtech, который тоже это делает. В принципе any2djvu был бы не очень нужен, если бы существовали в свободном доступе нормальные средства создания дежавю файлов. Кодировщик из библиотеки djvulibre даёт плохое сжатие, это просто игрушка, хотя остальные утилиты оттуда вроде нормальные.

Всего сообщений: N/A | Присоединился: N/A | Отправлено: 7 дек. 2003 18:44 | IP

Отправка ответа:
Имя пользователя   Вы зарегистрировались?
Пароль   Забыли пароль?
Сообщение

Использование HTML запрещено

Использование IkonCode разрешено

Смайлики разрешены

Опции отправки

Добавить подпись?
Получать ответы по e-mail?
Разрешить смайлики в этом сообщении?
Просмотреть сообщение перед отправкой? Да   Нет
 

Переход к теме
<< Назад Вперед >>
Несколько страниц [ 1 2 3 4 5 6 ]

Форум работает на скрипте © Ikonboard.com