PDF против DjVu (КВ-Лайт)

Два наиболее популярных формата файлов, предназначенные для создания электронных книг, уже давно ведут между собой борьбу не на жизнь, а насмерть. Думаю, пользователям, читающим хоть изредка пособия в электронном виде, будет полезно знать хотя бы необходимый минимум об этих форматах.

Формат PDF, Portable Document Format, разработан корпорацией Adobe и предназначен для электронных книг, документации к компьютерным программам и прочих подобных вещей. Для чтения файлов этого формата используется, в основном, бесплатная программа Adobe Reader, а для создания - самый разный софт, от коммерческого Adobe Acrobat Professional до бесплатного PDFCreator'а.

Формат DjVu, созданный в недрах AT&T, тоже предназначен для электронных книг и документации. Самые популярные программы для чтения и создания файлов в этом формате - LizardTech DjVu Solo, WinDjVu, DjVu Reader. Все они бесплатны.

Итак, есть два формата, предназначенных, в общем-то, для одних и тех же целей. Однако коль скоро они оба существуют, конкурируют и развиваются, значит, у каждого есть свои плюсы и минусы. В противном случае, по законам естественного отбора, остался бы только один, единственный и несокрушимый.

В плюсах PDF'а - широкая распространённость и разрекламированность. Корпорация Adobe уделяет немалое внимание продуктам для работы с PDF-документами, постоянно продвигает этот формат в интернете. Поэтому множество пользователей просто ничего не знают о конкурирующих форматах, в том числе о том же DjVu. Ещё одно преимущество этого формата состоит в том, что в одном файле комбинируются текст, графика, формы для ввода данных. При этом формат поддерживает защиту данных с помощью пароля, шифрование и многие другие продвинутые возможности. Поэтому этим форматом пользуются многие разработчики программного обеспечения.

 

DjVu, конечно, не может похвастаться таким количеством "козырей в рукаве". Файлы в этом формате не могут содержать раздельно текст и картинки. Фактически, DjVu-файл - это одно большое многостраничное изображение. Соответственно, метод copy-paste бессилен применительно к этим файлам (если, конечно, не пустить в ход тяжёлую артиллерию в виде FineReader'а). Зато DjVu-документы занимают в 5-10 раз меньше места, чем они же, но в PDF. И, пожалуй, это самое главное преимущество DjVu перед конкурентом.

К сожалению, большинство электронных книг в Рунете и Байнете находятся в файлах формата PDF, что и является причиной их монструозных размеров (в основном, от 50 до 200 Мб на каждую книгу). Так происходит потому, что люди, сканирующие эти книги, элементарно ленятся распознавать текст, и весь PDF-файл содержит его в виде изображения. Как вы понимаете, размер текста в виде картинки больше. А формат PDF не оптимизирован для хранения книг в таком виде. Вот если бы они хранились в DjVu, то и скачивались бы быстрее, и на жёстком диске места занимали меньше. Так что если вы будете создавать свою электронную книгу, стоит учесть особенности каждого из форматов, чтобы выбрать оптимальный.

Вадим СТАНКЕВИЧ

Версия для печатиВерсия для печати

Номер: 

41 за 2006 год

Рубрика: 

Software
Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!
 

Комментарии

Страницы

Аватар пользователя Ослик Иа
"DjVu, конечно, не может похвастаться таким количеством "козырей в рукаве". Файлы в этом формате не могут содержать раздельно текст и картинки. Фактически, DjVu-файл - это одно большое многостраничное изображение. Соответственно, метод copy-paste бессилен применительно к этим файлам (если, конечно, не пустить в ход тяжёлую артиллерию в виде FineReader'а)."

Не может быть! Хотя в такую скверную погоду и мерзкий денек, дождь и холод, нет, я уже вслед за автором начинаю ожидать всяких гадостей от этого хорошего моего знакомого DjVu. Щас я проверю, вот, беру первую попавшуюся книжку из имеющихся на винте в DjVu, аха, это Купершмидт попался, сейчас, сейчас, открываю в любимой проге WinDjView 0.4.3 и с помощью Select Tool выделяю и копирую часть строки со стр. 3, а теперь вставляю из буфера вот прямо сюда:

"Алгебра — это кольцо R, элементы которого можно умножать на элементы"

Йееееее, мы сделали ЭТО!!! Точно денек скверный, пишут тут всяких гадостей про хороший, очень гибкий формат, не читая его спецификации. Я вам за это из другой книжки:

"except that they are to yield the given values of the"

И для чистоты следственного эксперимента из третьей:

"From an algebraic point of view, the basic algebraic relations

for the monodromy matrices which are relevant in the context of non-ultralocal models,

are the algebras of currents introduced in various papers in different contexts [25]-[27]."

Ну разве можно ждать правды от людей в такой пасмурный мокрый день? Все врут, все! Пойду водички из лужи хлебну...

Аватар пользователя Вадим Станкевич
Вы правы, спецификацию я действительно не читал. Но ни из одной книги в формате DjVu, которые я когда-либо находил в Интернете, я с помощью одного только DjVu Solo ничего скопировать не смог... Собственно, так у меня и появился FineReader.
Аватар пользователя Инкогнито
Так можно было бы хоть логически прикинуть, за счет чего обеспечивается высокая степень сжатия. А обеспечивается как раз за счет того, что текст жмется отдельно, а картинки - отдельно. А то из статьи следует, что DjVu уделывает jpeg2000 :)

Пытаться проецировать особенности работы отдельной программы на формат неразумно.

Аватар пользователя Вадим Станкевич
Приношу свои извинения.

Эх, что-то не удаются мне статьи про PDF...

Аватар пользователя Al
Скачал WinDjView 0.4.3, выбрал Select Tool - не работает! Ни на одном файле. И в чем причина? Кто из вас не прав?
Аватар пользователя Al
Уточняю - есть файлы, которые дают выделять текст, а есть - не дают! Ну все как в жизни... :) Проверил.
Аватар пользователя Инкогнито
Я вот только хочу понять: есть перспективы у DjVu или все поглотит PDF?
Аватар пользователя SF
Ну, развития DjVu покуда не видно... Думаю, будущее за PDF.
Аватар пользователя Savely
Хм, а развитие PDF - видно?

Пока что мне видно, что DjVu вьювер три года назад мне на компе был не нужен, сейчас - нужен.

А, ну развитие PDF проявилось в том, что три года назад у меня был 4-ый, а сейчас 5-ый. Не знаю, что они там развивали, но 4-ый обломался на паре файлов с Интела (по содержанию - обычных даташитов)...

Аватар пользователя SF
>> три года назад у меня был 4-ый, а сейчас 5-ый

Если Вы про Акробат, то сейчас уже нужен седьмой или даже восьмой

Страницы