Жанры
 
загрузка...

Советуем почитать 

загрузка...

Статьи сайта

О формате книг ePUB

Электронные книги – не устройства, а именно текст – все чаще заменяют традиционные бумажные книги, что, в общем, легко объяснимо, если сравнить цену на них, удобство поиска информации, копирования и т.д. Несмотря на огромную популярность электронных библиотек, вопрос о наиболее оптимальном формате хранения книги до сих пор не снят, и за майку лидера соперничают сразу несколько форматов. Один из них – ePUB.

Файлы электронных книг в формате ePUB имеют аналогичное расширение. В системе, где не установлена подходящая читалка, такой файл не открывается по умолчанию, хотя, если знать кое-какие секреты, то прочитать книгу можно и в этом случае. Формат был разработан международным форумом IDPF в 2007 году, причем это открытый стандарт. В теории, он был спроектирован довольно эффективно: все, что находится внутри файла, сжато архиватором Zip. Таким образом, переименовав ePUB в Zip, можно распаковать содержимое, представляющее собой несколько папок. Некоторые из них не представляют интереса для читателя, так как содержат технические данные, манифесты, описание структуры книги. Самые интересные папки – шрифты, книга, графика. Наличие шрифтов – хорошая попытка донести стиль текста до читающего именно в таком виде, как это было задумано автором. Плюс, конечно, в том, что эти шрифты можно добавить в свою собственную библиотеку. Формат обложки – обычный графический файл, а остальные текстовые разделы книги представлены в формате xhtml (фактически же – XML 1.0), с кодированием UTF-8. Одна из особенностей формата состоит в том, что разделы книги хранятся в отдельных файлах, хотя это и не обязательное условие. Каждый из разделов можно почти безболезненно открыть в браузере, потеряв лишь незначительную часть форматирования текста.

Если использовать полноценные утилиты просмотра, удобство формата видны сразу: в книгу можно включать векторную и растровую графику (включая SVG), таблицы, сноски и т.д., использовать авторские шрифты и прочий дизайн, определенный стилевым файлом CSS. Структура файла содержит стандартные теги, характерные для хранения литературных данных: информация об издателе, оригинальное название, синопсис, кликабельное содержание и прочие вещи. По богатству выбора тегов формат ePUB пока не может соперничать с FB2, но, что интересно, это довольно родственные форматы. К примеру, и FB2, и ePUB можно получать из одной и той же программы подготовки электронных книг FictionBook Editor. Для чтения книг удобно применять CoolReader, а список остальных программ можно найти в Википедии. К сожалению, у формата имеются серьезные проблемы. В частности, он содержит много дублирующего текста, размер файла примерно в 2 раза больше чем у FB2, но, что хуже, стандарт соблюдается не вполне корректно, так что книга для iPad и та же книга для Android могут содержать различные теги и внешний вид. Есть несогласование даже в хранении имени автора книги, что затрудняет автоматический сбор книжных коллекций.