Виды и форматы электронных изданий

Развитие цифровых технологий, носителей информации и телекоммуникаций позволило хранить текстовую информацию в электронном виде, начался процесс оцифровки книг. Совершенствование технологий сканирования и оптического распознавания символов (англ. optical character recognition, OCR) позволило автоматизировать процесс преобразования изображений текста книг и документов в электронный вид (текстовые данные, использующиеся для представления символов в цифровых системах). Изначально этот процесс носил любительский характер и осуществлялся в основном энтузиастами.

Интересно
В течении достаточно короткого времени любительские к коллекции оцифрованных изданий трансформировались в сетевые библиотеки, содержащие сотни тысяч произведений. К сожалению, этот процесс не учитывал интересов правообладателей на произведения и постепенно стал трансформироваться в более цивилизованный вид, например в электронные библиотечные системы.

Дальнейшее совершенствование устройств отображения графической информации с увеличением как геометрических размеров экранов мониторов, так и их разрешения и цветового охвата привело к повышению интереса к электронным изданиям, и появлению специализированных устройств для их чтения. Электронные книги, наряду с другими источниками учебной информации, уверено вошли в нашу жизнь.

Приведем их краткую классификацию. Энциклопедические – этот тип электронных книг содержит очень большой объем информации по определенной тематике. Информационные – электронные книги похожи на энциклопедические, но хранящаяся в этих книгах информация не столь обширна и носит целенаправленный характер. Обучающие – электронные книги наиболее распространены на практике

Экзаменующие – электронные книги содержат 3 компонента:

  • 1 – банк вопросов (задач);
  • 2 – модуль тестирования и модуль ответов;
  • 3 – экспертную систему, используемую для анализа и оценки ответов обучающегося.

Существуют и другие классификации электронных книг, например, по виду используемой информации. В мультимедиакнигах используются текст, аудио, статическое изображение и видео, записанные на одном физическом носителе, например, CDROM, DVD или BD дисках) и организованные линейным образом, т. е. нужная пользователю информация воспроизводится последовательно по мере необходимости. В полимедиакнигах, в отличие от предыдущих, используется комбинация различных физических носителей, таких как CDROM, DVD, BD, Интернет, бумага и другое для предоставления нужной информации.

Гипермедиакниги, имея много общего с мультимедиакнигами, отличаются от них «нелинейной» организацией содержащейся в них информации, когда, например, с помощью команды пользователь может сделать запрос уточнения терминов и определений, комментарий по контексту и используемому методу.

Интеллектуальные книги близки по смыслу к описанным ранее экзаменующим книгам и могут динамически адаптироваться к способностям обучающегося в процессе диалога с ним. Наибольший интерес представляют перспективы для дальнейшего развития телемедиакниги. Телемедиакниги используют всевозможные способности телекоммуникаций для поддержания распределенной интерактивной системы дистанционного обучения.

Подобный интерес представляют кибернетические книги, содержащие средства математического моделирования и поэтому предоставляющие пользователю возможность всестороннего изучения и исследования описанных явлений и объектов. Несомненно, удобство в использовании всевозможных электронных книг выражающееся, прежде всего, в экономии времени на поиск необходимой информации, в компактности хранения данных, оптимизированной наглядности и возможности оперативной актуализации информации.

Электронная книга (англ. ebook) – это текст (иллюстрированный гипертекст), в цифровом формате, специально подготовленный для чтения с помощью программно-аппаратных средств ИКТ.

Приведем основные требования к современным форматам электронных книг. Читабельность – легкость и удобство чтения текста. Полиграфичность – возможность приблизиться к традиционным бумажным изданиям: отформатировать текст, выделить заголовки, вставить иллюстрации, содержание и. т. д. Масштабируемость – возможность читать электронную книгу на экранах с различными геометрическими размерами и разрешением. Кроссплатформенность – возможность использования форматов файлов электронных книг на двух и более программно-аппаратных платформах и/или операционных системах, например, Windows, macOS, Linux, Android, iOS и др.

Конвертируемость – параметр, обеспечивающий возможность перекодировки файла в другой формат для обеспечения совместимости с другим оборудованием и программным обеспечением, в том числе и еще не существующим. Гипертекст – параметр электронной книги, обеспечивающий возможность быстрой навигации как внутри книги, так и доступ к внешней сетевой информации с помощью системы гиперссылок. Возможность редактирования – параметр, характеризующий доступность основных операций редактирования в данном формате электронной книги.

Вначале при создании электронных книг использовались обычные текстовые файлы (англ. plaintext) (*.TXT) – последовательность как правило восьмибитных ASCIIкодов, каждый из которых соответствует какомулибо символу или управляющему коду). Полиграфичность – низкая. Возможность форматирования абзацев, отступов и выделение заглавными буквами. Масштабируемость – зависит от способа форматирования текста абзаца. Если текст отформатирован по абзацам с выравниванием – очень низкая, если разбиение на строки отсутствует «один абзац – одна строка» – масштабируемость высокая.

Кроссплатформенность – абсолютная. Конвертируемость – абсолютная. Гипертекст – нет. Возможность редактирования – абсолютная.

Развитие технологий электронных книг показало, что возможностей текстовых файлов для подготовки электронных книг уже недостаточно. Необходимо было разработать и внедрить новые форматы файлов позволяющие выделять размер и гарнитуру шрифта, форматирование абзацев и т. д. Одним из таких форматов используемых для создания электронных книг стал разработанный в 1987 году корпорацией Microsoft для переноса текста с разметкой из одной программы в другую – Rich Text Format (*.RTF). RTF формат совместим практически со все современными текстовые процессорами и издательскими системами. Полиграфичность – выше среднего. Масштабируемость – абсолютная.

Кроссплатформенность – очень высокая. Конвертируемость – очень высокая. Гипертекст – нет. Возможность редактирования – абсолютная.

Внутренний формат документов Microsoft Word (*.DOC) изначально разработанный для хранения текстовых документов, подготовленных в этой программе и получивший поддержку в большинстве текстовых процессоров и издательских систем, так же стал использоваться как для создания электронных книг в этом формате, так и для подготовки оригинал макетов для дальнейшей публикации или экспорта в другие форматы электронных книг. Полиграфичность – высокая. Масштабируемость – высокая. Кроссплатформенность – высокая. Конвертируемость – высокая. Гипертекст – есть. Возможность редактирования – абсолютная.

Язык HTML (англ. HyperText Markup Language) (файлы: *.HTM; *.MHT; *.CHM и др.) разработан для отображения информации в сети Интернет и стал использоваться также и для создания электронных книг. Полиграфичность – высокая. Масштабируемость – очень высокая. Кроссплатформенность – абсолютная. Конвертируемость – абсолютная. Гипертекст – есть. Возможность редактирования – абсолютная. Недостатком данного формата для электронных книг является необходимость использования для чтения Web-браузера, при использовании большинства программ-ридеров HTML чаще всего конвертируется в обычный текст и теряет все свои преимущества.

Рассмотренные выше форматы изначально не предназначались для создания электронных книг, а лишь использовались для этой цели. Следовательно, созданные на их основе текстовые документы не являются в полной мере электронными книгами. С другой стороны, для их чтения не требуется специального программного обеспечения и достаточно стандартных средств, встроенных в операционную систему. Форматы, описанные далее требуют установки специальных программных средств для их просмотра и редактирования.

Интересно
Одним их таких форматов фалов стал максимально приближенный к бумажному изданию формат электронных документов (*.PDF) (англ. Portable Document Format), разработанный фирмой Adobe в 2008 году. PDF формат в первую очередь разрабатывался для платформенно независимого переноса оригинал макетов и вывода их на печать в процессах полиграфического производства.

Достоинством данного формата безусловно является возможность создать файл, на 100 % соответствующий традиционной бумажной версии, что вводит и главные его ограничения – это большой объем файла и ограниченность применения на мобильных устройствах которые для комфортного чтения PDF-фалов должны обладать достаточно большим экраном высокого разрешения. В настоящее время PDF интенсивно используется как формат для создания электронных книг и поддерживается практически всеми электронными библиотечными системами.

Полиграфичность – абсолютная. Масштабируемость – низкая. Кроссплатформенность – очень высокая. Гипертекст – есть. Возможность редактирования – высокая, как средствами специализированных PDFредакторов (Adobe Acrobat, Foxit PhantomPDF и др.) так и средствами современных текстовых процессоров (Microsoft Word2019, и др.). Формат DeJaVU (*.DJVU) – разработан компанией АТ&T для компактного представления текстовых документов в сети Internet.

Файл DJVU это растровый многостраничный графический файл, как правило не большого объема. При его создании специальные алгоритмы отделяют текст от фона и иллюстраций, после чего они сжимаются с различным разрешением, могут содержат отдельный текстовый слой. Полиграфичность – высокая. Масштабируемость – средняя. Кроссплатформенность – средняя. Конвертируемость – ниже среднего. Гипертекст – есть. Возможность редактирования – средняя. Одними из наиболее перспективных на сегодняшний момент времени являются специализированные открытые форматы на основе XML.

XML – расширяемый язык разметки (англ. eXtensible Markup Language), был разработан для хранения структурированных данных в текстовом формате. Технология XML позволяет обрабатывать практически любые данные, вне зависимости от их структуры и сложности.

На базе языка XML создано большое количество специализированного программного обеспечения для решения конкретных задач. Например, есть реализация HTML средствами XML – XHTML, язык для записи математических формул и выражений (MathML), язык для химических формул, для ведения медицинской электронной документации и др. Актуальный формат файлов внедренный начиная с версии Microsoft Word2007 (*.DOCX) представляет собой архив XML-документов. Полиграфичность – высокая. Масштабируемость – абсолютная. Кроссплатформенность – абсолютная.

Конвертируемость – абсолютная. Гипертекст – есть. Возможность редактирования – абсолютная. Приведенный обзор демонстрирует что язык XML имеет наилучшее сочетание качеств, необходимых для создания электронных книг. Формат Electronic Publication (*.EPUB) – открытый формат электронных книг, разработанный Международным форумом по цифровым публикациям (англ. International Digital Publishing Forum) в 2007 году на основе языка XML.

Формат позволяет издателям производить и распространять цифровую публикацию в одном файле, обеспечивая совместимость между программным и аппаратным обеспечением, необходимым для воспроизведения цифровых книг и других публикаций с плавающей вёрсткой. К недостаткам формата следует отнести практическую невозможность конвертировать в другой формат заданное фиксированной версткой расположение объектов и мультимедийных компонентов.

Интересно
Наиболее популярным открытым форматом электронных книг в России, созданным группой разработчиков во главе с Д. Грибовым и М. Мацневым на основе языка XML является Fiction Book (*.fb2). Формат позволяет структурировать книгу и обеспечивает высокую совместимость с практически любыми устройствами благодаря широким возможностям масштабирования.

Также существует достаточно большое количество закрытых специализированных форматов электронных книг, созданных для одного конкретного устройства или программы. Например, Rocketebook (*.rb), Microsoft Reader (*.lit), PalmDoc,MobiPocket (*.prc), Jinke Book Wolf (*.wol) и др.Как правило они обладают следующими характеристиками. Полиграфичность – средняя или выше среднего (зависит от конкретного формата). Масштабируемость – средняя или выше среднего.

Кроссплатформенность – низкая. Конвертируемость –низкая. Гипертекст – чаще есть. Возможность редактирования – низкая.

Современное специализированное программное обеспечение поддерживает большинство форматов электронных книг, содержит функции выделение заголовков, закладок, сглаживания экранных шрифтов и форматирование текста для обеспечения его удобочитаемости (в зависимости от формата). Параллельно с развитием форматов электронных книг совершенствовались и средства их просмотра. Появилось достаточно много различных специализированных электронных устройств для чтения книг: карманные персональные компьютеры, коммуникаторы, электронные книги (технология электронных чернил – eink), смартфоны, планшетные компьютеры и др.

Узнай цену консультации

"Да забей ты на эти дипломы и экзамены!” (дворник Кузьмич)