Противодействие несанкционированному копированию текстовой информации в сети Интернет

 

Противодействие несанкционированному копированию текстовой информации в сети Интернет Соблюдение авторского права, защита интеллектуальной собственности, технология защиты изображений водяными знаками, защита информации в Интернет - эти словосочетания все чаще можно увидитеть и услышать в российском Интернете. Это и не удивительно, ведь Интернет весьма привлекательная среда как для любительского самиздата, так и для профи - писателей и публицистов, издателей и библиотек, научных коллективов, институтов дистанционного обучения и для многих других. Очевидно, что привлекательность среды Web обусловлена прежде всего доступностью и простотой размещения документов и материалов. Но имеется и обратная сторона медали, негативная. Негатив связан с нарушением авторского права и интеллектуальной собственности, несанкционированным копированием и незаконным коммерческим тиражированием, присвоением материалов. Простота доступа к среде Web оборачивается большими проблемами в защите интеллектуальной собственности и в защите прав владельцев. К наиболее сложным задачам относится задача защиты или, по крайней мере, ограничения незаконного копирования текстовой информации. Из анализа публикаций на эту тему можно сделать вывод, что в настоящее время еще нет даже четкой формулировки пути к решению этой проблемы. Вместе с тем, можно привести несколько интересных технологий, ограничивающих несанкционированное присвоение текстовой информации.

      Международной организацией DOI (Digital Object Identifier) разработана система идентификации интеллектуальной собственности, которая получила название - цифрового идентификатора объекта (Digital Object Identifier). Основу этой международной организации составляют фирмы издательской индустрии и, в частности, Ассоциация Американских Издателей ( http://www.publishers.org ). Предназначение DOI состоит в том, чтобы связывать клиентов с издателями, облегчать электронную торговлю, и осуществлять автоматизированное управление авторским правом. На сайте http://www.doi.org была представлена демонстрационная версия системы DOI. Система DOI на этом сайте используется в качестве навигатора. Подчеркнутый текст ссылок содержит цифровой идентификатор DOI вложенный в URL, которому "разрешено" проникать через proxy сервер. В реальной же ситуации клиентам должна предоставляться услуга внедрения в HTML страницы метаданных цифрового идентификатора. Затем системой DOI осуществляется регистрация HTML страниц и накопление метаданных в банках данных DOI.

      В аналогичном ключе в рамках стратегии компании Дукс по правовой защите, в сети Интернет была анонсирована услуга, представляющая собой "Web-депозитарий", который будет предназначен для защиты содержания публикаций в Интернет. Защита авторских и смежных прав будет достигаться на основе безусловной регистрации и помещения страниц и сайтов клиентов в специальный депозитарий. Последнее, по мнению авторов, расширит возможности по доказыванию в спорных ситуациях приоритета по дате, правильности и корректности содержания.

      Совсем иное направление для решения поставленной выше задачи было предложено на одной из страниц сайта http://www.indus.net/. Здесь предполагается, что доступ к большинству информационных ресурсов разрешен всем. К отдельным же материалам, частного характера, доступ ограничен с помощью кодирования этих документов. Задача кодирования и задача декодирования решается с помощью программного обеспечения на Java, выполняющего эти процедуры по так называемой технологии "на лету". Одна программа-приложение осуществляет кодирование информации в среде сервера. При этом закодированный текст заносится в HTML страницу в виде "специального комментария". Вторая программа-апплет выполняет декодирование в среде браузера. Апплет ищет этот специальный комментарий и когда находит, то декодирует шестнадцатеричные данные в двоичные и ждет ввода ключа-пароля для открытия этих данных.

      Общим для этих двух подходов является наличие, в той или иной степени, ограничений для доступа к текстовым ресурсам. При разработке же системы DOI и апробации новых технологий по защите интеллектуальной собственности, Ассоциация Американских Издателей предполагала, что главное достоинство, которым должна обладать такая технология состоит в соблюдении баланса между открытостью и защищенностью ( http://www.scripting.com/seybold/stories/960702.html ). Попытка реализации такой концепции как раз и представлена на данной web-странице.

     

Технология GraphicText

      Как уже отмечалось, у многих авторов, издательств, фирм возникает проблема, как защитить свои публикации и документы, хранящиеся в виде (гипер)текстовых файлов от пользователей, пытающихся скопировать или изменить содержимое с целью последующего коммерческого тиражирования. При этом перед авторами и фирмами встает дилемма, как с одной стороны недопустить несанкционированное копирование содержимого файла, а с другой стороны - обеспечить свободный доступ к материалам всех клиентов и потенциальных покупателей. Здесь напрашивается сравнение с обычной библиотекой. Доступ к книгам и журналам является свободным, имеется даже возможность ксерокопирования или фотографирования (за отдельную плату), однако доступ к печатному набору отсутствует!

      Как достигнуть подобного эффекта в сети Интернет или в случае записи файлов на CD? По-видимому, можно назвать три основных подхода - представление файлов в некотором "своем" формате, шифрование материалов, представление на экране монитора текстовой информации в графическом режиме. В этой статье, конечно, невозможно более или менее подробно рассмотреть все pro и contra данных подходов. Примерами "своего" формата могут служить такие известные форматы как DjVu и PDF. Однако, файлы текста в DjVu или в PDF форматах могут быть легко сохранены на диск пользователя. Относительно систем кодирования текстовой информации можно констатировать, что шифросистемы уже давно используется для противодействия несанкционированному доступу к текстовым данным в Интернете.

Преобразование текста в один из графических форматов, чаще всего применяется к большим объемам текста (техническим описаниям, книгам, журналам), и является мало привлекательным для пиратского копирования. Однако, простого преобразования в графический формат не достаточно, так как пользователь может сохранить картинку у себя на компьютере. Отображение текста в графическом формате должно выполняться в графическом режиме (видео режиме). Последнее достигается с помощью использования стандартного плагина браузеров - виртуальной Javа машины.

Разумеется, что текст представленный в графическом режиме может и должен быть дополнительно защищен графическими водяными знаками. Отображенный в графическом режиме (видео режиме) текст нельзя непосредственно скопировать в файл. Для этого необходимо сначала запомнить "экран" в буфере обмена Windows, затем раскрыть содержимое буфера обмена в окне какого-нибудь графического пакета (например, Adob PhotoShop), и только затем скопировать в файл. Понятно, что размер такого файла может составлять десятки и сотни килобайт за счет наличия водяных знаков. К слову сказать, технология внедрения в изображения скрытых водяных знаков представлена в разделе: "Скрытые Водяные Знаки для фотографий").

      Именно такое решение, связанное с отображением текста в среде браузера в графическом режиме мы здесь и предлагаем. Эта основная функция будет решаться с момощью плагина виртуальной Javа машины. В качестве дополнительной функции возможно предварительное шифрование и размещение закодированного текстового материала на сервере (в базе данных). Очевидно, что такой подход обеспечивает противодействие незаконному копированию. При этом вопрос степени защищенности сводится к вопросу целесообразности восстановления текста из защищенного цифрового изображения. Целесообразность же состоит в том, что затраты на восстановление текста из изображения должны превышать затраты, связанные со сканированием бумажного оригинала. А дело именно так и обстоит, так как кроме процедуры захвата изображения требуется процедура удаления водяных знаков с помощью графического пакета и процедура распознавания графического текста с помощью программных пакетов типа FineReader. Если размер текстовых страниц выбрать немного больше, чем размер экрана, то изображение текста придется захватывать дважды. При этом добавиться процедура редактирования для объединения двух частей страницы в одну. Если же к рассмотренной технологии добавить этап регистрации как текстовых материалов, так и пользователей, то можно гарантировать доказуемость авторского права или права владельца информации.

Программное обеспечение

      Для технической реализации рассмотренного подхода требуется программное обеспечение для кодирования и для декодирования текстовых файлов. Программа для подготовки кодированных текстов может располагаться на любом компьютере и работать в среде Windows. Полученные после кодирования файлы переносятся на HTTP сервер в формате TXT. На сервере размещается также и программа для декодирования и одновременного отображения текста в графическом режиме в окне браузера. Такой программой может быть Java-апплет, работающая в среде браузера. При запросе пользовательским браузером некоторого сетевого ресурса (предварительно закодированного), в браузер считывается HTML страница, содержащая теги апплета. Апплет, в реальном времени ("на лету"), запрашивает с сервера требуемый ресурс, осуществляет декодирование текста и его отображение на экране монитора в графическом режиме. Графический текст одновременно замешивается с видимыми водяными знаками или цветным фоновым изображением. Перелистование страниц может осуществляться с помощью кнопок "предыдущая" или "следующая". Для кодирования и декодирования файлов используются кодовые слова, которые могут быть различными для различных сетевых ресурсов (текстовых файлов). Кодовое слово, в свою очередь, также кодируется и размещается в тегах апплета. Таким образом, единовременный взлом (если такое случиться) апплета не позволит декодировать файлы, которые открываются другими ключевыми словами. Несомненно, что защищенность апплета от взлома может усиливаться.

Демонстрационная версия GraphicText

      Демоверсия, рассматриваемой технологии GraphicText представлена в разделе: "Защита текстовых файлов от несанкционированного копирования". Работа начинается с идентификации пользователя: пользователю предлагается ввести пароль. Если пользователь предварительно не зарегистрировался, то доступ к ресурсу будет невозможен. В демонстрационной версии этап регитрации не задействован. Так что можно смело набрать код: 54321.

После этого будет запрошен соответствующий ресурс и декодированный текст с помощью апплета отобразиться в окне браузера. Водяным знаком, в данном случае, является прозрачное изображение знака "copyright", растянутого на весь текст. В качестве водяного знака также может использоваться название фирмы, аббревиатура логотипа, торговой марки и т.п. или прозрачный цветной фон.

Кардинальным решением, обеспечивающим лучшую защиту, может быть замешивание текста с цветным фоновым изображением, например текстурным. При этом сам текст также будет выводиться на экран в цвете с плавно изменяющейся палитрой. Закон изменения цветовой палитры текста выбирается таким образом, чтобы гистограмма текста пересекалась с гистограммой фонового изображения. В этом случае, для восстановления текста из текстурного рисунка потребуется последовательная обработка отдельных участков "смеси" текста и текстурного фона. Однако, следует отметить, что в последнем случае время загрузки будет увеличиваться пропорционально размеру фонового изображения.

Заключение

      Представленная технология не рассчитана на стопроцентную защищенность от фанатичных пиратов и взломщиков, для которых экономические затраты ничего не значат. Вместе с тем, для подавляющей части пользователей сети Интернет, технология GraphicText будет являть собой вполне ощутимый как физический, так и правовой барьер. Как нам кажется, рассмотренная технология защиты интеллектуальной собственности будет способствовать правовому регулированию взаимоотношений, формированию правовой среды в среде Web.

Несколько примеров реализации Java-апплетов для защиты текста от копирования: