С вашими файлами ассоциируются и такие данные, о существовании которых осведомлен не каждый пользователь. Эти данные не отображаются при просмотре файла, но они играют важную роль при внесении исправлений, для генерации миниатюр (thumbnails), а также для прочих аналогичных задач, призванных упростить жизнь пользователя.
Эта информация известна под собирательным названием метаданных (metadata). Обобщенно говоря, метаданные — это информация о ваших данных. Сама концепция выглядит немного диковато, но, тем не менее, эта «информация об информации» действительно существенно упрощает жизнь пользователей компьютеров. Сама идея, лежащая в основе метаданных, очень проста — они представляют собой сведения о вашей информации, которые не отображаются при просмотре файла. Простейшим примером метаданных являются расширения имен файлов, определяющие тип каждого конкретного файла (например, графические файлы GIF, документы PDF, звуковые файлы формата MP3 и т. д.).
Однако существуют и более сложные образцы метаданных. Например, метаданные, ассоциированные с вашими цифровыми фотографиями и хранящиеся в самих файлах, содержат сведения о камере, которой был выполнен снимок, фокальном расстоянии и экспозиции. Метаданные, ассоциированные с документами, содержат сведения о создателе файла и программе, с помощью которой этот файл был создан. Эти метаданные индексируются функцией поиска Spotlight и используются для быстрого и точного поиска — возможности, пользующейся заслуженным восхищением всех пользователей Mac.
До тех пор пока ваши файлы хранятся на вашем компьютере и защищены от любопытствующих глаз, наличие скрытых данных и метаданных проблемы не представляет. Как только вы начинаете обмениваться файлами через сеть или публиковать их в Интернете, то метаданные начинают создавать серьезные сложности. Достаточно вспомнить о том, в какую неприятную ситуацию попала известная телеведущая Кэтрин Шварц (Cat Schwartz)11, когда она поместила в своем блоге несколько своих обрезанных фотографий. Фотографии были обрезаны нестандартным образом, но поскольку программа, которую Кэтрин использовала для обрезки (Adobe Photoshop), не сгенерировала новых миниатюр, а в метаданных сохранились миниатюры исходных вариантов, то пользователи очень быстро обнаружили, что позировала она, как минимум, топлесс.
Эта ситуация с пикантными снимками была просто неприятной, хотя, в общем-то, довольно невинной (впрочем, это зависит от ваших взглядов), но ведь публикация скрытой информации, нежелательной для предоставления в общий доступ, может иметь и более серьезные и далеко идущие последствия.
Можно привести и другие примеры, когда имели место утечки конфиденциальной информации в результате того, что люди по незнанию публиковали в Интернете документы Word или PDF. Так, например, случилось при расследовании допингового скандала BALCO, когда утечка информации произошла в результате публикации в Интернете пресс-релиза в формате PDF — некоторые имена, вычеркнутые из документа, оказались доступны через метаданные.
К счастью, существуют методы, позволяющие проверить, что при публикации в сети файла с конфиденциальной информацией вы действительно публикуете только ту информацию, которая может быть предоставлена для всеобщего обозрения, и не допускаете нежелательных утечек данных. Но прежде чем вы сможете решить, какую информацию можно публиковать, а какую — нет, необходимо разобраться с тем, какая информация ассоциирована с публикуемым файлом.
Просмотр метаданных
Объем и формат метаданных файла зависит от формата самого файла. Некоторые форматы файлов предлагают колоссальные возможности по генерации метаданных, в то время как другие предоставляют лишь одно или два информационных поля. В зависимости от типа файла, Mac OS X предлагает несколько возможностей просмотра ваших метаданных, с различными уровнями полноты предоставляемой информации.
Наиболее очевидный метод просмотра метаданных — через окно Get Info (чтобы открыть это окно, щелкните мышью по интересующему вас файлу и нажмите клавиатурную комбинацию Command+I или же выполните на нем щелчок правой кнопкой мыши и выберите из контекстного меню команду Get Info). Если вы воспользуетесь командой Get Info применительно к графическому файлу, вы увидите стандартную информацию, включая даты создания и модификации файла, но при этом узнаете многое и о вашей камере, с помощью которой был сделан снимок (рис. 2.29).
Хотя команда Get Info и предоставляет возможность просмотра части метаданных и позволяет добавлять в их состав новую информацию, это решение все же не является исчерпывающим. Дело в том, что этот метод позволяет просматривать не все метаданные. В случае с файлом PDF, в состав метаданных включается полный текст документа, но команда Get Info текста не отображает. Чтобы получить более полную картину всех метаданных, ассоциированных с файлом, следует запустить приложение Terminal и дать из командной строки следующую команду:
1$ mdimport -d2 filename
Команда mdimport импортирует метаданные. Здесь filename — это имя файла, из которого требуется импортировать метаданные, а флаг -d означает импорт в отладочном режиме. Как правило, многих рядовых пользователей слово «отладка» пугает как нечто, ассоциированное с глубинными секретами программирования и хакинга, однако в данном случае опция -d, за которой следуют цифры от 1 до 4, просто означает уровень подробности выводимой информации. Так, использование опции -d2 позволяет просмотреть все метаданные, которые вам необходимы (см. рис. 2.30). Попробуйте экспериментировать с командой mdimport, указывая различные уровни детализации вывода — вы узнаете много нового и интересного.
Сокрытие метаданных
Теперь, когда вы осведомлены о существовании метаданных и знаете, как их просматривать, настал момент обсудить способ, с помощью которого вы можете освободиться от нежелательной информации, которую не хотите доводить до сведения всех и каждого. Если вас интересует, в каких ситуациях может оказаться полезным избавление от метаданных, рассмотрите следующий сценарий.
Допустим, вы редактировали документ Word в режиме отслеживания вносимых изменений, а после завершения работы хотите отправить этот документ клиенту. Небольшое исследование покажет, что клиент сможет увидеть внесенные изменения, поэтому если вы вносили, а потом удаляли всякого рода иронические комментарии, то достаточно продвинутый клиент сможет их увидеть. Не лучшая идея, не правда ли? Простейшим способом добиться поставленной цели является сохранение файла, созданного в Word, Excel, и других офисных приложениях, в формате PDF (рис. 2.31). В ходе этой операции будут удалены комментарии и большинство данных, не предназначенных для просмотра получателем.
Как добавить собственные метаданные
Просматривая рис. 2.30, вы можете обнаружить, что в документе имеются поля для добавления комментариев Spotlight. В эти поля вы можете добавлять информацию о файле, которую функция Spotlight может использовать для поиска файлов. С помощью этой возможности вы можете помечать тегами информацию, предназначенную для Spotlight (или любой другой программы, способной работать с базой данных Spotlight).
Извлечение неформатированного текста с помощью команды MDIMPORT
Когда вы выделяете текст для копирования в буфер обмена с целью последующей вставки в другой документ, созданный с помощью Word (или другой программы), при вставке этого текста сохраняется его исходное форматирование. Текстовые редакторы могут обойти это ограничение по форматированию, но вы с таким же успехом можете использовать и текст, извлеченный с помощью команды mdimport. Для этого достаточно выделить и скопировать в буфер текст, следующий за тегом kMDItemTextContent, и вставить этот неформатированный текст в любой документ.
При работе с фотографиями, вы, возможно, захотите избавиться от информации, ассоциированной с файлами формата EXIF (Exchangeable Image File Format)13. Если вы используете одну из версий программы Photoshop или ее аналоги, сделать это можно, выбрав при сохранении файла опцию Save for Web…. Если вы пользуетесь не Photoshop, а другим продуктом, где такой опции нет, для удаления данных EXIF следует пользоваться другими методами.
Так, следует знать о том, что не все форматы графических файлов допускают хранение в файле данных EXIF. Например, эта возможность отсутствует в файлах формата PNG, поэтому, если вы хотите удалить данные EXIF, преобразуйте файл в формат PNG, после чего его смело можно будет публиковать. С другой стороны, если вы непременно хотите опубликовать файл формата JPEG, преобразуйте файл обратно в формат JPEG — данные EXIF в процессе преобразования будут утрачены.
Хотя эти процедуры позволяют удалить из файлов большую часть информации, которую было бы нежелательно открыто публиковать, часть информации в файлах все же сохранится. Например, внимательное исследование файла позволит обнаружить информацию о его создателе, дате и времени создания, а также другие, относительно безобидные сведения. Разумеется, в некоторых ситуациях вам может нанести вред публикация даже такой информации.
Вы желаете тщательно замести следы и максимально «запутать концы и спрятать их в воду»? К сожалению, простого метода освободиться от всех метаданных, ассоциированных с файлом, нет, как не существует и удобного метода просмотра всей этой информации. Поэтому, если ваша цель — максимальная конспирация, вставляйте текст анонимно в режиме онлайн и сохраните его. В сочетании с TOR, этот метод позволит вам немного отсрочить раскрытие вашей анонимности.
Сохраняйте файлы в формате PDF
В наших статьях уже говорилось о сохранении файлов в формате PDF, однако к этой теме следует вернуться, поскольку на Macintosh данный процесс не настолько прост и прямолинеен, как может показаться. Интуиция подсказывает, что опция сохранения файла в формате PDF должна присутствовать в окнах Save As…, однако это не так. На компьютерах Mac, чтобы сохранить файл в формате PDF, следует выбрать из меню команду Print, в раскрывшемся окне нажать кнопку PDF и из раскрывшегося меню выбрать команду Save as PDF (рис. 2.31).