Что такое PDF и как его сделать? Что такое PDF-файл и как его открыть

Доброго времени суток, дорогие читатели! Сегодня поговорим о такой штуке, которую многие видели, некоторые пользовались, а кому-то это кажется заморским колдунством и он обходит сие стороной, т.е про PDF .

Итак, прежде, чем рассказать что это, я расскажу для чего оно нужно. Предположим, вы открыли ваш любимый MS Word 2003/7/10/2048 , написали длинную простыню текста, оформили все это красивенько и довольные пошли показывать коллегам. И такой вот коллега берет ваш документ, открывает своим OpenOffice/LibreOffice/somethingotherOffice и ужасается от того безобразия, которое творится с документом.

Оформление поплыло, скриншоты отцентрированы криво, навигация не работает, отступ абзаца не по ГОСТу, шрифты фигпоймикакие, смотрит он на вас так вопросительно и недоумевает. А вместе с ним и вы недоумеваете, ведь у вас-то все ОК, и шрифты, специально скаченные, и отступы, выверенные с миллиметровой точностью, и скриншоты, отцентрированные с точностью до эпсилон в минус десятой. Показываете вы свое творение другому коллеге.

А у коллеги и офиса-то нету, Wordpad "ом прикажете открывать? То еще развлечение.

Так в чем же тут проблема?

Думаете в криворукости автора документа? Отнюдь, автор может и криворук, но дело совсем в другом. На самом деле, даже разные версии MS Word могут несколько по-разному смотреть на документы, не говоря уже о каких-то других программах для работы с электронной документацией. Так что же делать, чтобы другие люди могли увидеть Ваш документ именно в таком виде, в котором Вы его задумывали?

Здесь есть несколько способов:

  • Вы можете его распечатать, но это не самое удобное решение, особенно если люди находятся на другом конце синего шарика;
  • Вы можете его отправить по факсу, вот только этого факса на том конце может не быть;
  • Вы можете его сохранить в специальном формате. Тут-то и приходит на помощь PDF .

Вот о последнем, собственно, мы и поговорим.

Что такое PDF и с чем его едят

PDF (от англ. Portable Document Format ) - это специальный формат электронных документов, который не зависит от выбранной ОС, программы просмотра электронных документов или еще чего-нибудь. Он единый для любого устройства. Все, что нужно для открытия документов в этом формате - программа просмотра. Их существует великое множество, как бесплатных, так и платных.

Самая распространенная программка - это, несомненно, Adobe Reader (можно скачать , только не забудьте убрать галочки напротив McAfee и True Key ), которая написана авторами этой технологии.

Однако в AR часто находят уязвимости (а так же справедливо приписывают навязчивость, тормознутость и прочие ужасы жизни), так что кому это не нравится, смотрите в сторону аналогов (Foxit Reader, Nuance и тп).

Если кому интересно, так выглядит документ, открытый в Adobe Reader DC:

У PDF есть свои ограничения, как то:

  • Невозможность редактирования текста (кроме специализированных программ);
  • Необходимость вшивать нестандартные шрифты (для любителей делать не по ГОСТу);
  • Необходимость использования достаточно больших растровых изображений для внятного отображения при печати.

Среди преимуществ же:

  • Простота использования;
  • Возможность защитить файл от большинства действий нерадивых пользователей (пометка маркерами, поиск по словам, редактирование текста);
  • Независимость от программы просмотра. В любой программе просмотра он будет выглядеть одинаково.

Теперь поговорим о том, как его, собственно создать.

Как работать с PDF

В MS Word 2010, 13, 16 выбираете "Сохранить как " и указываете тип файла: "PDF ". Можно также снять галочку "Открыть файл после публикации ", чтобы не открывать каждый раз созданную вами PDF -ку.

Устанавливаете его, после чего запускаете Word , нажимаете на большую кнопку сверху-слева: "Сохранить как " -> "PDF или XPS " и сохраняете как PDF .

Если же вам нужен PDF файл из другой программы, при этом у нее нет возможности сохранять файлы в PDF , то достаточно скачать бесплатный виртуальный PDF принтер, например, .

Далее запускаете установщик, ждете, пока принтер установится, после этого открываете нужную вам программу, выбираете опцию "Печать ", выбираете виртуальный принтер и снова жмете на кнопку "Печать ".

Теперь выбираете интересующие вас настройки (я рекомендую отметить галочку "Embed fonts " для встраивания шрифта в ваш PDF ) и жмете на кнопку "OK ".

Есть еще и платные аналоги, но вы не подумайте, что они делают ровно тоже, но за деньги, нет. Они отличаются тем, что могут вставлять ссылки в PDF файлы, создавать закладки, оглавления, использовать водные знаки, зашифровывать PDF документ и еще много чего, что вам вряд ли в жизни пригодится:)

Кстати говоря, позволяют удобно и просто, без всяких плагинов, создавать PDF -фы на лету.

Послесловие

Вот в общем-то и все, что требуется для работы с данным форматом. Все возможности я описывать не стал, в этом нет особого смысла, ибо в большинстве случаев требуется просто сохранить файл или документ в PDF и потом открыть его каким-нибудь просмотрщиком. Так что пользуйтесь, очень удобный формат:)

Как и всегда, если есть какие-то вопросы, мысли, дополнения и всё такое прочее, то добро пожаловать в комментарии к этой записи.

PS : За существование статьи отдельное спасибо другу проекта и члену нашей команды под ником “barn4k“

Межкорпоративный документооборот (внешний ЭДО)

Чем отличается формат PDF от PDF/A, и какой формат лучше использовать для сохранения отсканированных образов документов?

Ришат Мухаметшин 16 мая 2013 г. 16:10

PDF (“portable document format”) - это универсальный формат электронных документов, которому, кстати, скоро исполнится 20 лет. Он создан по инициативе компании Adobe, и исходное его предназначение - электронное представление печатных материалов. Отсюда следует задача данного формата, связанная с хранением информации о цветовой схеме и расположении элементов, обеспечить идентичный вывод на разных мониторах и принтерах.

За время своего существования формат PDF значительно прибавил в возможностях. В первой же редакции формата появилась возможность вставлять в текст документа гиперссылки, шифровать документ с паролем и тем самым защищать его от модификации. В версии PDF 1.4 появилась возможность поверх изображения наносить текстовый слой, в том числе невидимый, давая пользователю возможность, видя “картинку”, тем не менее, копировать с неё текст. Кроме того, в этой же версии появилась возможность вставлять метаданные в виде пар “ключ-значение”, каждая из которых может быть связана с какой-то частью документа (например, отдельным изображением) или со всем документом целиком. Это важные нововведения, с точки зрения архивного хранения, и они поддерживаются форматом по сей день.

PDF/A - это подмножество формата PDF, содержащее ограниченный набор возможностей представления данных. Данный формат является стандартом ISO и предназначен для долгосрочного хранения электронных документов. Обеспечение длительного срока хранения достигается посредством внедрения в содержимое электронного документа в формате PDF/A всей информации, необходимой для его отображения. Такой информацией, в частности, являются шрифты - те из них, которые использованы в документе, включены в него. К слову, это влияет на его размер: документ в формате PDF/A не меньше, а вероятно даже больше по размеру, чем документ с аналогичным содержимым, сохранённый в формате PDF.

Считается, что документ, хранимый в формате PDF/A, ввиду полного отсутствия связи с такими изменчивыми вещами как гиперссылки и мультимедийный контент, можно будет открыть в любой операционной системе через какое угодно длительное время с помощью приложения, поддерживающего соответствующий формат. Поскольку PDF/A обеспечен статусом международного стандарта, его поддержка со стороны разработчиков ПО в долгосрочной перспективе оправдана, а использование целесообразно по сравнению с другими доступными форматами хранения, которые могут измениться в любой момент времени (вспомним недавнюю историю с отказом от поддержки документов Word старого образца до версии 2003 в Google Drive - старт умерщвлению формата Word 97–2003 дан).

При этом целостность и неизменность неподписанного документа в формате PDF/A не может быть гарантирована и не заявляется как особенность формата. Другими словами, несмотря на то, что данный формат позиционируется как обеспечивающий долгосрочное хранение, изменение содержимого документа возможно и не является отклонением от нормы, если оно не зашифровано. Однако есть ещё один нюанс: для каждого конкретного документа, формат которого заявлен как PDF/A, невозможно заведомо утверждать, что это действительно так. Необходима верификация на соответствие требованиям формата для каждого конкретного документа, и если на этапе размещения в архиве или после очередного изменения она не будет проведена, можно считать миссию обеспечения долгосрочного хранения потенциально проваленной (с некоторыми оговорками, но всё же).

Исходя из описанных выше различий между форматами PDF и его потомком PDF/A, вполне можно предположить, что первый больше пригоден для оперативного обмена и краткосрочного хранения электронных документов, тогда как PDF/A, несмотря на потенциально большой размер единичного документа (в него внедрены все использованные шрифты, а это для краткосрочного использования избыточный и ощутимый балласт), имея статус международного стандарта, гарантирует, что даже через продолжительное время, вне зависимости от окружения и операционной системы, любой пользователь сможет открыть документ в данном формате, располагая приложением-просмотрщиком. Этот факт укладывается в концепцию архива электронных документов и должен учитываться при сохранении каждого документа в нём.

Теперь необходимо определиться с тем, что такое отсканированный образ документов. В подавляющем большинстве случаев это растровое изображение. Предполагается, что текста поверх него нет, то есть в документе хранится исключительно отсканированный растр - изображение, текст на котором непонятен компьютеру, а понятен только человеку. В исключительных случаях поверх растрового изображения может быть расположен текстовый слой, частично или целиком наполненный либо вручную человеком, либо с помощью системы распознавания текста. Можно предположить, что документ содержит метаданные, так или иначе связанные с видом документа и его содержимым (например, если это счёт-фактура, метаданные могут содержать информацию о поставщике, дате выставления, сумме и т.д.).

Очевидно, что отсканированный образ документа допускает, но не подразумевает долгосрочного хранения. Но всё-таки в большинстве случаев образ должен храниться не меньше бумажного оригинала, а зачастую значительно дольше, поскольку значимость и важность его в контексте организации-владельца всегда держится выше нулевой отметки. Кроме того, образ снят с бумажного документа, а это значит, что его изменение не подразумевается, хотя и возможно.

На основании перечисленных особенностей, которыми обладает отсканированный образ документа, можно смело заявлять, что одинаково пригодны оба формата, поскольку для каждого конкретного документа не будут использованы возможности формата такие, которые не поддерживаются стандартом PDF/A. Последний допускает и метаданные, и текстовый слой поверх изображения, и даже подписание документа с целью защитить его от модификации. А необходимостью внедрения шрифтов в каждый документ можно пренебречь: поскольку речь идёт об образах, и текста нет, соответственно, нет и шрифтов, и добавочный вес в этом отношении будет мал.

(4,10 - оценили 10 чел.)

1 голос

Здравствуйте, уважаемые читатели моего блога. Как было бы просто, если бы существовало всего одно расширение и пару программ, позволяющих работать с тем или иным документом. Так нет же.

Один и тот же текст мы можем открыть при помощи различных утилит и выглядеть они всегда будут по-разному. Ладно бы, если бы хотя бы софт справлялся с несколькими форматами, так тоже нет. Одну книгу мы сколько не бейся не можем открыть при помощи того же Word, а другая не поддается иному решению.

Зачем это нужно? Кто это придумал? Сегодня я расскажу вам о pdf – что такое интересное содержит в себе этот формат, зачем его придумали и как с ним работать, какая программа поможет справиться с непростым расширением и чем его собственно можно открыть или отредактировать?

Начнем, пожалуй, с базы.

Кому был нужен PDF

Не буду морочить вам голову. Как и всегда объясню все простыми словами с минимальным использованием терминов, дат и прочих, на мой взгляд, ненужных сложностей. В конце концов, я работаю не на Первом канале и даже не пишу для сайта РБК.

Начать мне все же хотелось бы с истории. Файлы этого типа придумала компания Adobe и предназначался он изначально для властей США. Чуть позже его начали использовать в полиграфии. Представьте себе скан любому документа. Та же фотография. Именно в этом и заключается особенность PDF. Он создается с применением виртуального (не существующего физически) принтера.

Вы получаете как будто изображение каждой страницы книги, важного документа, с сохранением графики. Внести какие-то изменения в нее будет довольно сложно, а сам формат создает впечатление, что документ серьезный и представляет собой нечто внушительное, фундаментальное, основательное.

Работа с PDF

Как бы не было «сложно» подобные документы можно комбинировать и редактировать. Давайте посмотрим на основные преимущества и недостатки самых популярных утилит для реализации этой задачи.

Adobe Acrobat

Я уже рассказывал про Adobe Acrobat, когда готовил статью « » . Эта программа позволяет создавать свои документы, объединять их, редактировать, ну и конечно же читать.

На странице этой утилиты официального сайта Adobe acrobat.adobe.com вы можете скачать бесплатную урезанную версию, подходящую только для чтения, или воспользоваться всеми функциями по максимуму в течение бесплатного тестового периода, который длится неделю.

Свойства PDF-документа и действия, которые можно с ним выполнять, зависят от программы, в которой он был создан. Поэтому в некоторых PDF-документах всегда поддерживается копирование и поиск по тексту, а иногда это возможно только в программе ABBYY FineReader.

Можно выделить следующие типы PDF-документов:

PDF (только изображение)

PDF-документ такого типа получается при сканировании бумажных документов без распознавания текста. Каждая страница такого документа является изображением и не содержит текстового слоя. В документах PDF (только изображение) невозможны поиск, копирование и редактирование текста вне зависимости от программы для просмотра PDF-документов.

PDF-документы с возможностью поиска

Такие документы обычно содержат видимое изображение страницы и невидимый текстовый слой под ним. Документ такого типа чаще всего является отсканированной копией бумажного документа, к которому применили распознавание, и распознанный текст был записан под страницы.

Программа FineReader при открытии документов такого типа определяет, содержит ли данный PDF текстовый слой, и может его использовать при работе с PDF-документом. Подробнее см. "Режимы распознавания PDF ". Наличие текстового слоя обеспечивает возможность поиска и копирования текста вне зависимости от программы для просмотра PDF-документов. Редактирование текста в PDF такого типа доступно в FineReader, но может не поддерживаться в других редакторах.

С помощью FineReader документы такого типа можно получить:

  1. При добавлении текстового слоя к PDF (только изображение).
  2. При конвертации PDF или любых файлов изображений. Для этого выберите > Текст под изображением страницы . Подробнее см. настройки формата PDF .

PDF-документы, созданные в других приложениях

Документ такого типа получается при создании PDF из редактируемых форматов (например, из Microsoft Word или других офисных приложений) и является одним из видов PDF-документа с возможностью поиска. Он содержит текстовый слой и иллюстрации. В таком документе возможны поиск и копирование текста вне зависимости от программы для просмотра PDF-документов, а текст и картинки доступны для редактирования. Для выполнения этих действий у пользователя должны быть соответствующие права в данном документе.

PDF-документ такого типа можно получить:

  1. При сохранении исходного документа в формате PDF непосредственно в программе, в которой он был создан.
  2. При конвертации PDF-документа другого типа или файла другого формата в программе FineReader при выборе в настройках сохранения Настройки PDF с возможностью поиска >Только текст и картинки . Подробнее см. настройки формата PDF .

В результате форматирование документа может отличаться от исходного, но при редактировании такого документа можно получить более качественные результаты.

Формат переносимых документов (PDF) представляет собой универсальный файловый формат, который позволяет сохранить шрифты, изображения и сам макет исходного документа независимо от того, на какой из множества платформ и в каком из множества приложений такой документ создавался. Формат Adobe PDF считается признанным общемировым стандартом в области тиражирования и обмена надежно защищенными электронными документами и бланками. Файлы Adobe PDF имеют небольшой размер, и они самодостаточны; они допускают совместную работу, просмотр и печать с помощью бесплатной программы Adobe Reader®.

Отлично себя оправдывает использование формата Adobe PDF в издательском и печатном деле. Благодаря способности Adobe PDF сохранить совмещенный (композитный) макет, можно создавать компактные и надежные файлы, которые сотрудники типографии могут просматривать, редактировать, сортировать и получать с них пробные оттиски. Также в предусмотренный техпроцессом момент в типографии могут как непосредственно отправить файл на фотонаборное устройство, так и продолжить его завершающую обработку: осуществить предпечатные проверки, провести треппинг, спустить полосы или выполнить цветоделение.

Сохраняя документ в формате PDF, можно создать файл, соответствующий стандарту PDF/X. Формат PDF/X (формат обмена переносимыми документами) является разновидностью Adobe PDF, которая не допускает использования многих вариантов и сочетаний данных о цветности, шрифтов и треппинга, которые могут вызвать осложнения при печати. Документ PDF/X следует создавать в случае, когда PDF-файлы используются как цифровые оригиналы при допечатной подготовке изданий - как на этапе создания макета, так и для целей фотовывода (если программное обеспечение и выводящие устройства способны работать с форматом PDF/X).

О стандартах PDF/X. Стандарты PDF/X утверждены Международной организацией по стандартизации (ISO). Они применяются к обмену графическими данными. При преобразовании PDF-файл проверяется на соответствие заданному стандарту. Если PDF-документ не соответствует выбранному стандарту ISO, отображается сообщение, позволяющее выбрать между отменой преобразования и продолжением преобразования, при котором будет создан несоответствующий стандартам файл. Самое широкое распространение в издательском и печатном деле получили несколько разновидностей PDF/X: PDF/X-1a, PDF/X-3 и PDF/X-4.

Формат PDF/X-1a (2001 и 2003).

PDF/X−1a - это стандартный формат файлов, специально предназначенный для обмена готовыми к печати документами в виде электронных данных, при котором отправителю и получателю не требуется дополнительной договоренности для обработки информации и получения требуемых результатов в тираже. Фактически он является цифровым эквивалентом цветоделенных фотоформ.

Формат PDF/X-1a гарантирует, что:

  • все шрифты встроены
  • изображения встроены
  • определены параметры MediaBox и TrimBox или ArtBox
  • цвета представлены в формате CMYK, в формате смесевых цветов или в обоих форматах сразу
  • назначение вывода задано посредством описания условий печати или указания ICC профиля.

Примечание: назначение вывода определяет тип печатного процесса, к которому готовится файл, например, тип печатной машины, используемые краски и бумага.

PDF-файлы, соответствующие стандарту PDF/X-1a, могут быть открыты в Acrobat 4.0 и Acrobat Reader 4.0, а также в их более поздних версиях.

Набор PDF/X-1a предусматривает использование формата PDF 1.3, снижение разрешения цветных изображений и изображений в градациях серого до 300 ppi, а монохромных - до 1200 ppi, встраивание всех шрифтов в виде подмножеств символов, отсутствие встроенных цветовых профилей, а также сводит прозрачные области в соответствии с параметром "Высокое разрешение".

При использовании PDF/X−1a совместимых файлов вам больше не придется волноваться, что вас могут попросить предоставить недостающие шрифты или изображения. Вам больше никогда не придется сталкиваться с преобразованием изображения из RGB в CMYK без предварительного просмотра результатов. Решения о том, должен ли при печати файлов использоваться треппинг, будут приниматься на основании надежной информации. И, наконец, в типографии будут знать, что файл правильно подготовлен для печатной машины, на которой он будет печататься.

РАЗМЕРЫ (PAGE BOXES) В PDF

MediaBox, CropBox, BleedBox, TrimBox и ArtBox - что это такое? Тот кто хотя бы раз сталкивался с форматом PDF более плотно, наверняка сталкивался с этими определениями. В то же время, как показал опыт, мало кто знает что это и зачем это нужно.

Формат PDF удобен тем что точно передаёт в одном файле содержание и внешний вид документа, будь то просто текст или сложная комбинированная (векторная и растровая) графика. Среди прочих параметров, в нём хранится и размер документа (страницы). Однако этот размер не так однозначен, как может показаться на первый взгляд, поскольку существует до 5!!! различных вариантов описания этого размера. Эти варианты описания называются page boxes. Переводом "page box" на русский, с максимальным сохранением смысла в контексте допечатной подготовки, будет что-то вроде граница страницы, область документа, граница документа и т.п.

MediaBox - используется для определения ширины и высоты страницы. Media box определяет размер материала (например, бумаги) на котором производится печать, media box это самый большой бокс документа, остальные боксы могут быть такими же или меньше, но ни в коем случае не могут быть больше чем media box.

CropBox - видимая область страницы в Acrobat"е, которая содержит в себе какую-либо информацию. Crop box - прямоугольник минимального размера в который поместились бы все видимые объекты (текст, картинки, линии, номера страниц, колонтитулы и т.п.) документа. Размер crop box может быть таким же или меньше чем media box. Acrobat использует этот размер для отображения и печати документов. Иными словами, когда Вы открываете файл в Acrobat"е, то все, что вы видите в данный момент отображается в виде Crop box.

BleedBox - определяет размер документа вместе с вылетами. Вылеты - часть изображения которая обрезается после печати, нужна для того чтобы компенсировать погрешность процесса порезки. На рисунке до подрезки bleed box - 76х106 мм, а после подрезки в обрезной размер (TrimBox) - 70х100 мм.

TrimBox - определяет размер изделия (так называемый, обрезной размер). Это конечный размер после подрезки. TrimBox так же может сопровождаться метками реза (техническими элементами файла).

ArtBox - используется редко, определяет художественную часть изделия, важную его часть. Если говорить дословно - ту самую часть где по замыслу автора из изделия должен доноситься арт, креатив и т.п.

Как сделать PDF для печати?

Перед конвертацией в PDF все изображения должны быть переведены в CMYK. Если есть элементы, которые печатаются отдельными прогонами (пантоны), им должны быть назначены соответствующие цвета по палитрам Pantone Solid Coated/Uncoated. Цветовое пространство CMYK должно быть с профилем ISO Coated v2.

  • Corel Draw (на примере X4, английская версия)

File > Publish to PDF > указать название файла только латинскими символами > Settings > Compability: PDF/x-1a > Закладка Prepress поставить флажок на Bleed Limit и указать значение 5 мм > Закладка Objects поставить флажок на Export all Text as curves > Нажать ОК и сохранить файл.

  • Adobe Illustator

File > Save As > указать название файла только латинскими символами, в выпадающем списке «тип файла» выбрать Adobe PDF. Сохранить > в поле Adobe PDF выбрать пункт PDF/X-1a:2001 > в закладке Marks and Bleeds в разделе Bleeds выставить все значения по 5 мм (top, bottom, left, right) > Save PDF

  • Adobe Photoshop (на примере CS4, английская версия)

File > Save As > указать название файла только латинскими символами, в выпадающем списке «тип файла» выбрать Photoshop PDF. Сохранить > в поле Adobe PDF Preset выбрать пункт PDF/X-1a:2001 > в закладке Output, в разделе Color, Color Conversion: No Color Conversion, Profile Inclusion Policy: Don"t Include Profile > Save PDF

  • Adobe InDesign (на примере CS4, английская версия)

File > Export… > указать название файла только латинскими символами, в выпадающем списке «тип файла» выбрать Adobe PDF. Сохранить > в поле Adobe PDF Preset выбрать пункт PDF/X-1a:2001 > в закладке General, установить диапазон печати All, флажок Spreads должен быть снят > в закладке Marks and Bleeds, в разделе Bleeds выставить все значения по 5 мм (top, bottom, left, right) > в закладке Output, в разделе Color, Color Conversion: No Color Conversion, Profile Inclusion Policy: Don"t Include Profile > Export

  • QuarkXPress (на примере 8.0, английская версия)

File > Export > Layout as PDF > указать название файла только латинскими символами. Options > в поле PDF Style выбрать пункт PDF/X-1a:2001 > в закладке Pages, флажок Spreads должен быть снят > в закладке Bleed: Bleed Type – Symmetric, Amount 5 мм > OК > Сохранить.

  • MS Office (на примере 2007).

Приложения MS Office не предназначены для подготовки файлов к высококачественной печати, поэтому даже конвертация макета в PDF не всегда избавляет от проблем. Гарантией того, что в готовом изделии Вы увидите то же, что и на мониторе, является только подписанная цветопроба. Минимизировать ошибки поможет сохранение документа в PDF. Сохранить как > Adobe PDF > Adobe PDF Conversion Options > поставить флажок на Make PDF/A-1а: 2005 compliant file > Ok > указать название файла только латинскими символами > Сохранить файл