Как сохранить веб-страницу в pdf

Пробовали ли вы сохранить страницу с какого-либо сайта в Интернет? Наверняка, уже не раз такое проделывали. Ведь порой без доступа к Интернет, нужно ещё не раз обратиться к оригинальному тексту, таблицам или графикам.

Как сохранить веб-страницу в pdf

Обычно мы сохраняем страницу с помощью команд копирования-вставки в текстовый редактор Word или ему подобный. Более продвинутые пользователи сохраняют страницы в виде файлов с расширением .htm или .html. Однако, такой метод сохраняет далеко не все элементы на странице. А если нужно посмотреть оригинал? Как быть?

В одной из наших статей вы найдете способ, как сохранять целые сайты, но в этот раз мы хотим поведать вам о том, как сохранять отдельные страницы в универсальном общепринятом формате, который будет одинаково хорошо отображаться в любой из пользовательских операционных систем. Этот формат файла был разработан компанией Adobe и имеет расширение .pdf. Кстати, про него мы тоже уже писали в одном из наших обзоров.

На этот раз мы расскажем о том, как с помощью одного щелчка мыши сохранить почти любую интернет-страницу в pdf-файл.

Существует сайт pdfmyurl.com с помощью которого, вы сможете совершать сохранение самых разных веб-страниц.

Технология сохранения страницы в пдф-документ

Пример сохраненной страницы нашего сайта.

Как сохранить веб-страницу в pdf

Возможности сервиса

Дополнительные возможности сервиса

API HTML для PDF

Позволяет быстро и легко преобразовывать любой URL-адрес или необработанный HTML-код в высококачественный PDF-файл. Вы можете использовать его на любом языке программирования, и он поставляется с множеством опций для разных макетов, верхних и нижних колонтитулов, водяных знаков, шифрованием и другими фишками.

Сохранить страницу как PDF-ссылку

Поместите код на ваш сайт, чтобы пользователи могли сохранять как PDF-ссылку любую из веб-страниц. Устанавливается всего за несколько минут!

Сохранение целого сайта в формате PDF

Сервис предлагает простой в использовании инструмент для конвертации целого сайта в один PDF-файл. Вы просто вводите URL-адрес, и он собирает все страницы веб-сайта и упаковывает их в один PDF-файл. На эту процедуру требуется время,, поэтому результат операции будет выслан по электронной почте.

Как сохранить веб-страницу в pdf

Пакетное преобразование в PDF

Если у вас есть много веб-страниц для конвертирования в PDF, на сервисе существует пакетный веб-интерфейс для PDF API. Он позволяет вам преобразовывать многие веб-страницы в один объединенный PDF или в отдельные PDF-файлы в хорошо упакованном архиве.

  Комнатные растения семейства пальмовых фото и названиеКак сохранить веб-страницу в pdf

Несмотря на то, что в каждом браузере можно быстро создавать закладки на понравившиеся страницы, тем не менее, порой очень необходимо сохранить нужную веб-страничку в PDF (хотя бы потому, что эта страница со временем с сайта может быть удалена или отредактирована) .

К тому же информацию из PDF-формата можно легко читать на самых разных устройствах (его поддерживают все ридеры без исключения), можно редактировать в Word, передавать другим пользователям. Да и сама страница, со временем не разъедется, не изменится ее форматирование и оформление. В общем, полезная и нужная вещь!

В этой статье рассмотрю несколько способов, как это можно быстро и легко сделать. Собственно, приступим к делу.

Как сохранить веб-страницу в pdf

3 способа сохранения веб-страницы в DPF

С помощью печати в браузере

Будем считать, что вы нашли очень интересный и нужный материал, который непременно необходимо сохранить к себе. Рассмотрю действия по порядку.

1) Какой бы не был у вас браузер (Chrome, Opera, Edge, Firefox и др.), нажмите сочетание кнопок Ctrl+P (это сочетание означает распечатку страницы). Также эта функция доступна в меню браузеров.

Как сохранить веб-страницу в pdf

Нашли веб-страницу, которую нужно сохранить

2) Далее измените принтер по умолчанию на «Сохранить как PDF» или «Microsoft Print to PDF» (в зависимости от вашего браузера и ОС — у вас могут быть доступны разные варианты: как оба, так и всего один из них). См. пару скриншотов ниже.

Как сохранить веб-страницу в pdf

Изменяем принтер на сохранение в PDF

Как сохранить веб-страницу в pdf

Microsoft Print to PDF

3) Теперь задайте основные настройки: кол-во сохраняемых страниц, раскладку страницы, поля, цветность, колонтитулы и пр. После нажмите кнопку «Печатать».

Как сохранить веб-страницу в pdf

Задаем основные настройки

4) Далее укажите место на диске, где вы хотите сохранить файл, задайте ему имя.

Как сохранить веб-страницу в pdf

Задаем расположение и имя файла

Собственно, на этом задача выполнена. Теперь полученный PDF можно открыть в Word, Adobe PDF Reader, и сотнях других программ, поддерживающих данный формат.

Задача выполнена, файл сохранен

С помощью спец. расширений

Для большинства популярных браузеров сейчас есть куча различных дополнений и расширений, позволяющая сохранять понравившиеся странички как в облачные хранилища, так и в PDF файлы на жестком диске.

Выделить я бы хотел одно очень интересное дополнение — PDF MAGE.

  Как брать отростки у цветов

Небольшое дополнение для Firefox, Opera, Chrome, позволяющие в 1 клик мышкой сохранить веб-страницу полностью на жесткий диск!

Отмечу, что после нажатия по значку PDF Mage — текущая страничка просто скачивается в формате PDF к вам в папку загрузки. Удобнее придумать просто нельзя.

Покажу на примере.

После установки расширения в меню у вас будет небольшой значок. Найдя интересную страницу, просто щелкните по нему левой кнопкой мышки.

Так выглядит значок PDF Mage на панели в Chrome

Далее вы увидите сообщение, что начато сохранение страницы. Теперь можете вообще перейти на другую вкладку из быть о ней.

Начало сохранение веб-странички

Буквально через мгновение, браузер сам автоматически начнет загружать файл в формате PDF. Собственно, делается все без лишних телодвижений, быстро и удобно!

  • Загрузка странички в формате PDF
  • В общем, рекомендую к использованию!

С помощью онлайн сервисов

В сети также есть множество интернет-сервисов, позволяющих быстро сохранить любые странички в сети в PDF. Суть работы примерно следующая: вы вставляете в спец. строку URL-адрес странички, которую вам нужно сохранить.

Далее жмете кнопку генерации PDF файла. Через некоторое время получаете ссылку на загрузку своего PDF. Пользоваться, конечно, можно, но на мой скромный взгляд — всё это утомительно и годится для временного использования. Например, у вас есть «проблемы» с браузером или Windows, попалась какая-то «странная» страница, которая не хочет сохраняться предыдущими способами.

И так, самые популярные из сервисов подобного рода:

Для чего нужно сохранять страницы интернет сайтов? Ну, возможно вы хотите прочитать информацию в режиме офлайн или же сделать какие-то наблюдения над сайтом или же вы это хотите сделать с другой целью. Мне лично все равно, для чего вам это нужно, а просто расскажу, как это сделать в разных браузерах. И так, как же сохранить страницу сайта в формате PDF в браузерах Chrome, Opera, Yandex, Firefox?

Для начала вам необходимо найти страницу, которая вас интересует. У меня на примере будет автомобильный сайт ax4.ru .

В правом верхнем углу нажимаем что-то на подобии сэндвича. В появившемся меню нажимаем «Печать».

Далее вы увидите, что по умолчанию стоит название принтера, который у вас установлен или другой, который запрограммирован браузером. Нам нужно его изменить, нажав на соответствующую кнопку «Изменить».

Когда нажмем «Изменить», появится меню, в котором нужно выбрать пункт «Сохранить как PDF».

  Калина с сахаром в блендере

После чего, слева, название принтера поменяется на «сохранить как PDF». Остаётся лишь нажать кнопку «Сохранить».

  1. Выбираем место сохранения (у меня это Рабочий стол).

Я открываю файл программой Foxit Reader . Вы можете использовать любую другую программу для формата PDF.

  • Как сохранить страницу сайта в PDF в браузере Opera?
  • Ну, принцип аналогичен.

Находим сайт, который хотим сохранить в PDF формате. Сейчас это будет наш сайт – vgtk.ru .

  1. Слева вверху нажимаем на кнопку «Opera» и выбираем пункт «Печать».
  2. Изменяем параметры печати, нажимаем «Изменить».
  3. В появившемся окне выбираем пункт «Сохранить как PDF».
  4. Внизу справа нажимаем кнопку «Сохранить».

Выбираем место сохранения. У меня это рабочий стол, как видно на скриншоте .

Теперь я открываю файл PDF через Foxit Reader. Вы, как я упоминал ранее, можете использовать другую программу.Вот и всё, не очень симпатично, но суть понятна. Вы можете делать файл PDF из любой веб-страницы.

Как сохранить страницу сайта в PDF в браузере Yandex?

Для этого я зайду на новостной сайт nz1.ru и выберу какую-нибудь новость.

Как вы уже поняли, процедура во всех браузерах похожа. Нажимаем на подобия сэндвича в правом верхнем углу, затем «Дополнительно» и «Печать».

  • Сохраняем в PDF.

Затем выбираем место сохранения. Например, Рабочий стол.

  1. Открываем файл через любую программу, которая читает формат PDF, пользуемся.
  2. Как сохранить страницу сайта в PDF в браузере Firefox?
Читайте также:  Как провести инвентаризацию в 1с

Покажу на примере сайта с прикольными картинками prikolnie-kartinki.ru .

В браузере Mozilla Firefox немножко все происходит по-другому. Нажимаем на сэндвич в правом верхнем углу экрана и выбираем «Печать».

  • Откроется новое окно, где в левом верхнем углу выбираем «Печать».
  • Затем, в свойствах, выбираем пункт Foxit Reader PDF Printer, а ниже ставим галочку возле пункта «Печать в файл», затем нажимаем «ОК».

После этого вводим имя, то ли название документа. Я назвал его «Сайт». Нажимаем «ОК».

Выбираем место сохранения. Я, как всегда, сохраняю на Рабочий стол. Вы можете сохранить в любое, удобное для вас место.

Источник: http://mercabadom.ru/kak-sohranit-sajt-v-pdf/

Как сохранить веб-страницу в PDF — 3 способа

Как сохранить веб-страницу в pdf

Несмотря на то, что в каждом браузере можно быстро создавать закладки на понравившиеся страницы, тем не менее, порой очень необходимо сохранить нужную веб-страничку в PDF (хотя бы потому, что эта страница со временем с сайта может быть удалена или отредактирована) …

К тому же информацию из PDF-формата можно легко читать на самых разных устройствах (его поддерживают все ридеры без исключения), можно редактировать в Word, передавать другим пользователям. Да и сама страница, со временем не разъедется, не изменится ее форматирование и оформление. В общем, полезная и нужная вещь!

В этой статье рассмотрю несколько способов, как это можно быстро и легко сделать. Собственно, приступим к делу…

*

3 способа сохранения веб-страницы в DPF

Будем считать, что вы нашли очень интересный и нужный материал, который непременно необходимо сохранить к себе. Рассмотрю действия по порядку.

1) Какой бы не был у вас браузер (Chrome, Opera, Edge, Firefox и др.), нажмите сочетание кнопок Ctrl+P (это сочетание означает распечатку страницы). Также эта функция доступна в меню браузеров.

Как сохранить веб-страницу в pdf

Нашли веб-страницу, которую нужно сохранить

2) Далее измените принтер по умолчанию на «Сохранить как PDF» или «Microsoft Print to PDF» (в зависимости от вашего браузера и ОС — у вас могут быть доступны разные варианты: как оба, так и всего один из них). См. пару скриншотов ниже.

Как сохранить веб-страницу в pdf

Изменяем принтер на сохранение в PDF

Как сохранить веб-страницу в pdf

Microsoft Print to PDF

3) Теперь задайте основные настройки: кол-во сохраняемых страниц, раскладку страницы, поля, цветность, колонтитулы и пр. После нажмите кнопку «Печатать».

Как сохранить веб-страницу в pdf

Задаем основные настройки

4) Далее укажите место на диске, где вы хотите сохранить файл, задайте ему имя.

Как сохранить веб-страницу в pdf

Задаем расположение и имя файла

Собственно, на этом задача выполнена. Теперь полученный PDF можно открыть в Word, Adobe PDF Reader, и сотнях других программ, поддерживающих данный формат.

Как сохранить веб-страницу в pdf

Задача выполнена, файл сохранен

*

С помощью спец. расширений

Для большинства популярных браузеров сейчас есть куча различных дополнений и расширений, позволяющая сохранять понравившиеся странички как в облачные хранилища, так и в PDF файлы на жестком диске.

Выделить я бы хотел одно очень интересное дополнение — PDF MAGE.

PDF Mage

Источник: https://ocomp.info/kak-sohranit-veb-stranitsu-v-pdf.html

Print Friendly для сохранения веб-страниц в PDF

PrintFriendly — онлайн сервис и расширение для браузеров для сохранения веб страниц в удобном для чтения виде. Название этого портала можно перевести на русский язык, примерно так: «распечатать в удобном виде».

Многим пользователям, наверное, приходилось хоть один раз сохранять веб-страницу какого-нибудь сайта на свой компьютер. Такая страница могла содержать важную или полезную информацию, которая, возможно, была полезной сейчас, или могла пригодиться в дальнейшем.

Если копирование веб-страницы совершается не для присвоения содержания чужого сайта, то такое сохранение веб-страницы не вызовет никаких вопросов.

Существует много вариантов сохранения веб-страницы на жесткий диск компьютера.

Как сохранить веб-страницу на компьютер

Один из вариантов — это добавить такую страницу в закладки своего браузера. Но, таких закладок со временем становиться очень много.

Одно дело, когда такой сайт, человек, добавивший его в закладки, посещает время от времени, для ознакомления с новой информацией.

Другое дело — необходимая информация размещена на сайте, на который посетитель попал случайно, и который не планируется посещать в дальнейшем. Например, у этого сайта не интересующая пользователя тематика.

Поэтому держать веб-страницу такого сайта в закладках из-за одной статьи нерационально.

Можно просто попытаться скопировать содержимое сайта правой кнопкой мыши. Такой способ не работает на тех сайтах, на страницах которых заблокирована работа правой кнопки мыши. Это значит, что на таком сайте установлена защита от копирования.

Так администраторы сайтов, пытаются защитить свои авторские права на содержание своих статей от плагиата. Иногда, бывают такие случаи, когда некоторые недобросовестные блогеры, копируют чужие статьи, а потом публикуют их на своих сайтах, выдавая их за свои собственные статьи.

Защита от копирования пока работает неудовлетворительно, и ее можно обойти тем или иным способом. Об этом вы можете прочитать в статье, о том как скопировать веб-страницу, если там установлена защита от копирования.

Веб-страницу можно сохранить в формате HTML или в веб-архиве (MHTLM), а затем просматривать ее в окне своего браузера.

Самым легким способом копирования веб-страницы, является сохранение веб-страницы в файле формата PDF. Для того, чтобы скопировать веб-страницу сайта, ее нужно сохранить в PDF с помощью виртуального принтера.

У этого способа сохранения есть один недостаток. В таком файле после печати, сохраняются элементы исходной веб-страницы: навигация, рекламные объявления и прочие нежелательные элементы. Конечно, лучше будет их удалить перед печатью или сохранением в PDF.

При печати не будут израсходованы лишние расходные материалы, а при сохранении в формате PDF, готовый документ не будет содержать ненужных и нежелательных элементов. Таким образом, получится преобразовать PDF онлайн в удобном для печати и сохранении виде.

Такую возможность предоставляет портал PrintFriendly.com. После обработки веб-страницы, вы можете ее напечатать или сохранить в формате PDF.

Рассмотрим вначале работу онлайн сервиса Print Friendly & PDF, для преобразования веб-страницы в PDF, в удобном для печати виде.

Онлайн сервис Print Friendly & PDF

Вот так выгладит главная страница онлайн сервиса Print Friendly & PDF.

Как сохранить веб-страницу в pdf

Использование этого онлайн сервиса не вызовет никаких затруднений. Все очень просто: необходимо скопировать и вставить ссылку с нужного сайта в поле «enter a url», а потом нажать на кнопку «print preview».

Как сохранить веб-страницу в pdf

Открывается новая страница сервиса Print Friendly, где происходит преобразование веб-страницы в файл, удобного для печати вида. Преобразованный файл открыт, и с этим преобразованным файлом можно произвести необходимые действия.

Его можно сразу отправить на печать, если нажать для этого на кнопку «Печать», сохранить как PDF, нажав для этого на кнопку «PDF», или отправить на электронный почтовый ящик, при нажатии на кнопку «Email».

Как сохранить веб-страницу в pdf

Перед сохранением, преобразованный файл можно отредактировать. При редактировании можно изменить «Размер текста», увеличивая или уменьшая его, «Удалить изображения». Неверные действия при редактировании файла можно «Отменить».

Выделяя текст в документе, можно удалять ненужные предложения или целые абзацы текста. Когда документ будет окончательно отредактирован, потребуется нажать на кнопку «PDF», чтобы сохранить веб-страницу в PDF.

Откроется окно, в котором нужно нажать на кнопку «Download Your PDF», чтобы загрузить, сохраненную в формате PDF веб-страницу, на свой компьютер. По умолчанию размер сохраняемого документа выбран в формате стандартного печатного листа А4. Размер страницы, если это необходимо, можно изменить.

Как сохранить веб-страницу в pdf

Затем происходит загрузка файла PDF на компьютер, в папку, в которую производятся загрузки в вашем браузере. После загрузки файла в формате PDF, его можно открыть при помощи программы — просмотрщика файлов этого формата.

Как сохранить веб-страницу в pdf

Обращаю ваше внимание, что после преобразования в PDF, ссылки в документе остаются активными, в том числе, и ссылки закрытые анкором (текстом).

Для облегчения использования этого прекрасного сервиса, можно установить кнопки сервиса Print Friendly & PDF в популярные браузеры, чтобы не копировать в окно сервиса, адрес веб-страницы. Веб-страница будет преобразована и сохранена при нажатии на кнопку «Print Friendly».

Также, вы можете добавить кнопку «Print Friendly» на свой сайт.

Как сохранить веб-страницу в PDF в Internet Explorer

Для того, чтобы сохранить веб-страницу в PDF в браузере Internet Explorer необходимо добавить кнопку Print Friendly в закладки браузера. Сейчас, я покажу, как это сделать в браузере Internet Explorer 9.

Для этого, на главной странице онлайн сервиса Print Friendly & PDF, нужно нажать в правом верхнем углу на ссылку «Browser Tool». После этого в окне «Print Friendly Button for Internet Explorer» следует нажать правой кнопкой мыши на кнопку «Print Friendly». В контекстном меню следует выбрать пункт «Добавить в избранное…».

Читайте также:  Как обойти блокировку telegram

Как сохранить веб-страницу в pdf

В окне «Добавление в избранное» необходимо нажать на кнопку «Добавить».

Как сохранить веб-страницу в pdf

После этого, букмарклет «Print Friendly» добавляется в закладки. Букмарклет обеспечивает выполнение скриптов и отправку данных на веб-сайт.

Теперь, нужно открыть веб-страницу, и в закладках браузера, нажать на букмарклет «Print Friendly». Веб-страница открывается уже преобразованной в удобном для чтения виде на сервисе PrintFriendly & PDF. Теперь ее можно редактировать и сохранить на свой компьютер в формате PDF.

Источник: https://vellisa.ru/kak-sohranit-veb-stranitsu-v-pdf-v-udobnom-dlya-chteniya-vide-na-servise-print-friendly-pdf

Как сохранить веб страницу в pdf — Медицинская помощь

Как сохранить веб-страницу в pdf

Для меня было очень неожиданно то, что в хабе по Java практически нет информации по работе с PDF документами, поэтому я, из личного опыта, хочу на примере сервлета показать как легко можно любую web-страницу превратить в PDF документ.

Преамбула:

Напишем простой сервлет, который будет брать указанную нами web-страницу по HTTP протоколу и генерировать на её основе полноценный PDF документ.

Используемые библиотеки:

  • Flying Saucer PDF — основная библиотека, которая поможет создать нам PDF документ из HTML/CSS
  • iText — библиотека, которая включена в состав той, что описана выше, но я не мог не включить ее в список библиотек, т.к. именно на основе неё будет генерироваться PDF документ
  • HTML Cleaner — библиотека, которая будет приводить наш HTML код в порядок

Описания библиотек для Maven конфигурации (pom.xml) org.xhtmlrenderer flying-saucer-pdf 9.0.

4 net.sourceforge.

htmlcleaner htmlcleaner 2.6.1

Формирование страницы:

Одним из самый важных моментов является формирование страницы. Дело в том, что именно из самой страницы, посредством CSS, задаются параметры будущего PDF документа. Рассмотрим макет:page.jsp Привет, хабр! Текущее время:   Новая страница!

Здесь хочу остановиться на нескольких моментах.

Для начала самое важное: все пути должны быть абсолютными! Картинки, стили, адреса шрифтов и др., на всё должны быть прописаны абсолютные пути. А теперь пройдемся по CSS правилам (то, что начинается с символа @).@ font-face — это правило, которое скажет нашему PDF генератору какой нужно взять шрифт, и откуда.

Проблема в том, что библиотека, которая будет генерировать PDF документ не содержит шрифтов, включающих в себя кириллицу. Именно поэтому таким образом придется определять ВСЕ шрифты, которые используются в Вашей странице, пусть это будут даже стандартные шрифты: Arial, Verdana, Tahoma, и пр.

, в противном случае Вы рискуете не увидеть кириллицу в Вашем документе. Обратите внимание на такие свойства как «-fs-pdf-font-embed: embed;» и «-fs-pdf-font-encoding: Identity-H;», эти свойства необходимы, их просто не забывайте добавлять.

@ page — это правило, которое задает отступы для PDF документа, ну и его размер.

Здесь хотелось бы отметить, что если Вы укажите размер страницы A3 (а как показывает практика, это часто необходимо, т.к.

страница не помещается в документ по ширине), то это не значит, что пользователю необходимо будет распечатывать документ (при желании) в формате A3, скорее просто весь контент будет пропорционально уменьшен/увеличен до желаемого (чаще A4). Т.е. относитесь к значению свойства size скептически, но знайте, что оно может сыграть для Вас ключевую роль.

@ media — правило, позволяющее создавать CSS классы для определенного типа устройств, в нашем случае это «print». Внутри этого правила мы создали класс, после которого наш генератор PDF документа создаст новую страницу.

Сервлет:

Теперь напишем сервлет, который будет возвращать нам сгенерированный PDF документ:PdfServlet.javapackage ru.habrahabr.web_to_pdf.servlets; import org.htmlcleaner.CleanerProperties;import org.htmlcleaner.HtmlCleaner;import org.htmlcleaner.PrettyXmlSerializer;import org.htmlcleaner.TagNode;import org.xhtmlrenderer.pdf.ITextRenderer; import javax.servlet.

ServletException;import javax.servlet.http.HttpServlet;import javax.servlet.http.HttpServletRequest;import javax.servlet.http.HttpServletResponse;import java.io.*;import java.net.HttpURLConnection;import java.net.URL;import java.net.URLConnection; /** * Date: 31.03.2014 * Time: 9:33 * * @author Ruslan Molchanov (ruslanys@gmail.

com) */public class PdfServlet extends HttpServlet { private static final String PAGE_TO_PARSE = «http://localhost:8080/page.jsp»; private static final String CHARSET = «UTF-8»; @Override protected void service(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException { try { resp.

setContentType(«application/pdf»); byte[] pdfDoc = performPdfDocument(PAGE_TO_PARSE); resp.setContentLength(pdfDoc.length); resp.getOutputStream().write(pdfDoc); } catch (Exception ex) { resp.setContentType(«text/html»); PrintWriter out = resp.getWriter(); out.write(«Something wrong

«); ex.printStackTrace(out); ex.

printStackTrace(); } } /** * Метод, подготавливащий PDF документ.

* @param path путь до страницы * @return PDF документ * @throws Exception */ private byte[] performPdfDocument(String path) throws Exception { // Получаем HTML код страницы String html = getHtml(path); // Буффер, в котором будет лежать отформатированный HTML код ByteArrayOutputStream out = new ByteArrayOutputStream(); // Форматирование HTML кода /* эта процедура не обязательна, но я настоятельно рекомендую использовать этот блок */ HtmlCleaner cleaner = new HtmlCleaner(); CleanerProperties props = cleaner.getProperties(); props.setCharset(CHARSET); TagNode node = cleaner.clean(html); new PrettyXmlSerializer(props).writeToStream(node, out); // Создаем PDF из подготовленного HTML кода ITextRenderer renderer = new ITextRenderer(); renderer.setDocumentFromString(new String(out.toByteArray(), CHARSET)); renderer.layout(); /* заметьте, на этом этапе Вы можете записать PDF документ, скажем, в файл * но раз мы пишем сервлет, который будет возвращать PDF документ, * нам нужен массив байт, который мы отдадим пользователю */ ByteArrayOutputStream outputStream = new ByteArrayOutputStream(); renderer.createPDF(outputStream); // Завершаем работу renderer.finishPDF(); out.flush(); out.close(); byte[] result = outputStream.toByteArray(); outputStream.close(); return result; } private String getHtml(String path) throws IOException { URLConnection urlConnection = new URL(path).openConnection(); ((HttpURLConnection) urlConnection).setInstanceFollowRedirects(true); HttpURLConnection.setFollowRedirects(true); boolean redirect = false; // normally, 3xx is redirect int status = ((HttpURLConnection) urlConnection).getResponseCode(); if (HttpURLConnection.HTTP_OK != status && (HttpURLConnection.HTTP_MOVED_TEMP == status || HttpURLConnection.HTTP_MOVED_PERM == status || HttpURLConnection.HTTP_SEE_OTHER == status)) { redirect = true; } if (redirect) { // get redirect url from «location» header field String newUrl = urlConnection.getHeaderField(«Location»); // open the new connnection again urlConnection = new URL(newUrl).openConnection(); } urlConnection.setConnectTimeout(30000); urlConnection.setReadTimeout(30000); BufferedReader in = new BufferedReader(new InputStreamReader(urlConnection.getInputStream(), CHARSET)); StringBuilder sb = new StringBuilder(); String line; while (null != (line = in.readLine())) { sb.append(line).append(«»); } return sb.toString().trim(); } @Override public String getServletInfo() { return «The servlet that generate and returns pdf file»; }} Кстати, совсем не обязательно писать для этих целей сервлет, Вы можете перенести логику этого сервлета хоть в консольное приложение, которое будет сохранять PDF документы в файлы. Как Вы могли заметить, в сервлете не нужно ничего настраивать, менять, дополнять, и т.д. (ну за исключением пути до страницы и, возможно, кодировки), соответственно вся работа по подготовке PDF документа очень проста и происходит исключительно во вьюшке.

В конечном итоге у Вас должен получиться примерно такой PDF документ: github.com/ruslanys/example-web-to-pdf/blob/master/web-to-pdf-example.pdf

Я немного дополнил свой документ информацией (распарсил главную страницу Хабра) и у меня получился такой вот документ: github.com/ruslanys/sample-html-to-pdf/blob/master/web-to-pdf-habra.pdf

Ссылка на исходники: github.com/ruslanys/sample-html-to-pdf

P.S. В принципе, на основе этого примера можно написать целый сервис, который будет по любому адресу страницы создавать PDF документ.

Единственное, что будет необходимо сделать — это привести HTML код страницы в соответствие с нашими правилами, т.е.

в первую очередь нужно будет переписать все относительные пути на абсолютные (благо это делается не сложно), и в соответствии с какой-то логикой задать размеры документа.

  • pdf
  • itext
  • flying saucer
  • servlet

Источник: https://habr.com/post/217561/

Как сохранить веб-страницу в PDF — 3 способа

Как сохранить веб-страницу в pdf

Всем доброго времени!

Несмотря на то, что в каждом браузере можно быстро создавать закладки на понравившиеся страницы, тем не менее, порой очень необходимо сохранить нужную веб-страничку в PDF (хотя бы потому, что эта страница со временем с сайта может быть удалена или отредактирована) …

К тому же информацию из PDF-формата можно легко читать на самых разных устройствах (его поддерживают все ридеры без исключения), можно редактировать в Word, передавать другим пользователям. Да и сама страница, со временем не разъедется, не изменится ее форматирование и оформление. В общем, полезная и нужная вещь!

В этой статье рассмотрю несколько способов, как это можно быстро и легко сделать. Собственно, приступим к делу…

*

3 способа сохранения веб-страницы в DPF

Будем считать, что вы нашли очень интересный и нужный материал, который непременно необходимо сохранить к себе. Рассмотрю действия по порядку.

1) Какой бы не был у вас браузер (Chrome, Opera, Edge, Firefox и др.), нажмите сочетание кнопок Ctrl+P (это сочетание означает распечатку страницы). Также эта функция доступна в меню браузеров.

Нашли веб-страницу, которую нужно сохранить

2) Далее измените принтер по умолчанию на «Сохранить как PDF» или «Microsoft Print to PDF» (в зависимости от вашего браузера и ОС — у вас могут быть доступны разные варианты: как оба, так и всего один из них). См. пару скриншотов ниже.

Изменяем принтер на сохранение в PDF

Microsoft Print to PDF

3) Теперь задайте основные настройки: кол-во сохраняемых страниц, раскладку страницы, поля, цветность, колонтитулы и пр. После нажмите кнопку «Печатать».

  • Задаем основные настройки
  • 4) Далее укажите место на диске, где вы хотите сохранить файл, задайте ему имя.
  • Задаем расположение и имя файла

Собственно, на этом задача выполнена. Теперь полученный PDF можно открыть в Word, Adobe PDF Reader, и сотнях других программ, поддерживающих данный формат.

Задача выполнена, файл сохранен

Читайте также:  Как получить значки в стиме

*

С помощью спец. расширений

  1. Для большинства популярных браузеров сейчас есть куча различных дополнений и расширений, позволяющая сохранять понравившиеся странички как в облачные хранилища, так и в PDF файлы на жестком диске.
  2. Выделить я бы хотел одно очень интересное дополнение — PDF MAGE.
  3. PDF Mage

Источник: https://onemedicina.ru/kak-soxranit-veb-stranicu-v-pdf.html

Как сохранить страницу в файле. Как сохранить веб-страницу в PDF-документ

Всем, кто посещает наш сайт, здравствуйте. Сегодня мы с вами поговорим о том, как сохранить веб -страницу определенного ресурса. В интернете много полезной информации, а вот свободного времени у многих людей для ознакомления с ней просто не хватает.

Можно, конечно, занести полезную страницу и потом при удобном случае вернуться к ней для просмотра. Однако, открыть закладку сможете при наличии интернета.

А если, предположим, вам нужно лететь в другой город самолетом или ехать поездом, то тогда могут возникнуть перебои со связью, и вы не сможете открыть страницу сайта с полезной для вас информацией.

В таком случае, заранее сохраните все веб-страницы, которые вы хотите просмотреть в дороге, затем скопировать на флэшку. И в спокойной обстановке, не переживая за качество связи, просмотреть всю информацию.

Для сохранения веб-страниц можно использовать несколько способов. Мы рассмотрим основные из них.

Данный способ, пожалуй, самый простой. Для этого вам нужно иметь текстовый редактор Word от компании Microsoft.

Выделяем статью или ее фрагмент, копируем, нажимая для этого сочетание клавиш Ctrl + C
, открываем Word и при помощи клавиш Ctrl + V вставляем в документ Word.

Если вам нужно выделить не весь текст страницы, а лишь несколько абзацев в разных местах веб-страницы, то воспользуйтесь нехитрым приемом, который мы описывали .

Этот способ сохранения веб-страницы позволяет сохранить данные в файле формата html. Это очень удобно: файл с подобным форматом откроет любой браузер. В качестве примера мы рассмотрим процесс сохранения главной страницы нашего сайта. Для того, чтобы сохранить выбранную страницу, щелкните по ней правой кнопкой мыши на ней и выберите «Сохранить как…
»

Перед вами откроется окно Проводника, в котором вы указываете в какой папке будет сохранятся веб-страница. В примере мы просто на рабочем столе создаем папку «сохраненные сайты
»

Тип файла
. Здесь вы выбираете тот тип, который вам нужен. Рассмотрим их различия. При выборе типа «Веб-страница полностью
» будет сохранена не только веб-страница, но и все изображения, скрипты, стили. Все они будут хранится в отдельной одноименной папке.

В этом случае при открытии файла Азбука-инета.html все стили, изображения и скрипты будут подгружаться из этой папки. Это удобно, когда у вас нет доступа в интернет.

Если же вы будете выбирать тип «веб-страница, только HTML»,
то при открытии такого файла все данные (изображения, стили), будут подгружаться с интернета. При отсутствии интернета у вас на экране будет просто не отформатированный текст. Поэтому сохранять в этом типе файл нужно тогда, когда вы знаете, что у вас будет подключение к всемирной сети.

Файл в формате PDF избавляет вас думать будет ли интернет или нет. Веб-страница, сохраненная в этом формате доступна в любом месте. Открыть такой файл можно почти любым браузером как на компьютере, так и на планшете, смартфоне.

Или же применив сочетание клавиш Ctrl + P

Откроется окно настроек печати

Справа видно, как будет печататься страница в формате А4, слева настройки печати. Нам же не нужно печатать страницу, поэтому нажимаем на кнопочку «».

Источник: https://thesaker.ru/internet/kak-sohranit-stranicu-v-faile-kak-sohranit-veb-stranicu-v-pdf-dokument/

Как преобразовать веб-страницу в PDF с сохранением ее внешнего вида (точно как в веб-браузере) и текста/ссылок?

Я ищу способ конвертировать веб-страницу в PDF, но сохраняя внешний вид веб-страницы. Также сохраняя текст веб-страницы (будучи выбираемым), с возможностью поиска [создание скриншота изображения для веб-страницы не сделает текст ни выбираемым, ни доступным для поиска].

Я ищу печать веб-страницы в формате PDF как есть (как в веб-браузере) без каких-либо манипуляций со стилем или выравниванием или потерей статических компонентов любой веб-страницы.

Это поможет сохранить оффлайн копии веб-страниц, легко читается, annotateable и поиска.

вам не нужно читать какие-либо из ниже (Вопрос выше) для того, чтобы сделать мой вопрос. Следующий раздел — это просто перечисление того, что я получил через исследования или ответы других, вложенным способом, чтобы получить ответ на вопрос.

результаты исследований (предложения, которые не решили мою проблема)

результаты до сих пор на попытке найти решение (все еще не работает в качестве решения для этого вопроса)

Я пробовал эти PDF веб-движки печати, но все манипулировать взглядом страниц, более даже повреждения и сделать некоторые трудно читаемые: (Пример страницы скриншоты заключены в квадратные скобки)

  • Chrome [Оригинал, Стили Печати (отключен/не Отключено)]
  • Firefox [Оригинал, Стили Печати (Инвалид p1,p2 | не инвалид Р1,p2)]
  • читабельности
    • это упрощает веб-страницу (что хорошо для целенаправленного чтения–однако это не то, что я ищу). Я ищу сохранение всех свойств позиций/стилей веб-страницы, как видно на веб-браузере, в формате PDF без каких-либо манипуляция.
  • Foxit Reader
  • NovaPDF
  • CutyCapt [Оригинал,Коэффициент Увеличения: 0.4: скриншоты, выведенный PDF]
    • я добавлю ссылки после того, как решу запущенные проблемы программы на Windows»
  • wkhtmltopdf [Оригинал,Коэффициент Увеличения: 0.4:скриншоты,выводится PDF]

все плагины для захвата скриншотов изображений с веб-страницы (например,похищение,Потрясающие Скриншоты,Fireshot,Firefox Скриншот Инструмент Разработчика,Захват Экрана На Всю Страницу,Page2Images,web-capture,…) не отвечай на мой вопрос, потому что они не сохранить текст и ссылки.

Scrible отлично подходит для сохранения веб-страниц, как для дальнейших аннотаций и исследований, но, к сожалению, все еще Онлайн и без преобразования в формат PDF.

есть еще два вопроса по сообществу, похожему как-то на мой, однако, этот немного отличается, но с теми важными различиями:

более похожие вопросы, где сохранение текста и ссылок-это не требование (страницы захватываются как скриншоты изображения в основном):

  • как сделать скриншоты / сохранить веб-страницу в формате PDF

Примечания

OS: Windows 10

Источник: https://kompsekret.ru/q/how-to-convert-a-webpage-to-pdf-with-preserving-its-look-exactly-as-on-web-browser-and-text-links-9413/

Как сохранить веб страницу в pdf мозилла. Print Friendly & PDF — сохранить веб-страницу в PDF в удобном для чтения виде

Однако, если в закладках копить не только регулярно посещаемые сайты, но и новости-однодневки или информацию, которая может потом пригодиться, а может и не пригодиться, тогда этот раздел браузера со временем станет захламлён. И в нём трудно будет отыскать нужные закладки.

Для сохранения разовых публикаций существует масса альтернатив, например:

  • сервисы заметок,
  • сервисы отложенного чтения,
  • штатные или встраиваемые в браузеры расширения для хранения неиспользуемых активных вкладок и сессий.

Правда, эти способы хороши лишь при условии доступа к сети Интернет. Но есть решения, позволяющие хранить веб-страницы на локальном пространстве компьютера, без интернета – это:

  1. оставить себе «на память» страничку в виде файла HTML или
  2. сохранить веб-страницу в PDF-документ.

О втором способе хотелось бы поговорить подробнее.

1. Почему стоит сохранить веб-страницу в PDF

Сохранение в PDF – оптимальный способ запечатлеть веб-страницу в таком виде, как она есть в данный момент, без каких-либо искажений.

Такой способ можно использовать, чтобы, например,

  • зафиксировать соц.аккаунты лиц, которые предположительно могут удалить с них важную информацию.
  • В PDF-документ можно отправлять статистические данные с аналитических ресурсов.
  • Даже обычные новостные публикации можно сохранять в этот формат файлов, чтобы просмотреть их с мобильных или прочих устройств в удобное время, но когда не будет Интернета.

При сохранении в PDF-формате содержимое веб-страницы оптимально распределяется на листе с дефолтными параметрами, установленными – А4 с книжной ориентацией – для удобства просмотра в программах-ридерах. Дефолтные параметры в случае необходимости можно сменить на другие, более подходящие для ридера на том или ином устройстве.

  • Чем сохранение веб-страницы именно в PDF-формате отличается от других вариантов?
  • PDF – универсальный , его поддержка реализована практически на каждом устройстве, в каждой операционной системе.
  • Однако веб-страницу можно также
  • сохранить в HTML,
  • либо со странички .

PDF-формат выигрывает у HTML-формата, в первую очередь, своей универсальностью и обилием ридеров с разным функционалом.

А от скриншотов, которые можно сделать с веб-страниц, PDF-файл отличается тем, что его потом можно конвертировать в текстовый документ, если это понадобится.

Известно, что конвертация из PDF в текст бывает не всегда возможна. Поэтому стоит использовать такие способы конвертации, которые изначально распознают текстовый материал сайтов, соответственно, как текст.

Такие способы приводятся для операционной системы Windows ниже.

2. Печать в браузерах для сохранения в PDF-формате

Практически у всех веб-обозревателей (проще говоря, браузеров) есть собственная, встроенная функция печати страниц сайтов. И в рамках этой функции предусмотрена возможность сохранения в PDF.

Источник: https://bazava.ru/kak-sohranit-veb-stranicu-v-pdf-mozilla-print-friendly-pdf-sohranit.html

Ссылка на основную публикацию
Adblock
detector