Chcete vedieť, ako môžete pomocou terminálu zachytiť webovú stránku a uložiť ju ako dokument PDF alebo obrázok? Našťastie má Linux nepreberné množstvo nástrojov, ktoré môžete použiť na automatizáciu úlohy prevodu dokumentov HTML na súbory PDF a obrázky.

Tento článok vás oboznámi s nástrojmi wkhtmltopdf a wkhtmltoimage, ktoré sú potrebné na uľahčenie vašej práce.

Ako previesť HTML na PDF

Ak chcete zachytiť webové stránky a previesť ich do súboru PDF, pomôže vám s nimi nástroj wkhtmltopdf. Wkhtmltopdf je nástroj príkazového riadku otvoreného zdroja, ktorý sa používa na vykreslenie webových stránok do dokumentov PDF.

Pretože tento nástroj funguje bezhlavo vo vnútri terminálu Linux, nebudete potrebovať žiadny webový ovládač ani rámec automatizácie prehľadávača, ako je Selenium.

Nainštalujte si wkhtmltopdf na Linux

Wkhtmltopdf nepatrí medzi štandardné balíky, ktoré sú predinštalované v systéme Linux. Budete ho musieť manuálne nainštalovať pomocou správcu balíkov vášho systému.

Inštalácia súboru wkhtmltopdf na distribúcie založené na Ubuntu a Debian:

instagram viewer
sudo apt nainštalovať wkhtmltopdf

Na distách založených na oblúkoch, ako je Manjaro Linux:

sudo pacman -S wkhtmltopdf

Inštalácia súboru wkhtmltopdf na distribúcie založené na RHEL, ako sú Fedora a CentOS, je tiež jednoduchá.

sudo dnf nainštalovať wkhtmltopdf

Základná syntax

Základná syntax príkazu je:

wkhtmltopdf názov webovej stránky

...kde webstránka je URL webovej stránky, ktorú chcete previesť a názov súboru je názov výstupného súboru PDF.

Ak chcete previesť domovskú stránku Google na dokument PDF, postupujte takto:

wkhtmltopdf https://google.com google.pdf

Výkon:

Po otvorení súboru PDF si všimnete, že wkhtmltopdf presne vykreslil webovú stránku do dokumentu.

Tlač viacerých kópií webovej stránky

The - kópie flag je záchranca, ak chcete, aby mal váš výstupný súbor viac kópií webovej stránky. Upozorňujeme, že pri tlači viacerých kópií nebude wkhtmltopdf generovať viac súborov PDF, ale namiesto toho pridá ďalšie stránky do jedného dokumentu.

Vytvorenie troch kópií domovskej stránky Google:

wkhtmltopdf - kópie 3 https://google.com google.pdf

Výstupný súbor PDF bude obsahovať tri strany, ako je uvedené vo vyššie uvedenom príkaze.

Pridajte na výstup filter sivej

Ak chcete do súboru PDF pridať filter v odtieňoch sivej, použite -g alebo --šedá vlajka s príkazom:

wkhtmltopdf -g https://google.com google.pdf
wkhtmltopdf - stupnica šedej https://google.com google.pdf

Výstupný súbor:

Zmeňte orientáciu súboru PDF

V predvolenom nastavení wkhtmltopdf generuje súbor PDF vo zvislom rozložení, tj. Na výšku. Ak chcete zmeniť toto predvolené správanie a namiesto toho zachytiť webové stránky na šírku, použite --orientácia vlajka s príkazom:

wkhtmltopdf - orientačná krajina https://google.com google.pdf

Výkon:

Upozorňujeme, že verzia dokumentu na šírku má v porovnaní s verziou na výšku väčšiu bielu oblasť.

Počas konverzie nezahŕňajte obrázky

Ak pri generovaní výstupu nechcete, aby wkhtmltopdf vykresľoval obrázky prítomné na webovej stránke, použite - žiadne obrázky vlajka:

wkhtmltopdf - žiadne obrázky https://google.com google.pdf

Výkon:

Súvisiace: Najlepšie nástroje na úpravu súboru PDF kdekoľvek

Ako previesť webovú stránku na obrázky

Obslužný program wkhtmltoimage je súčasťou balíka wkhtmltopdf. Ak pracujete na správe a chcete zahrnúť obrázky z webovej stránky, tento nástroj bude pracovať vo váš prospech. Terminál Linux vám nielen uľahčuje snímanie obrázkov, ale poskytuje vám aj množstvo možností, ktoré vám umožňujú prispôsobiť váš výstup.

Základná syntax

Wkhtmltoimage má podobnú syntax ako wkhtmltopdf:

wkhtmlobrázok názov webovej stránky

...kde webstránka je URL webovej stránky a názov súboru je názov výstupného obrázka.

Konvertujte webovú stránku na obrázok

Pokračujeme vyššie uvedeným príkladom, poďme konvertovať domovskú stránku Google na obrázky.

wkhtmlobrázok https://google.com google.png

Výkon:

Môžete tiež určiť vlastný formát súboru, ktorý má mať výstupný obrázok. Wkhtmltoimage podporuje nasledujúce prípony súborov:

  • JPEG / JPG
  • PNG
  • SVG

Napríklad ak chcete vygenerovať obrázok JPG, jednoducho v príkaze nahraďte príponu súboru JPG:

wkhtmlobrázok https://google.com google.jpg

Súvisiace: JPG vs. JPEG: Aký je rozdiel medzi týmito formátmi obrazových súborov?

Zachytávanie webových stránok pomocou terminálu Linux

Ak chcete zobraziť súbory PDF vygenerované programom wkhtmltopdf, musíte mať v systéme Linux nainštalovaný prehliadač PDF. Aj keď je väčšina distribúcií systému Linux dodávaná s predinštalovaným editorom PDF, môžete si manuálne zvoliť a nainštalovať editor PDF, ktorý vyhovuje vašim potrebám.

Email
5 najlepších editorov PDF v systéme Linux, ktoré by ste mali vyskúšať

Potrebujete upraviť súbor PDF v systéme Linux? Tieto editory PDF pre Linux sa inštalujú zadarmo a ľahko sa používajú.

Prečítajte si Ďalej

Súvisiace témy
  • Linux
  • PDF
  • Linux
O autorovi
Deepesh Sharma (Publikovaných 67 článkov)

Deepesh je juniorský editor pre Linux na MUO. Píše informačný obsah na internete už viac ako 3 roky. Vo voľnom čase rád píše, počúva hudbu a hrá na gitare.

Viac od Deepesh Sharma

Prihlásiť sa ku odberu noviniek

Pripojte sa k nášmu bulletinu s technickými tipmi, recenziami, bezplatnými elektronickými knihami a exkluzívnymi ponukami!

Ešte jeden krok…!

V e-maile, ktorý sme vám práve poslali, potvrďte svoju e-mailovú adresu.

.