Audioknihy si v porovnaní s tradičnými elektronickými knihami získavajú čoraz väčšiu obľubu. Sú pohodlnejšie, pretože ich môžete počúvať kedykoľvek a kdekoľvek.

Elektronickú knihu PDF môžete previesť na audioknihu pomocou jednoduchého skriptu Python. Pomocou niekoľkých jednoduchých knižníc môžete vytvoriť projekt, ktorý prečíta PDF a uloží audioknihu ako nový súbor.

Inštalácia požadovaných balíkov

Musíte nainštalovať PyPDF3, pyttsx3, a pdf inštalatér balíčky, aby ste mohli začať. Tieto balíky môžete nainštalovať pomocou správcu balíkov pip. Uistite sa, že ste to už urobili nainštalovaný pip vo vašom systéme. Na inštaláciu balíkov spustite nasledujúci príkaz v príkazovom riadku:

pip Inštalácia PyPDF3 pyttsx3 pdf inštalatér
  • Môžete použiť PyPDF3 knižnica na čítanie a úpravu súborov PDF v Pythone.
  • The pyttsx3 knižnica poskytuje prevod textu na reč.
  • pdf inštalatér je knižnica, ktorá vám umožňuje extrahovať text a tabuľky zo súborov PDF.

Kód použitý v tomto projekte je dostupný v a úložisko GitHub a môžete ho bezplatne používať na základe licencie MIT.

instagram viewer

Prevod PDF na audioknihu pomocou Pythonu

Po nainštalovaní vyššie uvedených balíkov ste pripravení ich importovať do súboru python:

importovať PyPDF3
importovať pyttsx3
importovať pdf inštalatér

Musíte zadať názov a umiestnenie súboru PDF, ktorý chcete previesť. Pre jednoduchosť môžete použiť ľubovoľný vzorový súbor PDF. Skopírujte ho do rovnakého adresára ako váš skript a uložte jeho názov do premennej; ak sa to volá Lorem.pdf, napríklad:

súbor = 'Lorem.pdf'

Ďalej vytvorte objekt súboru pre súbor PDF a objekt čítačky PDF:

kniha = otvoriť (súbor, 'rb')
pdfReader = PyPDF3.PdfFileReader (kniha)

Neskôr budete prechádzať všetkými stranami súboru PDF. Ak chcete zistiť celkový počet strán, použite numPages nehnuteľnosť:

pages = pdfReader.numPages

Teraz ste pripravení extrahovať text zo súboru PDF:

finalText = ""

s pdfplumber.open(súbor) ako pdf:
pre i v rozsahu (0, strany):
strana = pdf.stránky[i]
text = page.extract_text()
finalText += text

Pomocou cyklu for iterujte všetky strany a extrahujte text z PDF. Na otvorenie súboru PDF môžete použiť balík pdfplumber a extrakt_textu metóda na načítanie textu zo stránky.

S plným textom uloženým v premennej ho môžete ďalej spracovávať v závislosti od vašich požiadaviek. Ak chcete previesť text na zvuk a uložiť ho do nového súboru, použite nasledujúci kód:

motor = pyttsx3.init()
engine.save_to_file (finalText, 'lorem.mp3')
motora.runAndWait()

Keď ty spustite tento kód Pythonu, vo svojom adresári vytvorí súbor audioknihy.

Ak nechcete uložiť audioknihu a chcete napríklad recitovať súbor PDF, môžete namiesto toho použiť nasledujúci kód:

motor = pyttsx3.init()
motora.povedať(finalText)
motora.runAndWait()

Keď spustíte tento skript, zarecituje súbor PDF.

Vyvíjajte projekty pomocou Pythonu

Python je známy svojou všestrannosťou. Pomocou Pythonu môžete jednoducho vytvárať projekty s praktickými aplikáciami.

Ak si chcete zašpiniť ruky kódom Python, môžete začať vývojom miniprojektov. Niektoré dobré nápady na začiatok sú kvízová aplikácia, chatbot, hra had, skracovač URL, webový škrabák alebo prevodník jednotiek.