Systemy operacyjne oparte są na wierszach poleceń, które oferują nam wiele opcji zwiększania możliwości dystrybucji poprzez możliwość wykonywania wyszukiwań, działań administracyjnych, wsparcia i wielu innych.
Dokładnie jedna z tych opcji wiąże się z możliwością wyszukiwania określonych typów plików w Linuksie, a tym samym łatwego dostępu do ich zawartości i dlatego dzisiaj porozmawiamy o pdfgrep, który koncentruje się na wyszukiwaniu plików PDF.
Co to jest pdfgrepPdfgrep to narzędzie wiersza poleceń do wyszukiwania tekstu w plikach PDF w prosty i funkcjonalny sposób, oszczędzając nam czasu na dostęp do każdego pliku i wyszukiwanie tekstu za pomocą narzędzi PDF.
Niektóre z jego cech to:
- Kompatybilny z Grepem, możemy wykonać wiele parametrów grep, takich jak -r, -i, -n lub -c.
- Możliwość wyszukiwania tekstu w wielu plikach PDF
- Polecane kolory, ta opcja koloru GNU Grep jest domyślnie obsługiwana i włączona.
- Obsługuje użycie wyrażeń regularnych.
- Darmowe oprogramowanie
1. Zainstaluj Pdfgrep w systemie Linux
Krok 1
W tym przypadku użyjemy Ubuntu, dla którego wystarczy wykonać następującą linię. Tam wpisujemy literę S, aby zaakceptować pobranie i instalację pakietów.
sudo apt zainstaluj pdfgrep
Krok 2
Inne opcje instalacji to:
- Pobierz plik .TAR.GZ pod poniższym linkiem.
Krok 3
- Lub uruchom następujące polecenie:
klon git https://gitlab.com/pdfgrep/pdfgrep.gitKrok 4
Następnie wprowadź każdy z następujących wierszy w ich kolejności:
./configure make sudo make install
2. Użyj Pdfgrep w systemie Linux
Krok 1
Po zainstalowaniu pdfgrep będzie to składnia do użycia:
pdfgrep [OPCJA…] WZÓR [PLIK]Krok 2
Każdy z elementów to:
- Opcja: wskazuje atrybuty, które możemy dodać w wyszukiwaniu, na przykład -i lub --ignoruj-przypadek, które ignorują rozróżnienie wielkich i małych liter między wskazanym przez nas wzorcem a tym, który musi pasować do pliku.
- Wzorzec: wskazuje rozszerzone wyrażenie regularne.
- Plik: jest to plik PDF, w którym należy przeprowadzić wyszukiwanie.
Krok 3
Zaczniemy od prostego wyszukiwania, na przykład poszukamy słowa Solvetic w pliku Solvetic.pdf, w tym celu wykonujemy:
pdfgrep Solvetic Solvetic.pdf
POWIĘKSZAĆ
Krok 4
W tym przypadku termin ten istnieje tylko raz we wspomnianym pliku, ale teraz poszukamy terminu Windows w oficjalnym pliku Microsoft PDF i będzie to wynik, który zobaczymy:
POWIĘKSZAĆ
Krok 5
Widzimy, że wyszukiwane słowo jest podświetlone, co ułatwia jego lokalizację. Teraz, jeśli dodamy parametr -w, Będzie można zobaczyć wyniki z numerem strony, na której wykryto ten termin:
POWIĘKSZAĆ
Krok 6
Inną opcją, której możemy użyć z pdfgrep, jest wyświetlenie listy plików PDF zawierających określony termin, w tym celu wykonujemy następujące czynności:
pdfgrep Solvetic * pdfKrok 7
W ten sposób plik PDF zawierający termin Solvetic zostanie wyświetlony:
POWIĘKSZAĆ
Krok 8
Jeśli chcemy otworzyć plik PDF, możemy wykonać następujące polecenie:
xdg-open (Plik.PDF)
POWIĘKSZAĆ
Krok 9
Ogólne opcje, które oferuje nam pdfgrep to:
-i, --ignore-caseIgnoruj rozróżnienie wielkości liter zarówno w plikach źródłowych, jak i wejściowych.
-F, --fixed-stringsInterpretuje PATTERN jako listę stałych ciągów oddzielonych nowymi wierszami.
--Pamięć podręcznaUżyj pamięci podręcznej dla renderowanego tekstu, aby przyspieszyć działanie na dużych plikach.
-P, --perl-wyrażenie regularneInterpretuje PATTERN jako wyrażenie regularne zgodne z Perlem (PCRE).
-H, --z-nazwa-plikuWydrukuj nazwę pliku dla każdego dopasowania.
-h, --no-plikuPomija przedrostek nazwy pliku w danych wyjściowych.
-n, --numer-stronyPoprzedź każde dopasowanie numerem strony, na której znaleziono wyszukiwane hasło.
-c, --countPomija normalne wyjście i zamiast tego drukuje liczbę dopasowań dla każdego pliku wejściowego.
-p, --liczba stronWydrukuj liczbę dopasowań na stronie. Implikuje -n.
--KolorUmożliwia podświetlanie nazw plików, numerów stron i dopasowywanie tekstu do różnych sekwencji, aby wyświetlić je w kolorze w terminalu, niektóre z jego opcji to Zawsze, nape lub automatyczne.
-o, --tylko-pasująceWydrukuj tylko pasującą część linii bez otaczającego kontekstu.
-r, --rekurencyjnePozwala nam rekursywnie przeszukiwać wszystkie pliki (z ograniczeniami --include i --exclude) w każdym katalogu, podążając za dowiązaniami symbolicznymi tylko wtedy, gdy znajdują się one w wierszu poleceń.
-R, --rekurencyjne-odwołanieTo samo co -r, ale podąża za wszystkimi dowiązaniami symbolicznymi.
-cicho lub -qPozwala nam wyjść z aplikacji.
Dzięki temu pdfgrep staje się idealnym rozwiązaniem podczas pracy z plikami PDF w środowiskach Linux.