Pdfgrep Polecenia do wyszukiwania plików PDF Terminal Linux

Systemy operacyjne oparte są na wierszach poleceń, które oferują nam wiele opcji zwiększania możliwości dystrybucji poprzez możliwość wykonywania wyszukiwań, działań administracyjnych, wsparcia i wielu innych.

Dokładnie jedna z tych opcji wiąże się z możliwością wyszukiwania określonych typów plików w Linuksie, a tym samym łatwego dostępu do ich zawartości i dlatego dzisiaj porozmawiamy o pdfgrep, który koncentruje się na wyszukiwaniu plików PDF.

Co to jest pdfgrepPdfgrep to narzędzie wiersza poleceń do wyszukiwania tekstu w plikach PDF w prosty i funkcjonalny sposób, oszczędzając nam czasu na dostęp do każdego pliku i wyszukiwanie tekstu za pomocą narzędzi PDF.
Niektóre z jego cech to:

  • Kompatybilny z Grepem, możemy wykonać wiele parametrów grep, takich jak -r, -i, -n lub -c.
  • Możliwość wyszukiwania tekstu w wielu plikach PDF
  • Polecane kolory, ta opcja koloru GNU Grep jest domyślnie obsługiwana i włączona.
  • Obsługuje użycie wyrażeń regularnych.
  • Darmowe oprogramowanie

1. Zainstaluj Pdfgrep w systemie Linux

Krok 1
W tym przypadku użyjemy Ubuntu, dla którego wystarczy wykonać następującą linię. Tam wpisujemy literę S, aby zaakceptować pobranie i instalację pakietów.

 sudo apt zainstaluj pdfgrep

Krok 2
Inne opcje instalacji to:

  • Pobierz plik .TAR.GZ pod poniższym linkiem.

Krok 3

  • Lub uruchom następujące polecenie:
 klon git https://gitlab.com/pdfgrep/pdfgrep.git
Krok 4
Następnie wprowadź każdy z następujących wierszy w ich kolejności:
 ./configure make sudo make install

2. Użyj Pdfgrep w systemie Linux

Krok 1
Po zainstalowaniu pdfgrep będzie to składnia do użycia:

 pdfgrep [OPCJA…] WZÓR [PLIK]
Krok 2
Każdy z elementów to:
  • Opcja: wskazuje atrybuty, które możemy dodać w wyszukiwaniu, na przykład -i lub --ignoruj-przypadek, które ignorują rozróżnienie wielkich i małych liter między wskazanym przez nas wzorcem a tym, który musi pasować do pliku.
  • Wzorzec: wskazuje rozszerzone wyrażenie regularne.
  • Plik: jest to plik PDF, w którym należy przeprowadzić wyszukiwanie.

Krok 3
Zaczniemy od prostego wyszukiwania, na przykład poszukamy słowa Solvetic w pliku Solvetic.pdf, w tym celu wykonujemy:

 pdfgrep Solvetic Solvetic.pdf

POWIĘKSZAĆ

Krok 4
W tym przypadku termin ten istnieje tylko raz we wspomnianym pliku, ale teraz poszukamy terminu Windows w oficjalnym pliku Microsoft PDF i będzie to wynik, który zobaczymy:

POWIĘKSZAĆ

Krok 5
Widzimy, że wyszukiwane słowo jest podświetlone, co ułatwia jego lokalizację. Teraz, jeśli dodamy parametr -w, Będzie można zobaczyć wyniki z numerem strony, na której wykryto ten termin:

POWIĘKSZAĆ

Krok 6
Inną opcją, której możemy użyć z pdfgrep, jest wyświetlenie listy plików PDF zawierających określony termin, w tym celu wykonujemy następujące czynności:

 pdfgrep Solvetic * pdf
Krok 7
W ten sposób plik PDF zawierający termin Solvetic zostanie wyświetlony:

POWIĘKSZAĆ

Krok 8
Jeśli chcemy otworzyć plik PDF, możemy wykonać następujące polecenie:

 xdg-open (Plik.PDF)

POWIĘKSZAĆ

Krok 9
Ogólne opcje, które oferuje nam pdfgrep to:

-i, --ignore-caseIgnoruj ​​rozróżnienie wielkości liter zarówno w plikach źródłowych, jak i wejściowych.

-F, --fixed-stringsInterpretuje PATTERN jako listę stałych ciągów oddzielonych nowymi wierszami.

--Pamięć podręcznaUżyj pamięci podręcznej dla renderowanego tekstu, aby przyspieszyć działanie na dużych plikach.

-P, --perl-wyrażenie regularneInterpretuje PATTERN jako wyrażenie regularne zgodne z Perlem (PCRE).

-H, --z-nazwa-plikuWydrukuj nazwę pliku dla każdego dopasowania.

-h, --no-plikuPomija przedrostek nazwy pliku w danych wyjściowych.

-n, --numer-stronyPoprzedź każde dopasowanie numerem strony, na której znaleziono wyszukiwane hasło.

-c, --countPomija normalne wyjście i zamiast tego drukuje liczbę dopasowań dla każdego pliku wejściowego.

-p, --liczba stronWydrukuj liczbę dopasowań na stronie. Implikuje -n.

--KolorUmożliwia podświetlanie nazw plików, numerów stron i dopasowywanie tekstu do różnych sekwencji, aby wyświetlić je w kolorze w terminalu, niektóre z jego opcji to Zawsze, nape lub automatyczne.

-o, --tylko-pasująceWydrukuj tylko pasującą część linii bez otaczającego kontekstu.

-r, --rekurencyjnePozwala nam rekursywnie przeszukiwać wszystkie pliki (z ograniczeniami --include i --exclude) w każdym katalogu, podążając za dowiązaniami symbolicznymi tylko wtedy, gdy znajdują się one w wierszu poleceń.

-R, --rekurencyjne-odwołanieTo samo co -r, ale podąża za wszystkimi dowiązaniami symbolicznymi.

-cicho lub -qPozwala nam wyjść z aplikacji.

Dzięki temu pdfgrep staje się idealnym rozwiązaniem podczas pracy z plikami PDF w środowiskach Linux.

Będziesz pomóc w rozwoju serwisu, dzieląc stronę ze swoimi znajomymi

wave wave wave wave wave