Jak wyodrębnić tekst z pliku PDF w macOS Sierra

Spisie treści

Jednym z najczęściej używanych obecnie formatów przesyłania informacji jest PDF (Portable Document Format - Portable Document Format), który został opracowany przez firmę Adobe i oferuje nam liczne korzyści, takie jak:

  • Większe bezpieczeństwo dokumentów
  • Zmniejszenie oryginalnego rozmiaru
  • Kompatybilność z wieloma urządzeniami
  • Zachowuje m.in. integralność przechowywanych danych.

Chodzi o to, że w pewnych momentach i z wielu powodów musimy wyłącznie wyodrębnić treść tekstu z pliku PDF bez dołączania innych elementów, takich jak obrazy czy podpisy.

Solvetic przeanalizuje, jak łatwo wykonać ten proces w macOS Sierra bez uciekania się do dodatkowych narzędzi.

Krok 1
Otwieranie dokumentu: Pierwszym krokiem, jaki należy wykonać, jest otwarcie dokumentu PDF przechowywanego lokalnie w systemie macOS Sierra, co zostanie wykonane automatycznie za pomocą narzędzia Podgląd:

Ważne jest, aby wyjaśnić, że jeśli użyjemy różnych narzędzi, takich jak Adobe Reader, plik PDF zostanie otwarty za pomocą tego narzędzia.

Krok 2
Zaznaczanie tekstu: Teraz przechodzimy do kopiowania informacji z pliku PDF, co zwykle robimy za pomocą myszy, ale jeśli mamy kilka plików PDF, będzie to czasochłonne zadanie.

Możemy użyć jednej z następujących metod, aby ten proces był znacznie bardziej wydajny:

  • Przejdź do menu Edycja i wybierz opcję Zaznacz wszystko
  • Użyj kombinacji klawiszy ⌘ + A
.

Po wybraniu tej opcji zobaczymy zaznaczony tekst:

Krok 3
Skopiuj i wklej zawartość: Po wybraniu tekstu w pliku PDF przystępujemy do jego kopiowania, korzystając z jednej z poniższych opcji.

Skopiuj tekst PDF

  • Przejdź do menu Edycja i tam wybierz Kopiuj
  • Użyj kombinacji klawiszy ⌘ + C

Gdy będziemy mieć te informacje w schowku, otworzymy aplikację TextEdit za pomocą dowolnej z następujących opcji

  • Wpisz tekst słowa w Spotlight i wybierz TextEdit
  • Przejdź do ścieżki idź / Aplikacje i tam wybierz TextEdit

Wyświetlone zostanie następujące okno. Tam wybieramy przycisk Nowy dokument.

Krok 4
W nowym oknie przechodzimy do menu Format i tam wybieramy opcję Konwertuj na zwykły tekst lub możemy użyć kombinacji klawiszy ⇧ + ⌘ + T. Wynik będzie następujący:

Dzięki tej prostej metodzie możemy łatwo wyodrębnić tekst z niezbędnych plików PDF.

wave wave wave wave wave