Bazy danych są podstawowym elementem pracy z dużymi ilościami danych ze względu na ich dynamikę, hierarchię, ustawienia parametrów i prostotę zarządzania.
Dziś mamy możliwość wyboru różnych baz danych, takich jak MySQL, MariaDB itp., a każda z nich ma swoje zalety i ustawienia w oparciu o liczbę użytkowników i parametry do pracy, ale dzisiaj porozmawiamy w szczególności o jednej o nazwie Cassandra la co może być bardzo przydatne podczas pracy z bazą danych i do tego użyjemy CentOS 7.
Co to jest CassandraCassandra to baza danych typu open source zaprojektowana z myślą o skalowalności i wysokiej dostępności bez obniżania ogólnej wydajności systemu.
Cassandra ma takie czynniki, jak liniowa skalowalność i odporność na awarie w podstawowym sprzęcie lub infrastrukturze chmury, co czyni ją idealną platformą dla danych o znaczeniu krytycznym. Obsługa replikacji Cassandra w wielu centrach danych jest najlepsza w swojej klasie, zapewniając użytkownikom mniejsze opóźnienia przy jednoczesnej poprawie ogólnego poziomu wydajności.
Cassandra to baza danych, która obsługuje replikację lokalną i replikację wielu centrów danych w celu zapewnienia nadmiarowości, przełączania awaryjnego i odzyskiwania po awarii.
Cechy CassandraNiektóre z jego cech to:
- Dostępność: Baza danych Cassandra jest znana ze swojej niezawodności do tego stopnia, że jest używana przez ponad 1000 firm na całym świecie, wśród których możemy wyróżnić Instagram, GitHub, Netflix, dzięki którym możemy z pełnym zaufaniem korzystać z Cassandry.
- Odporność na awarie: krytycznym punktem w każdej bazie danych jest dostępność informacji i pod tym względem Cassandra ma szeroką odporność na awarie, na które wszyscy jesteśmy narażeni, ponieważ pozwala, aby wszystkie przechowywane w niej dane miały możliwość automatycznego replikowane w innych węzłach, gwarantując zarówno ich integralność, jak i dostępność. Dodatkowo, gdy w węźle wystąpi jakiś błąd, można go wymienić bez konieczności wyłączania bazy danych, co wpływa na funkcjonalność i produktywność użytkowników.
- Wydajność: Punktem na korzyść Cassandry jest jej wysoka wydajność, dzięki której możliwe jest wejście na wyższy poziom niż znane już platformy NoSQL zarówno na poziomie zarządzania, jak i aplikacji.
- Zdecentralizowany: Kolejną cechą wyróżniającą Cassandrę jest jej zdecentralizowana administracja, dzięki której każdy węzeł zaangażowany w bazę danych jest unikalny, co pozwala uniknąć ogromnych awarii.
- Skalowalność: Punktem do rozważenia w bazie danych jest jej skalowalność, ponieważ pozwala to, że wraz z rozwojem firmy baza danych nie jest ograniczona w swoim działaniu, dlatego Cassandra jest jedną z najlepszych opcji. Ponieważ, zgodnie z jej statystykami, ma zdolność obsługi do ponad 2000 węzłów, ponad 400 TB danych i około 1 miliarda lub więcej żądań dziennie, co zapewnia jej szeroki zasięg.
- Trwałość: Innym aspektem, który należy wziąć pod uwagę przy wyborze bazy danych do pracy, jest jej trwałość, co oznacza, że baza danych musi mieć możliwość zapewnienia dostępności krytycznych danych, niezależnie od rodzaju awarii. optymalne i poprawne zarządzanie wszystkimi przechowywanymi tam danymi.
- Opcje kontroli: Dzięki bazie Cassandra mamy różne opcje administracyjne, takie jak replikacja synchroniczna lub asynchroniczna, w przypadku korzystania z opcji zarządzania asynchronicznego będziemy mieli bazę danych obsługującą dodatkowe funkcje, takie jak Hinted Handoff i Read Repair, aby rozszerzyć jej możliwości użytkowe.
1. Zaktualizuj system i zainstaluj Javę na CentOS 7
Krok 1
Pierwszym krokiem, jaki należy wykonać, jest aktualizacja systemu operacyjnego, można to zrobić, wykonując następujące polecenie:
sudo mniam aktualizacja -yKrok 2
Cassandra jest napisana w Javie, więc konieczne będzie zainstalowanie Javy na CentOS 7 poprzez wykonanie następującego polecenia:
sudo mniam zainstaluj java -y
Krok 3
Zainstalowaną wersję Javy możemy sprawdzić, wykonując następujące polecenie:
sudo java - wersja
2. Zainstaluj Cassandrę na CentOS 7
Krok 1
Domyślnie baza danych Cassandra nie jest dostępna w domyślnym repozytorium CentOS 7 z tego powodu konieczne będzie dodanie oficjalnych repozytoriów Apache Software Foundation do CentOS 7, a osiąga się to poprzez utworzenie pliku cassandra.repo wewnątrz katalogu /etc/mniam.repos.d następująco:
sudo nano /etc/yum.repos.d/cassandra.repoKrok 2
W tym nowo utworzonym pliku dodamy:
[cassandra] name = DataStax Repo dla Apache Cassandra baseurl = http://rpm.datastax.com/community enabled = 1 gpgcheck = 0
Krok 3
Zmiany zapisujemy za pomocą kombinacji klawiszy
Ctrl + O
i wychodzimy z edytora za pomocą klawiszy
Ctrl + X
Krok 4
Teraz konieczne będzie zaktualizowanie pakietów w repozytorium poprzez wykonanie następujących czynności:
sudo mniam aktualizacja -yKrok 5
Teraz możemy zainstalować Cassandrę, wykonując następujące polecenie:
sudo mniam zainstaluj dsc20 -y
POWIĘKSZAĆ
Krok 6
Po pobraniu i zainstalowaniu zobaczymy:
POWIĘKSZAĆ
Krok 7
Po zainstalowaniu Cassandry przystępujemy do wykonywania następujących poleceń:
sudo systemctl start cassandra (Uruchom usługę Cassandra) sudo systemctl enable cassandra (Włącz usługę Cassandra podczas uruchamiania systemu)
POWIĘKSZAĆ
Krok 8
Na koniec możemy zobaczyć status Cassandry, wykonując następujące polecenie:
sudo systemctl status cassandra
POWIĘKSZAĆ
3. Połącz i zweryfikuj klaster Cassandra na CentOS 7
Krok 1
W tym momencie Cassandra działa, więc zamierzamy zweryfikować i połączyć klaster Cassandra, w tym celu przede wszystkim zweryfikujemy stan klastra Cassandra za pomocą następującego polecenia:
stan sudo nodetool
Krok 2
Widzimy, że stan połączenia klastra jest poprawny. W tym momencie Solvetic chce dodać punkt rozwiązania, ponieważ w wielu przypadkach podczas wykonywania tego polecenia wyświetlany jest następujący błąd:
Błąd: Nie udało się połączyć z „127.0.0.1:7199”: Połączenie odrzucone (Cassandra)Krok 3
Aby rozwiązać ten błąd i uzyskać prawidłowy dostęp, musimy przejść do następującego katalogu za pomocą żądanego edytora:
sudo nano /etc/cassandra/default.conf/cassandra-env.shKrok 4
Tam musimy zlokalizować następującą linię:
JVM_OPTS = "$ JVM_OPTS -Djava.rmi.server.hostname =Krok 5
Wygląd powinien być podobny do poniższego tekstu:
# dodaj to, jeśli masz problemy z połączeniem: # JVM_OPTS = ”$ JVM_OPTS -Djava.rmi.server.hostname =”Krok 6
Tam musimy odkomentować drugą linię i zastąpić linię z nazwą publiczną adresem IP 127.0.0.1:
Krok 7
Zmiany zapisujemy za pomocą następującej kombinacji klawiszy:
Ctrl + O
Edytor opuszczamy za pomocą:
Ctrl + X
Krok 8
Przechodzimy do ponownego uruchomienia usługi, wykonując następujące czynności:
systemctl restart cassandraKrok 9
W niektórych przypadkach zalecane jest ponowne uruchomienie komputera, w ten sposób naprawimy ten błąd.
Teraz możemy połączyć się z klastrem Cassandra, wykonując następujące polecenie:
cqlsh
Krok 10
Widzimy odpowiednie połączenie, aby rozpocząć pracę z tą bazą danych. Aby wyjść, użyjemy terminu
WyjścieW ten sposób widzieliśmy, jak zainstalować i uzyskać dostęp do Cassandry w CentOS 7.