Spisie treści
Kasandra to baza danych NoSQL potężny i skalowalny. Jest to oprogramowanie typu open source, a jego architektura została zaprojektowana jako system rozproszony, w którym wszystkie węzły są w nim takie same, co pozwala na dystrybucję danych we wszystkich węzłach w klastrze.Przechowywanie w Kasandra jest zdefiniowany jako kluczowa wartość gdzie klucz może być mapowany na jedną lub więcej wartości. Jest Baza danych zorientowany na rekordy wierszy, gdzie każdy wiersz jest identyfikowany przez swój klucz, a osobliwością tego systemu jest to, że wiersz może być przechowywany w więcej niż jednym węźle.
Przed przystąpieniem do instalacji Kasandra w naszym systemie musimy trochę wiedzieć o architekturze tego Baza danych, w ten sposób będziemy wiedzieć, co mamy i co możemy osiągnąć.
Kiedy mówimy o replikacji informacji, jednym z pierwszych pytań, jakie sobie zadajemy, jest: Ile kopii potrzebujemy? To w Cassandrze nie jest łatwe pytanie, ale musimy pamiętać, że ten czynnik wskazuje liczbę węzłów, które są przechowywane w tym samym wierszu.
Na przykład współczynnik replikacji równy 2 gwarantuje, że będą dwie kopie informacji o węzłach w klastrze. Wybranie wartości dwa dla współczynnika replikacji jest dobre, aby pokryć awarie w węźle w środowisku deweloperskim i może być minimum dla środowisk produkcyjnych, ponieważ jeśli jeden węzeł ulegnie awarii, drugi będzie obsługiwał wszystkie żądania, więc jest to coś, o czym musimy pomyśleć ostrożnie przed wdrożeniem.
Przestrzeń klawiszyKasandra pozwala nam pogrupować informacje w coś, co nazywa się spacje klawiszy, gdzie możemy powiedzieć, że te spacje klawiszy są to pojemniki na informacje o aplikacji. Klaster ma jednak jeden obszar kluczy na aplikację Kasandra Użyj tych spacje klawiszy do obsługi replikacji.
Rodzina kolumnPo zdefiniowaniu naszego spacja klawiszowa, w środku mamy coś o nazwie rodzina kolumn, są to podobne kontenery, ale dla kolekcji wierszy. Każdy wiersz jest uporządkowanym zbiorem kolumn i możemy dokonać analogii w odniesieniu do relacyjnych baz danych, gdzie rodzina kolumn są nieco podobne do tabel.
Strategia replikacjiw Kasandra Istnieją dwie strategie replikacji informacji, jedna z nich i ta, którą już omówiliśmy, to prosta strategia lub Prosta strategia który jest odpowiedzialny za kopiowanie informacji do następnego węzła do momentu spełnienia określonego współczynnika replikacji. Druga strategia nazywa się Strategia topologii sieci, gdzie jest to najlepsza opcja, jeśli chcemy dystrybuować informacje w wielu centrach danych.
Protokół używany przez Kasandra udostępnianie lokalizacji węzłów, a informacje o nich w klastrze nazywa się Plotki. Gdzie te węzły stale „mruczą” i wymieniają informacje z maksymalnie 3 węzłami w klastrze.
Ten protokół, podobnie jak inne, ma swoje reguły wysyłania żądań do innych węzłów, gdzie widzimy dla niego trzy kroki, a każdy węzeł zawsze powtarza te kroki:
1- Szmer do losowego aktywnego węzła.
2- Zainicjuj szmer w kierunku losowego węzła skierowanego w dół.
3- Ten krok jest opcjonalny i określa, że jeśli węzeł wybrany w kroku pierwszym nie jest węzłem początkowym, szemra do innego losowego węzła początkowego.
Ale aby przenieść informacje i nawiązać komunikację między węzłami Kasandra użyj komponentu o nazwie KapuśZobaczmy, co masz na myśli.
Zasadniczo ten komponent jest odpowiedzialny za zarządzanie ruchem informacji między węzłami, zabierając inne węzły do zapytań i replikację w oparciu o różne metryki. Ta konfiguracja jest taka sama dla wszystkich węzłów w klastrze, jednak może różnić się typem, zobaczmy, które mamy dostępne:
Prosty zniczWykorzystywane w prostych wdrożeniach w centrach danych oraz kapuś skonfigurowany w ten sposób nie wykorzystuje żadnych informacji z centrum danych. Jego zachowanie jest proste i polega na znalezieniu następnego węzła.
Dynamiczne snitchingTa konfiguracja monitoruje wydajność replik i wybiera najlepszą na podstawie prostej metryki, która ogranicza długie czasy odpowiedzi i pozwala uniknąć węzłów kompresujących informacje.
RackInferringSnitchTa konfiguracja wykorzystuje adres IP do określenia lokalizacji węzłów, gdzie ostatnia część adresu IP identyfikuje węzeł, druga szafy, a trzecia centra danych.
PropertyFileSnitchPozwala to na zdefiniowanie topologii klastra w pliku właściwości, generalnie ta konfiguracja jest używana, jeśli: RackInferringSnitch nie dotyczy.
PlotkowanieWłaściwośćPlikSnitchWykorzystuje plik właściwości do początkowej konfiguracji i kontynuuje szmer, aby wysyłać informacje do innych węzłów.
Instalacja Kasandra Zrobimy to w zespole z Windows 8, w którym musimy wcześniej spełnić określone wymagania, zobaczmy czego potrzebujemy:
1- Musimy mieć przynajmniej Jawa 7 zainstalowany w naszym systemie, jeśli go nie posiadamy, najnowszą wersję możemy pobrać w poniższym linku.
2- Potrzebujemy dodatkowo Pakiet redystrybucyjny Microsoft Visual C++ 2008 (x86).
3- Wreszcie połączenie z Internetem, aby pobrać pakiet DataStax.
Po sprawdzeniu naszych wymagań przejdziemy do strony projektu i poszukamy wersji 32- lub 64-bitowej, która pasuje do naszego systemu:
POWIĘKSZAĆ
Jeśli chcemy zajrzeć do dokumentacji łączności dla Kasandra Dzięki różnym językom programowania możemy przejść w dół strony i zobaczyć, czego potrzebujemy do tego samego. Po pobraniu instalujemy jak każdą aplikację Windows. Gdzie należy wspomnieć, że po tej instalacji, Kasandra domyślnie utworzy klaster testów.Wraz z instalacją w naszym systemie zostaje zainstalowanych kilka narzędzi, jednym z nich jest interfejs webowy Kasandra połączenie OpsCenter, do którego możemy wejść jeśli umieścimy w naszej przeglądarce adres:
http://localhost:8888/opscenter/index.htmlTen interfejs pozwala nam na zrobienie kilku ciekawych rzeczy, jednak nie jest on najbardziej optymalny do pracy Kasandra, ale na potrzeby tego samouczka ważne jest, aby go znać, zobaczyć, co nam oferuje, a tym samym mieć punkt wyjścia do poznania struktury Bazy Danych.
Pierwszą rzeczą, którą znajdujemy po wejściu do tego interfejsu, jest sekcja Panel, gdzie możemy wizualizować różne metryki wydajności, takie jak stan węzła, pojemność pamięci masowej lub żądania zapisu:
POWIĘKSZAĆ
W tym interfejsie możemy utworzyć nowy klaster, w tym celu przechodzimy do prawej górnej części i naciskamy Nowy klaster, co otworzy następujący ekran:Wprowadzamy żądane dane i klikamy zbuduj klaster, dodatkowo możemy dodać węzły równo w rozwijanym menu Działania klastrowe, w prawym górnym rogu. W dziale Nie dawaj, możemy zobaczyć dostępne węzły i centra danych, a także pewne parametry, takie jak stan, wielkość danych, a nawet wygenerowane alerty:
POWIĘKSZAĆ
W dziale Zajęcia Możemy zobaczyć listę czynności wykonywanych w klastrze, a także dziennik zdarzeń, coś całkiem przydatnego, gdy jesteśmy administratorami klastra Baza danych:POWIĘKSZAĆ
Następnie mamy najważniejszą sekcję w naszym interfejsie internetowym, a to jest Dane, tutaj możemy zdefiniować nasze kontenery informacyjne lepiej znane jako spacje klawiszy i "tabele" lub rodziny kolumn.Stworzyć spacja klawiszowa, najpierw musimy przejść do sekcji Dane i tam wybierz opcję Dodać, wprowadzamy nazwę, strategię replikacji, którą wyjaśniamy, że może to być topologia prosta lub sieciowa oraz współczynnik replikacji.
Zaoszczędziliśmy i już byśmy stworzyli nasze spacja klawiszowa, jak pamiętamy te pojemniki pełnią kluczową funkcję w Kasandra y ma zdefiniować współczynnik replikacji. Po zdefiniowaniu naszego kontenera dodamy rodzina kolumn, w tym celu wchodzimy w przestrzeń klawiszy i wybieramy opcję Dodać. Tutaj wpisujemy nazwę, typ kolumny i typ komparatora.
Dzięki temu stworzyliśmy już nasze rodzina kolumnJak widać, jest to niezwykle proste, jednak interfejs ten w wielu rzeczach nas ogranicza i jest tylko dobrym punktem wyjścia dla początkujących użytkowników, którzy chcą zrozumieć, jak wygląda struktura Kasandra i jak on sobie radzi klastry, węzły, przestrzenie kluczy i rodziny kolumn.
Na tym zakończyliśmy ten samouczek, w którym mogliśmy zobaczyć, jaka jest architektura Kasandra, jego protokół, komponenty i jego instalację. Dowiedzieliśmy się o strukturze za pośrednictwem interfejsu internetowego, ale dzięki temu dotknęliśmy tylko wierzchołka góry lodowej, w przyszłych samouczkach w pełni wprowadzimy CQL i jak pracować zawodowo Kasandra.