Wprowadzenie do programowania statystycznego z R

Spisie treści
r jest językiem programowania statystycznego, jest darmowy i open source. Wykorzystywany jest głównie do operacji eksploracja danych czy statystyki, wszystko to w celu stworzenia aplikacji do analizy dużych ilości danych.
Interfejs wiersza poleceń r Na początku może to być nieco onieśmielające, ale jest to przyćmione po docenieniu mocy i możliwości, jakie oferuje nam język, aby dzielić się i odtwarzać analizę informacji.
r Można go pobrać za darmo na wszystkie istniejące obecnie bezpłatne platformy, mamy możliwość zainstalowania go w Okna, Linux i nawet Prochowiec.
Na potrzeby tego samouczka użyjemy wersji dla Okna które możemy znaleźć na oficjalnej stronie projektu pod poniższym linkiem. Po pobraniu i zainstalowaniu będziemy mieli naszą funkcjonalną kopię r, jeśli to wykonamy, pojawi się ekran początkowy r który powinien wyglądać tak:

r Pozwala nam na szybką i efektywną pracę z danymi, jednak jego domyślny interfejs nie jest idealny do tego zadania. Jednym z problemów jest to, że wszystko otwiera się w osobnych oknach, co utrudnia pracę, a interfejs wiersza poleceń nie jest taki sam we wszystkich systemach operacyjnych.
Chociaż istnieje wiele interfejsów do rozwiązania tego problemu, w tym samouczku użyjemy RStudio który jest dostępny na wszystkie platformy, ale należy wspomnieć, że jest to konieczne r zainstalowany przed instalacją, aby uzyskać wersję Okna przechodzimy do poniższego linku i pobieramy odpowiednią wersję.
Po instalacji wykonujemy RStudio i powinniśmy zobaczyć główny interfejs:

RStudio daje nam organizację wszystkich okien r w ramach jednego panelu i dodatkowo daje nam dostęp do funkcji, które mogą być trudne do znalezienia, oprócz tego możemy wymienić inne dodatkowe zalety:
  • Podzielmy naszą pracę na Projektowanie gdzie każdy z nich będzie miał swój katalog roboczy, historię i pliki źródłowe.
  • Integracja z GitHub.
  • Pozwala na graficzne przechowywanie historii.
  • Możesz eksportować grafikę w różnych formatach i rozmiarach.
  • Pozwala nam uzupełnić kod kluczem tabelarycznym.
  • Dzięki określonym pakietom możesz tworzyć interaktywne wykresy.
Jak widzimy RStudio to całkiem optymalny sposób pracy rNa rynku istnieją jednak inne rozwiązania, każda osoba musi je zbadać i ocenić, czy są lepiej dostosowane do potrzeb każdej osoby.
Istnieje kilka sposobów pracy z r gdzie pierwszą rzeczą, którą zajmiemy się, jest Konsola RPomimo tego, że nie możemy tutaj przechowywać wykonanej pracy, warto przetestować niektóre funkcje i zacząć zapoznawać się z językiem.
Praca z konsolą jest dość prosta, wpisujemy polecenie, a następnie R podaje nam jego wynik, spróbujmy prostej operacji dodawania, takiej jak:
> 10 + 7

Pchamy Wchodzić i automatycznie r W poniższym wierszu daje nam odpowiedź na naszą operację:

Jak widać na obrazku pierwsza linia zawiera polecenie z naszą operacją, należy o tym wspomnieć r nie wymaga używania średnika do zakończenia linii ani żadnego innego operatora kończącego. Widzimy w drugim wierszu przed odpowiedzią [1] wskazuje to, w jaki sposób r wykonuje operacje arytmetyczne i używa wektor, jeden oznacza indeks pierwszego elementu wektora, gdzie możemy zaznaczyć, że wiele innych języków obsługuje indeksy od podstaw, ale r robi to od jednego.
Jak wspomnieliśmy wcześniej, konsola jest dość użyteczna, ale nie najlepiej się z nią pracuje, głównie dlatego, że nie ma możliwości przechowywania naszych poleceń i możliwości wpisywania tylko jednej komendy na raz, coś podobnego dzieje się z Pyton, ale nie powinniśmy się martwić, ponieważ RStudio daje nam okno skryptu znajduje się w górnej części naszej konsoli, jeśli go nie znajdziemy, idziemy do Plik> Nowy plik> Skrypt R lub naciśnij Shift + Polecenie + N.
Zasadniczo skrypt R to zwykły tekst z rozszerzeniem .R. Aby zobaczyć, jak to działa, możemy odtworzyć naszą operację arytmetyczną z poprzedniego przykładu, tworząc nowy skrypt i dodając kilka dodatkowych wierszy poleceń, zobaczmy:
 10 + 7 1:50 wydruk ("Witaj świecie") 

A Skrypt R możesz biegać linia po linii za pomocą opcji, którą mamy w górnym menu o nazwie Uruchomić i zobaczymy wynik tego samego w konsoli, zobaczmy odpowiedź dla każdej linii naszego skryptu:

Jak widzimy, pierwsza linia daje nam wynik, który uzyskaliśmy wcześniej, druga linia tworzy listę liczb od 1 do 50, gdzie liczba w nawiasie jest pierwszym indeksem dla tej linii i na koniec mamy wrażenie klasycznego Witaj świecie.
Po zapoznaniu się ze sposobami, w jakie możemy pracować z językiem, przejdziemy do bardziej teoretycznych koncepcji, aby lepiej zrozumieć, co mamy dostępne w języku do pracy i realizacji naszych projektów.
Jak we wszystkich językach programowania, zmienne są jednym z najważniejszych aspektów, aby je tworzyć w r Wystarczy wpisać jego nazwę bez definiowania typu. Używamy operator przypisania aby nadać wartość zmiennej.
WażnyMożemy przypisać wartość zmiennej ze znakiem równości, ale jest to zła praktyka w r, aby dokonać prawidłowego przypisania, użyj operatora <-.
Zobaczmy, jak wygląda przypisanie wartości do zmiennej, a następnie jej wydrukowanie:
 x <- 58 x 

Możemy również przypisać kilka wartości naszym zmiennym za pomocą funkcji concatenate:
y <- c (5, 2, 11, 28, 17)

Jeśli uruchomimy przykład, zobaczymy w prawym panelu, jak mamy wartość x oraz lista numeryczna przypisana do Tak:

POWIĘKSZAĆ

Dodatkowo, aby wyeliminować zmienną z obszaru roboczego, wystarczy użyć funkcji rm, możemy nawet posprzątać cały obszar roboczy, zobaczmy, jak to zrobimy:
 rm (x) rm (lista = ls ()) 

W pierwszym wierszu eliminujemy zmienną, a w drugim wszystkie spacje.
W języku mamy cztery struktury danych, które są rozpoznawane przez r:
Kreskówka wektorWektor to tablica jednowymiarowa, w której wszystkie dane w niej obecne muszą być tego samego typu, liczba całkowita, znak itp., dodatkowo należy pamiętać, że jest to podstawowy obiekt danych w r.
Tablice i macierzeMacierz jest podobna do wektora, w którym dane muszą być tego samego typu, jednak macierz ma dwa wymiary, a informacje są zorganizowane w wiersze i kolumny. Tablica jest podobna do tablicy, ale może mieć więcej niż dwa wymiary.
Ramki danychRamki danych to zbiór wektorów o tej samej długości, jest podobny do macierzy, ale osobliwością tego typu struktury jest to, że mogą być mieszanymi typami danych, gdzie wektory mogą mieć nawet nazwy.
ListyNajbardziej ogólny typ struktury w R, lista to zbiór elementów dowolnej klasy, długości lub struktury, możemy nawet mieć inne listy.
Dalej, r Posiada kilka funkcji, które pozwalają nam przekonwertować jeden typ struktury na inny, zobaczmy:
as.wektor ()Ta funkcja umożliwia konwersję macierzy do wektorów jednowymiarowych.
as.matryca ()Struktury danych można konwertować na tablicę.
jako.ramka.danych ()Struktury danych można konwertować na ramki danych.
jako.lista ()Struktury danych można konwertować na listy.
Jedna z mocnych stron r jest to, że możesz dodawać pakiety, które pozwalają nam rozszerzać funkcjonalności języka. W innych językach te wtyczki są dostępne w bibliotekach, ale w R biblioteka jest miejscem, w którym przechowywane są wszystkie pakiety.
ten pakiety z r mogą pochodzić z dwóch różnych miejsc, niektóre pochodzą z r domyślnie, ale nie są aktywne, a inne można znaleźć w repozytoriach online.
Aby zobaczyć pakiety, które są aktualnie zainstalowane lub załadowane, możemy wykonać następujące funkcje:
 biblioteka () szukaj () 

Funkcja Biblioteka () przynosi nam listę pakietów, które są aktualnie zainstalowane, zobaczmy część tego, co rzuca na nas, gdy wykonujemy ten wiersz:

Funkcja Szukaj () Z drugiej strony pokazuje nam za pomocą konsoli pakiety, które są aktualnie załadowane, zobaczmy na poniższym obrazku, które pakiety załadowaliśmy:

Dodatkowo, aby zainstalować pakiety, możemy to zrobić na kilka sposobów, pierwszy to opcja w górnym menu Narzędzia> Zainstaluj pakiety a potem mamy za pomocą funkcji języka, ten drugi jest tym, który zalecamy, ponieważ może być częścią naszego skryptu.
Aby zainstalować pakiet, którego używamy install.packages, po tym musimy to uwzględnić, możemy użyć Biblioteka lub wymagać Do tego jednak najlepiej skorzystać z tego ostatniego, aby uniknąć pomyłek z zakresem funkcji, zobaczmy jak instalujemy i dołączamy pakiet ggplot2:
 install.packages ("ggplot2") wymagają ("ggplot2") 

Wreszcie, aby usunąć pakiet, którego możemy użyć usuń.pakiety, zobaczmy, jak jest używany:
usuń.pakiety ("ggplot2")

Na tym kończymy ten samouczek, z którym już mamy pojęcie o tym, jak pracować r, oprócz wyjaśnionych punktów, takich jak zmienne i struktury danych, niezbędne aspekty, które musimy znać, aby w pełni wykorzystać ten potężny i skuteczny język.Podobał Ci się i pomógł ten samouczek?Możesz nagrodzić autora, naciskając ten przycisk, aby dać mu pozytywny punkt
wave wave wave wave wave