Wstęp
- Co to jest Hadoop?
- Współpraca SASa z Hadoopem
Dostęp do HDFS i uruchamianie aplikacji Hadoop z SASa
- Przegląd metod dostępnych w module SAS Base do współpracy z Hadoopem
- Czytanie i pisanie plików Hadoop z SAS Base
- Wykonywanie kodów MapReduce
- Wykonywanie kodów Pig za pomocą procedury HADOOP
Wykorzystanie mechanizmu SQL pass-through
- Mechanizm SQL pass-through
- Łączenie z bazą Hadoop Hive
- Zadawanie zapytań do tabel Hive
- Sprawdzanie metadanych tabel Hadoop Hive
- Tworzenie zapytań SQL pass-through
- Tworzenie i ładowanie tabel Hive za pomocą wyrażenia EXECUTE w SQL pass-through.
- Praca z danymi typu STRING
Wykorzystanie silnika SAS/ACCESS LIBNAME
- Definiowanie biblioteki do Hadoopa
- Używanie opcji zbiorów
- Tworzenie widoków
- Łączenie tabel
- Korzyści korzystania z biblioteki
- Wykorzystanie procedury HDMD do dostępu do danych tekstowych z separatorem, plików XML i innych formatów
- Wskazówki na temat wydajności do stosowania bibliotek SAS/ACCESS
- Kopiowanie danych z SASa do biblioteki Hive
Partycjonowanie i klasteryzacja tabel Hive
- Metody partycjonowania i klasteryzacji w Hadoopie
- Jak partycjonowanie i klasteryzacja mogą zwiększyć wydajność
- Tworzenie i ładowanie partycjonowanych i klasteryzowanych tabel Hive
SAS Viya, Hadoop i SAS Code Accelerator for Hadoop
- Ładowanie i zapisywanie tabel CAS w HDFS
- Wykonywanie wątków DS2 w Hadoopie do agregowania danych
- Wykorzystanie procedury HDMD do odczytu plików HDFS
Przegląd SAS In-Memory Analytics i SAS Code Accelerator for Hadoop (Self-Study)
- Wykorzystanie procedur high-performance i silnika SASHDAT
- Tworzenie sesji serwera SAS LASR Analytic Server
- Wykorzystanie silnika SASIOLA
- Wykonywanie wątków DS2 na Hadoopie
- Wykorzystanie procedury HDMD do dostępu do plików HDFS