Opis

Potrzeby w zakresie analizy dużych zbiorów danych i wyciągania z nich użytecznych informacji stale rosną. Spośród dostępnych narzędzi przeznaczonych do tych zastosowań szczególnie przydatny jest PySpark – interfejs API systemu Spark dla języka Python. Apache Spark świetnie się nadaje do analizy dużych zbiorów danych, a PySpark skutecznie ułatwia integrację Sparka ze specjalistycznymi narzędziami PyData. By jednak można było w pełni skorzystać z tych możliwości, konieczne jest zrozumienie interakcji między algorytmami, zbiorami danych i wzorcami używanymi w analizie danych.

Oto praktyczny przewodnik po wersji 3.0 systemu Spark, metodach statystycznych i rzeczywistych zbiorach danych. Omówiono w nim zasady rozwiązywania problemów analitycznych za pomocą interfejsu PySpark, z wykorzystaniem dobrych praktyk programowania w systemie Spark. Po lekturze można bezproblemowo zagłębić się we wzorce analityczne oparte na popularnych technikach przetwarzania danych, takich jak klasyfikacja, grupowanie, filtrowanie i wykrywanie anomalii, stosowane w genomice, bezpieczeństwie systemów IT i finansach. Dodatkowym plusem są opisy wykorzystania przetwarzania obrazów i języka naturalnego. Zaletą jest też szereg rzeczywistych przykładów dużych zbiorów danych i ich zaawansowanej analizy.

Informacje dodatkowe

Waga	0,33 kg
ISBN	978-83-832-2069-7
Data premiery	2023-03-07
Autor	Opracowanie zbiorowe
Wydawnictwo	Helion
Rok wydania	2023
Oprawa	Miękka
Liczba stron	192
Wydanie	1
Rodzaj	Książki
Głębokość	10.000000
Kategoria wiekowa	+

Zaawansowana analiza danych w PySpark. Metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark

Opis

Opis

Informacje dodatkowe

Informacje dodatkowe

Szybkie linki

Ważne informacje

+31 644 922 687

Zaawansowana analiza danych w PySpark. Metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark

Opis

Opis

Informacje dodatkowe

Informacje dodatkowe

Podobne produkty

Nauka programowania opartego na testach. Jak pisać przejrzysty kod w kilku językach programowania

Visual Studio 2022. Wprowadzenie do .NET MAUI

Niepodważalne. Jak biologia potwierdza naszą intuicję, że życie jest zaprojektowane

SQL dla analityków danych. Tworzenie zbiorów danych dla początkujących

Szybkie linki

Ważne informacje

+31 644 922 687