Расширенная аналитика с PySpark. Практические примеры анализа больших наборов данных с использованием Python и Spark

Книга посвящена практическим методам анализа больших объемов данных с использованием языка Python и фреймворка Spark, она знакомит с моделью программирования Spark и основами системы с открытым исходным кодом PySpark. Каждая глава описывает отдельный аспект анализа данных, показаны основы обработки данных в PySpark и Python на примере очистки данных, подробно освещается машинное обучение с помощью Spark. Книга поможет читателю понять, как устроен и работает весь конвейер PySpark для комплексной аналитики больших наборов данных: от создания и оценки моделей до очистки, предварительной обработки и исследования данных с особым акцентом на производственные приложения. Отдельные главы посвящены обработке изображений и библиотеке Spark NLP.
- Авторы:Джош Уиллс, Акаш Тандон, Сэнди Райза, Ури Ласерсон, Шон Оуэн
- Жанр:Разное
- Страницы: 223
- Формат: mp3, fb2, epub, pdf, txt
Советуем прочитать похожую литературу

Прямой эфир
Все искушения обратной стороны телеэкрана: амбиции, зависть, риск, секс, ложь, видео, правда и...

Река
Эта история рассказывает о людях, чьи жизненные пути сошлись в поисках счастья – полумифического...

Кружение времени
История любви двух молодых людей, проходящих сквозь тернии жизни, к счастью, но, увы, с...

Неразменный пятак
Бежим мы по жизни – торопимся! Так много всего хочется получить. Кому профессию, кому должность,...

Грэт – жизнь бесконечна
Сквозь миры едина сущность, Сквозь пространства бытия, Сквозь свечение и тусклость Неизменчива...

Реанимация
30-летний Роман любит жену и дочку, но его семейную жизнь нельзя назвать счастливой. Всё портит...
Отзывы (0)
Вам понравилось читать онлайн книгу «Расширенная аналитика с PySpark. Практические примеры анализа больших наборов данных с использованием Python и Spark»? Уделите пару минут, что бы оставить полезный отзыв другому читателю.