Getting Digital

Spark y Python con PySpark en AWS para Big Data

Develop essential programming & development skills with expert instruction and practical examples.

Online Course
Self-paced learning
Flexible Schedule
Learn at your pace
Expert Instructor
Industry professional
Certificate
Upon completion
What You'll Learn
Master the fundamentals of programming & development
Apply best practices and industry standards
Build practical projects to demonstrate your skills
Understand advanced concepts and techniques

Skills you'll gain:

Professional SkillsBest PracticesIndustry StandardsPythonAWS
Prerequisites & Target Audience

Skill Level

IntermediateSome prior knowledge recommended

Requirements

Basic understanding of programming & development
Enthusiasm to learn
Access to necessary software/tools
Commitment to practice

Who This Course Is For

Professionals working in programming & development
Students and career changers
Freelancers and consultants
Anyone looking to improve their skills
Course Information

About This Course

* Este curso es parte del Data Engineering Bootcamp de Datademia. Visita nuestra web para más información. Hola y bienvenidos a este curso de Spark y Python con PySpark.

En este curso aprenderás lo que es la computación paralela utilizando Spark y Python con PySpark en un Jupyter notebook que corre en AWS (Amazon Web Services). Spark es un framework de programación para datos distribuidos y es de los más utilizados para el Big Data hoy en día. En este curso aprenderás a trabajar con Spark y sus RDDs, con Spark SQL y sus DataFrames y aprenderás la sintaxis básica de Spark ML, para algoritmos de aprendizaje automático o Machine Learning.

Este curso está diseñado para cualquier persona que quiera empezar a meterse en el mundo del big data con Spark y Python. Es un curso totalmente práctico y dinámico en el que empezarás desde cero con Spark. Empezaremos con una introducción al big data, a la computación paralela y a Apache Spark.

Luego os llevaremos paso a paso para crear una cuenta de AWS, crear una máquina virtual utilizando el sistema de computación EC2 y configurar todo lo necesario para poder utilizar Spark y Jupyter Notebooks en AWS. En las primeras partes del curso trabajaremos con Spark y su formato RDD (Resilient Distributed Datasets o Datos Distribuidos Resilientes). Luego trabajaremos con Spark SQL y sus DataFrames y acabaremos aprendiendo a implementar un algoritmos de regresión lineal en Spark ML.

Provider
Udemy
Estimated Duration
10-20 hours
Language
English
Category
Technology & Programming

Topics Covered

Programming & DevelopmentPythonAws

Course Details

Format
Online, Self-Paced
Access
Lifetime
Certificate
Upon Completion
Support
Q&A Forum
Course Details
Ready to get started?

View pricing and check out the reviews. See what other learners had to say about the course.

Get started and enroll now
Money-back guarantee might be available
Join thousands of students

This course includes:

Lifetime access to course content
Access on mobile and desktop
Certificate of completion
Downloadable resources

Not sure if this is right for you?

Browse More Programming & Development Courses

Continue Your Learning Journey

Explore more Programming & Development courses to deepen your skills and advance your expertise.

Unlock the power of Java programming with our comprehensive "Java Masterclass: The Complete Guide" course. Designed for ...
This course is designed to equip participants with the essential skills for building modern web applications.Throughout ...