Data Science Training

Aprende y certifícate en línea con este curso, convirtiéndote en experto en ciencia de datos.

Este curso te va a proporcionar un paquete completo de conocimientos, que te permitirán convertirte en un experto en ciencia de datos.

La capacitación se enfoca en brindarte un conocimiento profundo de la ciencia de datos directamente desde su uso y aplicaciones, computación estadística, manipulación de datos, visualización de datos, aplicación de estadísticas descriptivas e inferenciales sobre los datos, y mucho más. Además, también obtendrá conocimientos prácticos mediante la ejecución de proyectos en tiempo real proporcionando soluciones a los problemas. En pocas palabras, esta capacitación en línea sobre ciencia de datos te dará la confianza para enfrentar entrevistas y trabajar como científico de datos.

Características de este curso

  • 30 horas de formación dirigida por un instructor.
  • Paga en 2 cuotas.
  • Curso en inglés.
  • Certificación y asistencia laboral.
  • Horario flexible.
  • Soporte 24 x 7.

Ingresa tus datos para obtener un 10% de descuento en tu primer curso individual.

Curso de Data Science en línea

Contenido de este curso de Data Science

En este módulo, aprenderá los conceptos básicos de la ciencia de datos y la programación R, Importancia de la ciencia de datos.

Los temas de esta sección son: 

  • ¿Qué es la ciencia de datos?
  • Importancia de la ciencia de datos en el mundo actual.
  • Conceptos básicos de programación de R.

Resultados del aprendizaje: Al final de este módulo, obtendrá una idea fundamental sobre la ciencia de datos y la programación R.

  • Este módulo de los fundamentos de Python analiza los conceptos de Python necesarios para un científico de datos. Los temas que cubre esta sección son: 
    • Introducción a Python.
    • Sangrías en Python.
    • Tipos de datos y operadores de Python.
    • Funciones de Python.

    Resultados de aprendizaje: Al final de este módulo, obtendrá los conocimientos básicos de programación de Python.

Este módulo trata los conceptos básicos de estructuras de datos y visualización de datos.

Los temas cuque cubre esta sección son: 

  • Resumen de estructuras de datos.
  • Identificación de las estructuras de datos.
  • Asignar valores a las estructuras de datos.
  • Importancia de la manipulación de datos.
  • Dplyr Package y realizando diferentes operaciones de manipulación de datos.

Resultados de aprendizaje: Al completar este módulo, podrá comprender la importancia de las estructuras de datos y la manipulación de datos en la ciencia de datos.

Este módulo trata temas como visualización de datos, tipos de gráficos, paquete Ggplot2, creación de gráficos de barras, análisis univariante y multivariante.

Los temas que cubre esta sección son: 

  • Introducción a la visualización de datos.
  • Varios tipos de gráficos, gramática gráfica.
  • Paquete ggplot2.
  • Análisis multivariante mediante geom_boxplot.
  • Análisis univariante mediante el uso de histograma, gráfico de barras, distribución multivariante y gráfico de densidad.
  • Creando los diagramas de barras para las variables categóricas a través de geop_bar () e incluyendo los temas a través de la capa theme ().

Resultados de aprendizaje: Al final de este módulo, podrá visualizar los datos a través de diferentes gráficos, paquete Ggplot2. Además, obtendrá una experiencia en tiempo real de la creación de gráficos de barras, análisis univariante y multivariante.

Este módulo de capacitación en el aula en línea de ciencia de datos trata conceptos estadísticos como clasificación, tipos de probabilidad, covarianza y correlación. Junto con esto, aprenderá a analizar el conjunto de datos dado a través del muestreo de datos, la prueba de hipótesis y la distribución binaria.

Los temas que cubre esta sección son: 

  • Importancia de las estadísticas.
  • Clasificación estadística, Terminología estadística.
  • Tipos de datos, tipos de probabilidad, medidas de velocidad y tendencia central.
  • Covarianza y correlación, distribución binaria y normal.
  •  Niveles de muestreo, confianza y significación de datos.
  • Prueba de hipótesis y prueba paramétrica.

Resultados de aprendizaje: Al final de este módulo, obtendrá conocimientos prácticos de diferentes conceptos estadísticos como tipos de probabilidad, prueba de hipótesis, covarianza. También podrá trabajar con otras técnicas estadísticas como correlación, muestreo de datos, distribución normal y binaria.

Los temas cubiertos en esta sección son: 

  • Fundamentos del aprendizaje automático.
  • Aprendizaje supervisado, clasificación en aprendizaje supervisado.
  • Regresión lineal y conceptos matemáticos relacionados con la regresión lineal.
  • Algoritmos de clasificación, técnicas de aprendizaje por conjuntos.

Resultados del aprendizaje: Al completar este módulo, obtendrá un conocimiento básico del aprendizaje automático y dominará el aprendizaje supervisado, la regresión lineal y el aprendizaje por conjuntos.

Los temas cubiertos en esta sección son: 

  • Introducción a la regresión logística.
  • Regresión logística vs lineal, regresión de Poisson.
  • Regresión logística bivariada, matemáticas relacionadas con la regresión logística.
  • Regresión logística multivariante, construcción de modelos logísticos.
  • Tasa positiva falsa y verdadera, aplicaciones en tiempo real de regresión logística.

Resultados de aprendizaje: Al final de este módulo, obtendrá conocimientos prácticos de regresión logística, regresión lineal, regresión de Poisson y modelos logísticos.

Los temas cubiertos en esta sección son: 

  • Técnicas de clasificación. Algoritmo de inducción del árbol de decisión.
  • Implementación de Random Forest en R.
  • Diferencias entre el árbol de clasificación y el árbol de regresión.
  • Bayes ingenuo, SVM.
  • Entropía, índice de Gini, ganancia de información.

Resultados de aprendizaje: Al completar este módulo, adquirirá una comprensión profunda de los algoritmos de inducción de árboles de decisión, implementando el bosque aleatorio en la programación R.

Los temas cubiertos en esta sección son: 

  • Agrupación, agrupación de K-medias, agrupación de dosel y agrupación jerárquica.
  • Aprendizaje no supervisado, algoritmo de agrupamiento, algoritmo de agrupamiento de K-means.
  • Conceptos teóricos de K-medias, flujo de proceso de k-medias e implementación de K-medias.
  • Implementación de agrupaciones históricas en R.
  • Implementación de PCA (análisis de componentes principales) en R.

Resultados de aprendizaje: Al completar este módulo, obtendrá una experiencia en tiempo real de agrupamiento de k-medias, algoritmo de agrupamiento y análisis de componentes principales.

Los temas cubiertos en esta sección son: 

  • Conceptos básicos de procesamiento de lenguaje natural y minería de texto.
  • Importancia y casos de uso de la minería de texto.
  • NPL trabajando con minería de texto, Language Toolkit (NLTK).
  • Minería de textos: preprocesamiento, clasificación de textos y limpieza.

Resultados del aprendizaje: Al final de este módulo, obtendrá un conocimiento práctico del procesamiento del lenguaje natural y la minería de textos.

Este módulo analiza conceptos matemáticos como conceptos básicos de probabilidad, teorema de Bayes, funciones matemáticas de Numpy, probabilidad condicional y probabilidades conjuntas.

Los temas cubiertos en esta sección son: 

  • Conceptos básicos de Numpy.
  • Numerosas funciones matemáticas.
  • Notación y conceptos básicos de probabilidad.
  • Correlación y regresión.
  • Probabilidades conjuntas.
  • Teorema de Bayes.
  • Probabilidad condicional, regla de la suma y regla del producto.

Resultados de aprendizaje: Al final de este módulo, podrá utilizar conceptos de probabilidad, funciones de Numpy, teorema de Bayes, correlación y regresión en ciencia de datos.

Los temas cubiertos en esta sección son: 

Introducción y características de Scipy Subpaquetes de Scipy como Integrate, Cluster, Signal, Fftpack y el teorema de Bayes.

Resultados del aprendizaje: Al final de este módulo, obtendrá una experiencia informática científica en tiempo real.

Los temas cubiertos en esta sección son: 

  • Conceptos básicos de Pyspark.
  • Usos y necesidad de pyspark.
  • Instalación de Pyspark.
  • Ventajas de pyspark sobre MapReduce.
  • Aplicaciones de Pyspark.

Resultados del aprendizaje: Al final de este módulo, adquirirá conocimientos prácticos de Pyspark.

Los temas cubiertos en esta sección son: 

  • Efecto del aprendizaje automático en la inteligencia artificial.
  • Conceptos básicos del aprendizaje profundo, funcionamiento del aprendizaje profundo.
  • Regresión y clasificación en el aprendizaje supervisado.
  • Asociación y agrupación en el aprendizaje no supervisado.
  • Conceptos básicos de inteligencia artificial y redes neuronales.
  • Aprendizaje supervisado en redes neuronales, red multicapa.
  • Redes neuronales profundas, redes neuronales convolucionales.
  • Aprendizaje por refuerzo, algoritmos de optimización dnn.
  • Redes neuronales recurrentes, unidad de procesamiento de gráficos de aprendizaje profundo.
  • Aplicaciones de aprendizaje profundo, modelado de series temporales.

Resultados de aprendizaje: Al final de este módulo, podrá dominar los conceptos de aprendizaje profundo e inteligencia artificial necesarios para un científico de datos.

Los temas cubiertos en esta sección son: 

  • Bibliotecas de código abierto de Tensorflow Basics y Tensorflow.
  • Modelos de aprendizaje profundo y unidad de procesamiento de tensores (TPU).
  • Visualización de gráficos, keras.
  • Red neuronal de Keras.
  • Definir y componer modelos de salida multicomplejos a través de Keras.
  • Normalización de lotes, composición funcional y secuencial.
  • Implementando Keras con tensorboard, personalizando el proceso de entrenamiento de redes neuronales.
  • Implementación de redes neuronales a través de la API de TensorFlow.

Resultados de aprendizaje: Al completar este módulo, podrá crear modelos de aprendizaje profundo y visualizar los datos a través de la API de Keras y TensorFlow.

Los temas cubiertos en esta sección son: 

  • Conceptos básicos de Autoencoders y rbm.
  • Implementación de RBM para las redes neuronales profundas.
  • Funciones y aplicaciones de los codificadores automáticos.

Resultados del aprendizaje: Al final de este módulo, obtendrá conocimientos prácticos sobre las máquinas Boltzmann restringidas y los codificadores automáticos.

Los temas cubiertos en esta sección son: 

  • Conceptos básicos de Big Data y Hadoop.
  • Arquitectura Hadoop, HDFS.
  • MapReduce Framework y Pig.
  • Hive y HBase.
  • Conceptos básicos de Scala y programación funcional.
  • Conceptos básicos de Kafka, Arquitectura de Kafka, Clúster de Kafka e Integración de Kafka con Flume.
  • Introducción a Spark.
  • Spark RDD Operations, escribiendo programas Spark.
  • Spark Transformations, introducción a la transmisión de Spark.
  • Spark Streaming Architecture, Spark Streaming Features.
  • Arquitectura de transmisión estructurada, Dstreams y Spark Graphx.

Resultados del aprendizaje: Al final de este módulo, adquirirá experiencia en tiempo real de trabajar con HDFS, el marco MapReduce, HBase y Kafka. También obtendrá un amplio conocimiento del desarrollo de programas Spark y la realización de transformaciones Spark y operaciones Spark RDD.

Los temas cubiertos en esta sección son: 

  • Conceptos básicos de visualización de datos.
  • Aplicaciones de visualización de datos.
  • Instalación e interfaz de Tableau.
  • Tipos de datos de Tableau, preparación de datos.
  • Arquitectura de Tableau.
  • Introducción a Tableau.
  • Creación de conjuntos, metadatos y combinación de datos.
  • Organizar análisis visual y de datos.
  • Mapeo, expresiones y cálculos.
  • Parámetros y preparación de Tableau.
  • Historias, paneles y filtros.
  • Gráficos, tablas.
  • Integración de Tableau con Hadoop y R.

Resultados del aprendizaje: Al final de este módulo, obtendrá una experiencia en tiempo real de la creación de conjuntos, gráficos, cuadros y cuadros de mando para analizar datos. También adquirirá conocimientos prácticos de la arquitectura de tableau, la instalación de tableau, la preparación de tableau y la integración de Tableau con R y Hadoop.

Este módulo de MongoDB lo ayudará a dominar conceptos como conceptos básicos de MongoDB, instalación de MongoDB, operaciones CRUD, indexación de datos, modelado de datos y administración de datos. Junto con esto, también aprenderá los conceptos de seguridad y esquema de agregación de datos.

Los temas cubiertos en esta sección son: 

  • Conceptos básicos de MongoDB y NoSQL.
  • Instalación de MongoDB.
  • Importancia de NoSQL.
  • Operaciones CRUD.
  • Modelado y gestión de datos.
  • Indexación y administración de datos.
  • Esquema de agregación de datos.
  • Seguridad de MongoDB.
  • Colaborar con datos no estructurados.

Resultados de aprendizaje: Al final de este módulo, obtendrá conocimientos prácticos sobre el uso de MongoDB para realizar diferentes operaciones de base de datos, como crear una base de datos, insertar datos en una base de datos, eliminar y actualizar los datos. También podrá dominar el modelado de datos, la indexación de datos y la administración de datos.

Los temas cubiertos en esta sección son: 

  • Conceptos básicos de SAS.
  • Guía empresarial SAS.
  • Funciones y operadores SAS.
  • Compilación y creación de conjuntos de datos SAS.
  • Procedimientos SAS.
  • Gráficos SAS.
  • Macros SAS.
  • PROC SQL.
  • SAS avanzado.

Resultados del aprendizaje: Al final de este módulo, podrá realizar análisis de datos avanzados utilizando conceptos de SAS.

Los temas cubiertos en esta sección son: 

  • Ingresando datos.
  • Funciones lógicas.
  • Formato condicional.
  • Validación, fórmulas de Excel.
  • Clasificación de datos, filtrado de datos, tablas dinámicas.
  • Creación de gráficos, técnicas de creación de gráficos.
  • Seguridad de archivos y datos en Excel.
  • Macros VBA, condición VBA IF y bucles VBA.
  • Condición de VBA IF, para bucle.
  • Depuración y mensajería de VBA.

Resultados de aprendizaje: Al final de este módulo, adquirirá un conocimiento práctico de Excel y VBA.

¿Qué tipo de entrenamiento desea tomar?

CAPACITACIÓN EN LÍNEA EN VIVO

  • Demostración en vivo de funcionalidades y prácticas.

ENTRENAMIENTO CORPORATIVO

  • Modos de entrenamiento a su propio ritmo / en vivo en línea / en el aula disponibles.
  • Participe en una conferencia de capacitación en el aula sobre ciencia de datos impartida por un experto de la industria en sus instalaciones.
  • Aprenda según el programa de día completo con debates, ejercicios y casos prácticos de uso.
  • Diseñe el contenido de su propio curso según los requisitos de su proyecto.