Los Principales Roles en un Equipo de Ciencia de Datos en el 2020
¿Alguna ves has pensado en quienes son parte de un proyecto de datos?
Quizá puedas pensar que para analizar la información empresarial solo están los analista de datos y el administrador de base de datos, o peor aún, si has sido uno de los bombardeados con publicaciones sobre Científico de datos (Data Scientist) pensarás que ahora ellos son los que manejan este tipo de proyectos. Pero no es tan así que digamos. El avance de la tecnología y
sobre todo, de las necesidades de las organizaciones, ha generado que los profesionales de tecnología se especialicen.
Aunque existe muchos roles de datos en una organización, el motivo de esta publicación, es que conozcas los principales roles que se encargan que un proyecto de datos, sea exitoso.
Además de una reflexión final sobre el enfoque que tienen algunas organizaciones con el equipo de datos.
Los principales roles en un proyecto de datos:
1. Administrador de base de datos:
Implementa y administra soluciones de bases de datos
ya sea local, cloud o hibrida
. Además es responsable de la disponibilidad de acceso a los datos, el desempeño y la optimización de consultas (queries) a las bases de datos.
¿Con quien trabaja colaborativamente?
Trabajan de la mano
con los interesados (stakeholders) para identificar las necesidades de la organización, y con ello definir las políticas y consultas de datos, las herramientas a usar, los procesos para el respaldo de los datos y los planes de contingencia.
2. Ingeniero de datos:
Administra y asegura el flujo de datos estructurados y no estructurados de múltiples fuentes hacia los diferentes dispositivos de las áreas y dependencias de la organización. Las plataformas que usan incluyen base de datos relacionales y no relacionales, software para recolectar, transformar y distribuir los datos, y para el almacenamiento de archivos.
Asimismo, un Ingeniero de datos es responsable por el desarrollo y mantenimiento de los "data pipelines", lo que es primordial para las otras fases del proyecto.
¿Con quien trabaja colaborativamente?
Debido a que tiene que que reunir datos de diferentes fuentes
(lo que se conoce como Data Wrangling) se reúne con el Analista de datos y Científico de datos ya que esta es una parte importante para decidir qué datos se tomará en cuenta para diseñar el modelo y de qué fuentes se los obtendrá.
3. Analista de datos:
Usa los activos de datos con la finalidad de maximizar su valor
a través de reportes y visualizaciones para explicar que es lo que oculta los datos. Sus principales tareas son: perfilado, limpieza y transformación de datos (si, similar a lo que realiza el Ingeniero de Datos pero enfocado a sus necesidades). Además se encarga de construir modelos de datos efectivos y escalables, los cuales se abastecen de un Almacén de datos (Data Warehouse) o un lago de datos (Data Lake).
¿Con quien trabaja colaborativamente?
Trabaja con el Ingeniero de Datos y los "stakeholders" pertinentes para identificar qué datos son necesarios y cuales son los requerimientos para los reportes a entregar. Asimismo, se reúnen para identificar nuevos procesos de colección de datos o mejorar los existentes.
4. Científico de datos.
Desarrollan análisis avanzados para extraer valor de los datos. Su trabajo comprende 1. Analítica Descriptiva, qué evalúa los datos a través de un proceso conocido como Análisis Exploratorio de datos (EDA). y 2. Analítica Predictiva, que es usada en Aprendizaje Automático (Machine Learning) para aplicar técnicas de modelado que puede detectar patrones o anomalías. Estos métodos de análisis son partes importantes de los modelos de predicción.
Además, evidencia en encuestas aplicadas a científicos de datos sugiere que la mayor parte de su trabajo se enfoca en el tratamiento de datos (Data Wrangling) e Ingeniería de característica (Feature Engineering), "domar a los datos". El primero, consiste en que una vez recopilado los datos, se deben «limpiar» y darle el formato correcto para ser «consumidos» adecuadamente; de aquí la importancia de trabajo en equipo con el Ingeniero de datos, quien suelen realizar esta tarea, para que el Científico de datos se dedique a la siguiente fase del proceso sin demora.
Ahora, a simple vista, pareciera que un Científico de datos y un Analista de datos realizan labores similares, sin embargo, esto no es tan así. El Científico de datos observa a los datos a través de un Análisis Exploratorio para determinar las preguntas que necesitan respuestas para luego «aterrizarlo» en una hipótesis, es allí donde acude al Analista de datos para que le ayude con la visualización y reporte de datos.
En resumen, el Científico de datos encuentra patrones, construye modelos, los algoritmos y diseña los experimentos para producir productos de datos.
¿Con quien trabaja colaborativamente?
Debe de relacionarse de manera activa con todos los miembros del equipo y área administrativa a quienes presentará el resultado del proyecto.
5. Analista de negocio.
Profesional que ha adquirido el conocimiento de negocio, importante para la interpretación de los datos que provienen del reporte y gráficos producidos por el Analista de datos. Utilizan datos y su experiencia para identificar problemas y desarrollar propuestas de solución.
Ellos no desarrollan un análisis técnico profundo de los datos, sin embargo, ellos operan a nivel conceptual, definiendo estrategias y comunicándose activamente con los interesados y tomadores de decisiones.
¿Con quien trabaja colaborativamente?
Trabajan en conjunto con el Analista de datos y Científico de datos para comunicarles las necesidades de los interesados (stakeholders) y compartir su experiencia para que el proyecto esté enfocado a cumplir los objetivos de negocio
, asimismo, realizan los reportes a partir de los hallazgos encontrados por el equipo y los comunican a los gerentes de área o alta gerencia.
Para Resumir
Los proyectos
de hoy en día lidian con datos y necesidades que se han vuelto lo suficientemente complejos para usar los mismos roles de antes
, por ello es que hay más profesionales con habilidades especializadas para cubrir todo ciclo del proyecto. Sin embargo, es necesario notar que son muchos los profesionales que se involucran para obtener un producto de datos relevante para la organización.
Hay organizaciones que quieren «sumarse a la tendencia» de tener Científicos de datos entre su nómina, esperando que incrementen su valor, pero ¿adivina que? NO ES TAN SIMPLE como contratar sólo a un grupo de Científico de datos para hacer todas las tareas que involucra un proyecto. Teniendo en cuenta que cada proyecto tendrá un impacto en la forma en cómo la organización se desarrolla, ya sea mejorar un producto/servicio, o cambiar sus esfuerzos de marketing al entender mejor a su cliente. Se requiere de la experiencia y habilidad de todos los profesionales de datos
mencionados lineas arriba para obtener resultados relevantes y que sean efectivos para satisfacer los objetivos de la organización.
Para que quede claro, veamos a un equipo de datos como una brigada de cocina, aunque el
Chef principal sepa los diferentes procesos que involucra preparar un platillo
(producto de datos), ya sea como adquirir los ingredientes a utilizar (Ingeniero de datos), sepa de que forma y en qué condiciones estas especies deben ser almacenadas (Administrados de base de datos) o sepa realizar la preparación de ciertos platillos (Analista de datos) el aún depende de los otros miembros de la cocina para que los platillos sean preparados
, así como del mesero (Analista de negocio) quien recibe las ordenes y sirve los platillos a los clientes (la organización).