Ciencia de datos. Métodos educativos para su enseñanza

Ciencia de datos. Métodos educativos para su enseñanza

Dr. Miguel Ángel Mejía Argueta
Técnico Académico Titular “A”
Departamento de Tecnologías Emergentes
Dirección de Sistemas y Servicios Institucionales
Dirección General de Cómputo y de
Tecnologías de la Información y Comunicación de la
Universidad Nacional Autónoma de México
miguel.argueta@unam.mx

Resumen

Actualmente la humanidad está generando una gran cantidad de información. Cada ser humano que utiliza herramientas tecnológicas, como dispositivos portátiles (celulares, tabletas, iPads) o cualquier tipo de computadoras, aunque no quiera, está generando y dejando gran cantidad de datos que pueden ser procesados y analizados para entregarle servicios y productos personalizados.  Por esto, es de vital importancia crear científicos de datos, que son los expertos que nos ayudan a organizar, entender y procesar la información. La manera en la que se está enseñando esta parte de la ciencia resulta muy peculiar y moderna, por lo que en este artículo se realiza un recorrido por algunos métodos educativos relevantes para formar a un ser humano como un científico de datos.

Abstract

Humanity is currently generating a large amount of information. Each human being using technological tools such as portable devices (cell phones, tablets, iPads) or any type of computer, even if he don’t want to, is generating and producing a large amount of data that can be processed and analyzed to deliver personalized services and products. This is why it is vitally important to create data scientists, who are the experts who help us organize, understand and process information and the way in which this part of science is being taught is very peculiar and modern. So this article show  some relevant educational methods to train a human being as a data scientist. 

Introducción

La ciencia de datos es una rama de la inteligencia artificial que permite analizar grandes cantidades de información (Big Data) (Amazon, 2015) para extraer valor de esta y poder tomar mejores decisiones en todas las ramas del conocimiento. Esta ciencia tiene una gran cantidad de aplicaciones en la vida cotidiana de cualquier ser humano.

El incremento en la demanda de personal experto en el manejo y análisis de grandes cantidades de datos se ha elevado de manera exponencial en la última década. Por esto, la enseñanza en el manejo de grandes cantidades de información en las universidades, cuya consecuencia es formar científicos de datos, augura una buena proyección laboral para quienes cuenten con estas habilidades.

Diversas universidades, tanto públicas como privadas, ya no enseñan conocimientos básicos de ciencias de datos en carreras relacionadas a las tecnologías de la información, como licenciatura en Informática, Ingeniería en Computación, Ingeniería en Sistemas y Actuaría, por mencionar algunas. En estas carreras se ha pasado de tener una materia optativa a abrir una licenciatura completa de Ciencia de Datos. Tal es el caso de la Universidad Nacional Autónoma de México (UNAM), pero la misma tendencia se observa en todos los países del mundo, en los que también se han desarrollado estudios de posgrado, como maestrías en Ciencias de Datos, para aquellos que han egresado de estas u otras carreras relacionadas con información y que desean especializarse en esos conocimientos.

Los cambios mencionados han traído como consecuencia formas modernas de abordar nuevas condiciones metodológicas para enseñar a los estudiantes, con un sentido renovador y prospectivo, conocimientos necesarios para desempeñarse como científicos de datos.

Conceptos

El término “ciencia de datos” fue acuñado por Jeff Hammerbacher y D. J. Patil, quienes determinaron que fuera la actividad de preparar, procesar y analizar grandes volúmenes de datos e información estructurada y no estructurada, así como la presentación de estos datos para la toma de decisiones (Davenport y Patil, 2012). Para denominar al experto en ciencia de datos se ha acuñado el nombre de “científico de datos”. Ambos términos están cumpliendo poco más de una década de existencia.

El experto en ciencia de datos debe de ser un profesional que conozca de diferentes disciplinas, tales como el método científico, la estadística, la analítica predictiva, la minería de datos y lenguajes de programación, por mencionar algunas, con el fin de obtener el máximo valor de los datos analizados. Por lo tanto, los científicos de datos son especialistas en el manejo y tratamiento de la información. La ciencia de datos es considerada como una de las carreras del futuro.

En cuanto al concepto de métodos de enseñanza, podemos revisar a diferentes autores:

Neuner (1981) los define como “un sistema de acciones del maestro encaminado a organizar la actividad práctica y cognoscitiva del estudiante con el objetivo de que asimile sólidamente los contenidos de la educación” (p. 320). O bien a Alcoba González (2012), quien expresa: “[son] el conjunto de técnicas y actividades que un profesor utiliza con el fin de lograr uno o varios objetivos educativos, que tiene sentido como un todo y que responde a una denominación conocida y compartida por la comunidad científica” (p. 96).

Es decir, los métodos de enseñanza son todas las acciones y actividades que el profesor aplica para que su alumno adquiera de una manera sólida ciertos conocimientos que logren un cambio en su conducta. 

Aplicaciones de la ciencia de datos

Para las organizaciones públicas y privadas, el fenómeno de analizar grandes cantidades de datos puede producir un cambio en la forma de plantear modelos de negocios. Numerosas organizaciones así lo han observado y están actuando en consecuencia, ya que el análisis de dichos datos es transversal a las organizaciones y a sus procesos de negocios, por eso, las universidades han puesto atención a la demanda de la industria y han decidido formar a estos expertos.

En la actualidad, la ciencia de los datos está cambiando muchos paradigmas: la forma en que realizamos la gestión de la salud, la administración pública y privada, o bien las telecomunicaciones y la meteorología, son ejemplos de cómo se aplican de manera cotidiana estos conocimientos. Muchos otros campos de la ciencia e, incluso, de la industria del ocio y del esparcimiento, utilizan estos conocimientos. 

Las mismas universidades y los grupos de investigación se han visto dedicados a adentrarse en el tratamiento de la enorme cantidad de datos que generan tanto en el ámbito académico como científico. Muestra de esto son los proyectos que las universidades están implementando para contar con algoritmos inteligentes y predictivos que ayuden a disminuir la deserción escolar y muchos otros problemas relacionados con las instituciones educativas. Por otro lado, la comunidad científica de todas las ramas de la ciencia en el mundo genera y produce nuevos descubrimientos cada día, y las herramientas proporcionadas por la ciencia de datos le abren nuevos cuestionamientos y problemas para tratar de resolver en sus respectivas ciencias.

Los científicos de datos pueden tener una gran cantidad de especialidades y subespecialidades (roles), entre las que podemos actualmente identificar, sin que sean las únicas, las siguientes:

  • Bibliotecólogo de datos. Este profesional se enfoca en la organización, sistematización y clasificación de los datos. Establece normas para la gestión de servicios de grandes volúmenes de información, tanto de libros como  revistas, periódicos, etcétera.
  • Periodista de datos. Es aquel profesionista que realiza su trabajo a través del procesamiento de datos y mediante diversas herramientas de análisis de información en cantidades enormes. Se enfoca en el análisis de sentimientos y de tendencias a partir de la investigación de la información vaciada en las redes sociales, así como en internet en general.
  • Analista de datos. Profesionista que aprende a recopilar y analizar la información de las organizaciones para emitir recomendaciones o tomar decisiones. Este profesional de la información es capaz de conseguir datos confiables de otras bases de datos para analizar y lograr obtener respuestas a situaciones propias de una rama de la industria o de una organización. Esta es una de las cinco ocupaciones tecnológicas con mayor crecimiento a mediano plazo, por lo que tiene un mercado de trabajo prometedor.
  • Archivista de datos. Es el profesionista dedicado al patrimonio documental e histórico (archivos nacionales), aunque esta visión resulta reduccionista, pues es imprescindible aplicar sus principios también en la gestión documental. De esta manera, se encarga de establecer normas, políticas y reglas de qué, cómo, cuándo y dónde un dato deberá de ser almacenado, mandado a guardar para su conservación y preservación o en qué momento está en el mayor uso de su vida. Estos especialistas serán requeridos en mayor cantidad conforme, al paso de los años, los documentos y objetos digitales tengan que guardarse para su preservación y conservación.
  • Administrador de proyectos de ciencia de datos. Es el profesionista dedicado a establecer y controlar un proyecto de inteligencia artificial, de ciencia de datos o de grandes cantidades de información (Big Data). Se encarga de planear, controlar, dirigir, comparar y concluir el proyecto, estableciendo alcance, tiempos y costos para llevarlo a su término.
  • Ingeniero de datos. Es el profesionista dedicado a diseñar la forma en que se deben de incluir los datos para una mayor facilidad en su procesamiento, con base en las diferentes herramientas informáticas a utilizar, también llamada arquitectura tecnológica, necesaria para la ingesta, el procesamiento y la presentación de los resultados de proyectos de ciencia de datos.
  • Experto en automatización. Se dedica al análisis de procesos y su automatización a través de herramientas informáticas, ya sean software (sistemas computacionales), hardware (robots) o una mezcla de ambos, para solucionar un problema repetitivo.

Métodos educativos utilizados en la ciencia de datos

La forma en la que los estudiantes aprenden ciencia de datos está revolucionando la manera en la que los profesores deben de enseñarles TIC. Los métodos utilizados deben permitir satisfacer las demandas de los alumnos, cada vez más personalizadas y flexibles, sin miedo a la tecnología ni tampoco a enfrentarse a herramientas convencionales. Algunos de los métodos utilizados para la enseñanza de la ciencia de datos son: 

El aprendizaje adaptativo

Método educativo basado en la modificación de los contenidos y formas de enseñanza de acuerdo con las necesidades particulares de cada estudiante (CEDDIE Guadalajara, 2015). Para ello, el plan de estudios a la medida se conforma recolectando información sobre los hábitos de aprendizaje, conocimientos, debilidades y fortalezas de cada uno de ellos. 

Aunque pudiera sonar a ciencia ficción, se dice que este tipo de aprendizaje puede adecuarse en tiempo real al alumno a través de herramientas como cuestionarios en línea, los cuales pueden analizar los aciertos y errores que un estudiante pueda tener en una práctica o tarea, para enviarle materiales que debe revisar para reforzar sus debilidades. Este tipo de aprendizaje requiere un apoyo tecnológico muy alto, por lo que no siempre es posible tenerlo en los colegios. A pesar de ello, reporta muchas ventajas, entre las cuales se encuentran:

  • El aprendizaje es individual, por lo tanto, el centro de este tipo de aprendizaje es el estudiante.
  • El alumno avanza más rápido, ya que las actividades de aprendizaje están diseñadas para cada uno.
  • El estudiante recibe una retroalimentación inmediata en cualquier tipo de evaluación.
  • El profesor tiene información detallada del alumno, la cual es recolectada en una plataforma de aprendizaje.

Educación basada en competencias (EBC)

Este método de educar a los alumnos se basa en adaptar el proceso de enseñanza-aprendizaje a las características y necesidades de cada estudiante. El alumno aprueba una determinada materia cuando domina una destreza, lo cual es independiente de lo que se tarde para lograrlo (Alcoba, 2012). El estudiante es el único responsable de establecer el ritmo en el que aprende.

Las ventajas de este tipo de educación son:

  • El conocimiento se lleva a la realidad del alumno, quien aprende de forma práctica en todas las áreas del conocimiento.
  • Hay flexibilidad para todo tipo de estudiantes, sin importar el currículum formal o el currículum oculto de cada uno.
  • Esto último promueve la equidad grupal.
  • La responsabilidad de la educación recae en el estudiante, ya que debe de lograr hacer lo que se espera de él y, hasta que no lo logra, no puede pasar al siguiente conocimiento.

Aula invertida y aprendizaje combinado (flipped classroom y blended learning)

El aula invertida (flipped classroom)  (Salazar Argonza, 2017) se basa en el estudio en casa y la práctica en clase. En nuestros días, las TIC permiten al maestro impartir sus materiales on line, reservando el tiempo presencial de la materia para una formación más práctica. Esta técnica es muy usada desde niveles básicos, como el de la escuela primaria en México, hasta niveles de posgrado. 

Debido a la situación mundial de pandemia por COVID-19, vivida principalmente durante los años 2020 al 2022, el mundo se ha vuelto experto en este tipo de aprendizaje de manera involuntaria.

El aprendizaje combinado o blended learning se basa en la mezcla o combinación de la formación en línea y presencial: algunos materiales se dan en clases presenciales, mientras que otros se desarrollan a través de plataformas tecnológicas en internet. Igual que en el aula invertida, es un aprendizaje que se ha puesto en práctica de manera obligatoria por cuestiones de COVID-19. 

Es evidente que a muchos alumnos este tipo de aprendizaje les ha funcionado, pero a otros no, en especial a aquellos que se sienten muy cómodos con la interacción humana y aprenden mucho de las experiencias relatadas en clase y de los puntos de vista que sus mismos compañeros de clase aportan al aula.

Gamificación

Su nombre está basado en la palabra en inglés game (“juego”). Se define como el empleo de mecánicas de juego en entornos de aprendizaje con el fin de potenciar la motivación, la concentración y el esfuerzo de los estudiantes. Esta técnica constituye una estrategia que influye y exacerba a grupos de alumnos. El objetivo es estimular el proceso de enseñanza-aprendizaje entre los miembros de una comunidad estudiantil.

Algunas de las ventajas de esta estrategia en el aula son:

  • Los alumnos se sienten muy motivados.
  • Se divierten.
  • La complejidad de los juegos va en aumento (por niveles), ya que son retos que los alumnos deben superar. La complejidad no tiene límites.
  • Aumenta la atención y concentración de los estudiantes.
  • Se ha visto que el rendimiento académico mejora al utilizar esta estrategia.
  • Las relaciones sociales se ven fortalecidas entre los alumnos, más si se juega en grupos.
  • Mejora el uso de la lógica y la solución de problemas, ya que se incentiva a utilizar el pensamiento lógico y el aprendizaje mediante la deducción y prueba y error.

Aprendizaje móvil (mobile learning)

Consiste en dispositivos que promueven el aprendizaje por medio de contenidos educativos, como libros de texto electrónicos o cursos interactivos que ayudan a la mejora del rendimiento escolar. Asimismo, permiten la aplicación de exámenes de evaluación o de colocación que agilizan y simplifican el proceso de evaluación de los estudiantes.

Entre las ventajas que este aprendizaje brinda a los estudiantes son:

  • Es un aprendizaje personalizado en cualquier lugar y momento, ya que solo se requiere tener un dispositivo móvil y en algunas ocasiones un paquete de datos para consultar información de la red.
  • Permite evaluar y conocer las respuestas positivas y erróneas en tiempo real, y las herramientas permiten, de inmediato, hacer referencia a textos de aprendizaje.
  • Crea comunidades estudiantiles y aprendizaje colaborativo.
  • Hay un aprendizaje continuo.

Conclusiones

La ciencia de datos en el mundo no tiene más de 10 años, sin embargo, surge como una forma de procesar la gran cantidad de información que se produce en la actualidad.

Esta disciplina está abriendo posibilidades para nuevas carreras, nuevas profesiones y profesionistas en todo el mundo.

Las universidades tienen que implementar estrategias tanto para capacitar a sus profesores como para impartir estas nuevas carreras.

Los profesores deben de conocer y manejar las nuevas estrategias de enseñanza que hacen uso de las herramientas tecnológicas a su alcance y al de sus estudiantes.

Se requiere establecer políticas y planes de trabajo en las universidades para que puedan impartir las materias de estas nuevas carreras.

Referencias 

Alcoba González, J. (2012). La clasificación de los métodos de enseñanza en educación superior. Contextos Educativos, 15. Madrid.

Amazon (2015). Big Data Amazone Web Services. https://aws.amazon.com/es/big-data/

CEDDIE Guadalajara (2015). Qué es Aprendizaje Adaptativo. Equipo Multidisciplinario. http://centrodeinnovacionytecnologia.blogspot.mx/-2014/01/que-esaprendizaje-adaptativo.html

Davenport, T. y Patil, D. J. (2012, octubre). Data Scientist: The Sexiest Job of the 21st Century. Harvard Business Review. https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century 

Neuner, G. (1981). Pedagogía. Libros para la Educación.

Salazar-Argonza, J. (2017). Big Data en la educación. Revista Digital Universitaria, 17(1). http://www.revista.unam.mx/vol.17/num1/art06/