El Centro de Posgrados y Actualización Profesional (CPAP) en Informática del Instituto de Computación (Inco) de la Facultad de Ingeniería (Fing) de la Universidad de la República (Udelar) incorpora este año una Especialización en Ciencia de Datos a su propuesta de cursos. Se trata de una oferta pensada no únicamente para informáticos, sino que apunta a un perfil más amplio de profesionales. Según explicaron a la diaria Andrea Delgado, directora del CPAP, y Pablo Rodríguez-Bocca, responsable de la especialización, la propuesta es para quienes tengan un título universitario de grado de una carrera de al menos 360 créditos, e interés en “profundizar capacidades científicas y motivación para aplicar el conocimiento de análisis de datos”. Más allá de la amplitud en la convocatoria, es un requisito que los postulantes tengan algún tipo de formación en matemática y en programación, aunque sea de forma autodidacta, ya que son las áreas temáticas sobre las que se sostiene el posgrado. Eso también se traduce a los institutos académicos de la Fing a cargo de la oferta: si bien mayoritariamente los cursos están a cargo del Inco, también tiene participación el Instituto de Matemática.

Según detallaron, es claro que los egresados de todas las ingenierías entran en el perfil de la convocatoria, pero también se dirige a profesionales de otras áreas, como las ciencias económicas y de administración, quienes muchas veces trabajan con sistemas de información o gestionan áreas de tecnología y se han acercado a la informática. Rodríguez-Bocca señaló que en el caso de quienes no tienen formación de grado en ingeniería pero están interesados en este tipo de especializaciones, el acercamiento a la programación se da casi naturalmente. Como en el resto de las carreras del CPAP, las postulaciones son evaluadas por una comisión que evalúa que los estudiantes cumplan con los requisitos.

Si bien actualmente el posgrado está en la fase final de aprobación, es un hecho que los cursos comenzarán en marzo de 2019. La propuesta está pensada para que, en el mejor de los casos, se pueda completar en un año y medio, con cuatro asignaturas por semestre. De todas formas, como en el resto de su oferta, el CPAP prevé que muchos estudiantes no cursan en esos tiempos, por lo que se pueden saltear algunas materias y tomarlas más adelante. La dinámica del centro de posgrados consiste en que hay cursos que se ofrecen solamente en el primer semestre del año y otros únicamente en el segundo. Delgado explicó que si bien hay actividades virtuales, los cursos en el CPAP tienen un componente presencial muy importante en el que se propician el intercambio y la reflexión, pero para facilitar la participación de quienes trabajan, en general las clases se dictan entre las 18.00 y las 21.00. Aprobando los 60 créditos de los cursos, los profesionales obtienen la Especialización en Ciencia de Datos, y tienen la opción de continuar su formación durante un año más. La propuesta incluye la posibilidad de hacer una tesis, en la que durante ese período investiguen algún fenómeno dentro del área de conocimiento, y de esa forma obtengan el título de Maestría en Ciencia de Datos.

Proceso

Rodríguez-Bocca enfatizó en que se trata de una propuesta de formación cuidadosamente pensada durante dos años por un equipo de la Fing, en el que confluyeron distintos académicos y profesionales que se especializan en la ciencia de datos. El docente consideró que la preparación es fundamental, ya que “la ciencia de datos todavía es un concepto medio borroso”. “Si nos basamos en la concepción más básica, que es aplicar el método científico sobre datos, en esencia es algo que hace todo investigador-ingeniero, pero empiezan a aparecer algunos matices. Habitualmente, es lo que se dice data driven: el modelado no se hace basado en presunciones o casos particulares de un problema –por ejemplo, a partir de lo que te puede decir un experto en medicina– sino a partir de lo que dicen los datos propiamente”, definió. El responsable de la especialización agregó que en ese proceso se va construyendo un modelo “muy basado en evidencia”, y que el modelado suele delegarse en la computadora. Afirmó que estas particularidades son las que diferencian al profesional de la ciencia de datos, que también se diferencia de los perfiles de “arquitecto de datos”, más enfocados a asegurar que una determinada infraestructura tenga capacidad de alojar y procesar datos. El docente detalló que los arquitectos de datos, en sus distintos perfiles, se forman en el área de sistemas de información, sobre la que el CPAP también ofrece maestrías y especializaciones (ver recuadro).

Rodríguez-Bocca señaló que aunque años atrás las herramientas que podía usar un informático dependían en gran medida del tipo de problema a abordar, en los últimos diez años ello empezó a cambiar y “para casi todos los problemas utilizamos las mismas herramientas, a veces hasta el mismo software”. Además de permitir una mayor transversalidad entre otros profesionales y disciplinas, esto hizo que empezara “a haber un lenguaje común para la resolución de problemas, que es más potente”, a lo que se suma la creciente disponibilidad de datos.

Desde hace 20 años El CPAP surgió en el año 2000 y en un principio sólo contaba con un diploma de Especialización en Estudios Avanzados de computación y una maestría en Ingeniería en Computación. Delgado señaló que en ese momento se cumplió con brindar ese tipo de formación, pero los temas se cubrían de forma poco específica. Con el correr de los años, el desarrollo del campo y de diferentes líneas de investigación de docentes del Inco, que actualmente está a cargo de 90% de los cursos del centro, fueron surgiendo nuevas propuestas. La directora contó que desde 2010 “se empezó a trabajar en detectar áreas más específicas del conocimiento” que fueran necesarias para los profesionales y las organizaciones en las que trabajan. De esa forma, surgieron las especializaciones en ingeniería de software, en seguridad informática y en sistemas de información. Con el mismo sistema que Ciencia de Datos, cuando se agregan una tesis los respectivos programas se acreditan como maestrías. Delgado detalló que todos los cursos están pensados para que conecten adecuadamente con el mundo profesional, por lo que “se intenta trabajar con problemas o ideas reales que traen los propios participantes, cuidando los temas de confidencialidad”.

Rodríguez-Bocca señaló que “claramente, el foco [del posgrado] no es un recetario para aprender a usar técnicas y herramientas [para el manejo de datos], ya que es algo más fácil de adquirir, sino que se va a la base, a cómo hay que pensar para poder usar la herramienta correcta”. El docente habló de un “lenguaje común” para la ciencia de datos, que “en esencia es conocer qué algoritmos y lenguajes de programación se usan para qué cosa y qué sustento matemático tiene eso”. En el posgrado se abordan distintas áreas como el procesamiento de lenguaje natural, de imágenes, de redes, la robótica y la optimización. “Son áreas con técnicas avanzadas en el análisis de datos, en las que determinado perfil de problema ya tiene su especificidad, con herramientas particulares. Nosotros las volvemos a ver, todas son aprendizaje automático, pero algunas técnicas han tenido más éxito y un desarrollo mayor. Pasamos por estas disciplinas en asignaturas específicas y algunas de ellas calzan mejor para determinado tipo de problemas”, complementó.

En desarrollo

Consultado sobre la demanda de profesionales que trabajen con el método de la ciencia de datos, Rodríguez-Bocca señaló que si bien “hay distintas necesidades”, por lo general “las empresas no saben cómo incorporar ese conocimiento, por ejemplo, para maximizar sus ventas”. Sin embargo, consideró que “de a poco”, eso se va alcanzando, y que el “estado de madurez” actual de las empresas “hace que estén mirando ese tipo de problemas”. Explicó que cuando un área de conocimiento ya tiene un buen desarrollo en materia de generación de datos, el profesional del área “termina haciendo un modelo predictivo”. “Por lo general, se dice que eso es mirar al futuro, pero a veces también se mira directamente hacia zonas que uno no conoce. Se sabe qué tanto llueve en las estaciones meteorológicas, pero no en el campo que está a cinco kilómetros. Ahí hay una predicción a hacer, que puede hacerse sobre datos del pasado. Uno tiene que modelar esas cosas y cualquier problema que signifique hacer una predicción basada en datos; uno puede tener un sistema [de conocimiento] experto que funcione, pero si quiere construir su modelo basado en datos, para eso es que acá damos las herramientas”.

La propia naturaleza del campo hace que muchas veces se trabaje sobre áreas temáticas que el profesional del área no necesariamente domina. En ese sentido, los docentes explicaron que las herramientas que se abordan en la especialización no tienen tanto que ver con la consulta del conocimiento experto –que en la práctica muchas veces sí se realiza– sino más bien con la construcción de análisis en base a lo que los propios datos ya disponibles dicen. “A veces uno se lleva sorpresas y otras muchas uno verifica lo que ya se sabe. Es el trabajo científico, no es que uno se sienta y se ilumina, sino que se lee documentación científica, se implementa lo que otro dice que funciona. Por ejemplo, a veces yo no sé el fundamento de por qué tales variables del suelo impactan en el mejor crecimiento de una planta, pero hay un científico que lo escribió y yo lo utilizo. Es mucho de leer, de estar abierto a cosas, aplicar el método científico: plantearse una hipótesis más o menos razonable y creíble y construirse un experimento que la verifique. Lo interesante es que todo lo hacemos con la computadora, pero no requiere trabajo de campo, no salimos a hacer experimentos reales, sino que alguien ya hizo cosas y nosotros usamos eso para sacar conclusiones y mejorar”, resumió el responsable del posgrado.

Si bien valoró que las empresas tienden cada vez más a demandar este tipo de formación, admitió que “todavía no saben mucho qué es ni qué resultados van a obtener”. En ese sentido, entiende que se trata de agregar un plus al trabajo de los profesionales, que en su mayoría “tratan de tomar las mejores decisiones basadas en evidencia ante todos los problemas a los que se enfrentan”.

Fuera de fronteras

Consultados sobre el desarrollo de la ciencia de datos en Uruguay y el exterior, consideraron que el nuevo posgrado es una propuesta de avanzada a nivel nacional, en la que están trabajando varios equipos de investigación del Inco, con muchos docentes que se vinculan con referentes a nivel mundial en la temática y que escriben artículos en importantes revistas académicas. Según Rodríguez-Bocca, en la Fing “hay 40 o 50 personas que entienden claramente, a nivel de detalle”, cómo funciona el área. Por su parte, Delgado indicó que se trata de una nueva profesión que cuenta con varios años de desarrollo a nivel mundial, que ha implicado el surgimiento de varios cursos y carreras de ciencia de datos o títulos asociados, y que en el caso de la Fing se ofrece como un posgrado, pero advirtió que en un futuro podría desembocar en un nuevo título de grado. Además, consideró que Uruguay es de los primeros países de la región en ofrecer una formación específica en el área.

Al respecto, el responsable de la especialización señaló que los actores que en el mundo se destacan en estos temas tienen una escala internacional, y que existe un desafío para que organizaciones nacionales y locales puedan “dar un salto”. Aclaró que esto no significa que no hay organismos públicos y privados que no hayan incorporado estas herramientas a sus procesos: “Hace tiempo que trabajo como asesor en Antel y hay 50 o 100 experiencias de aplicaciones exitosas de inteligencia artificial. Pero son para mejorar la eficiencia de la operación, para cosas que quizás no tienen la visibilidad de decirle ‘OK Google’ al celular y que te responda en forma inteligente. Se hace al nivel de lo que estas empresas tienen como pauta. Fijate la cantidad de chatbox que hay, eso es la vanguardia de tecnología en este tipo de cosas. Pero no tenés una empresa que parezca líder en eso y es bastante difícil. China y Estados Unidos se están peleando todo el tiempo por el liderazgo en esta área y dicen que Europa no lo va a tener nunca. Claramente, es bastante difícil para nosotros parecer que figuramos, pero otra cosa es no tener el conocimiento”, valoró.

“Todos estos cursos son pensados por las personas que trabajan acá desde hace años y del respaldo que tiene la Udelar en formación universitaria. No es que se repiten cursos que se dan en otro lado. Es una garantía de calidad de la formación; el egresado va a saber hacer todo lo que decimos que va a saber hacer”, afirmó Delgado.

Costos Al ser de tipo profesional, para cursar los posgrados del CPAP es necesario pagar derechos universitarios, cuyo monto depende de la cantidad de créditos de cada curso y programa, a partir de una escala que está publicada en la página web del centro. De todas formas, el pago no se realiza de una vez sino que se hace por curso. En este sentido, existe la posibilidad de hacer los cursos en forma aislada como actividades de actualización profesional, o en el marco de una especialización o maestría, para lo que es necesario anotarse oportunamente. Además, en este último caso se hace un descuento de 20% en el precio de los cursos. No se paga matrícula y también hay descuentos especiales para inscripciones grupales, por ejemplo, en el caso de trabajadores de alguna empresa. La Especialización en Ciencia de Datos tiene un costo total estimado de 6.000 dólares.

