Introducción a la Ciencia de Datos e Inteligencia Artificial

Sebastián Buffo Sempé, cofundador y vicepresidente para América Latina de Le Wagon, aborda temas relativos al funcionamiento interno y las aplicaciones concretas de la IA en el mundo empresarial. También analiza desafíos y oportunidades que brindan las nuevas herramientas que genera.

Sebastián Buffo Sempé es ingeniero industrial. Cofundó Le Wagon Latinamérica, una escuela internacional de programación y ciencia de datos. En este vídeo presenta el concepto de «caja negra» que representa la Inteligencia Artificial, y lo que hay detrás de ella.

(04.30) “Para entrar a lo que sería la ciencia de datos, primero hay que entender de qué se trata un dato. Básicamente, es la generación que genera un dispositivo nosotros mismos y el registro. Es decir, tenemos constantemente entrada de datos en cualquier momento. La segunda etapa es el procesamiento y la codificación. Lo que termina sucediendo es que el dato se registra en la computadora. Lo que sería un binario. Cuando la vamos almacenando, hay dos maneras: la persistencia de manera permanente; o la memoria RAM que es cuando levantamos ese dato nuevamente y lo trabajamos en la memoria de la computadora. ¿Dónde tenemos estos datos? En nuestras bases operacionales como e-commerce; nosotros que tenemos alumnos el registro de todos los nombres o incluso en la Cámara el registro de los participantes de hoy, en un CRM cuando nosotros hacemos campaña, por ejemplo de mailing o ARP cuando hacemos compras, manufacturas y demás. Cuando hacemos campañas de medios tenemos una enorme cantidad de datos y entonces hay que armar una estrategia para poder manipularlos y luego interpretarlos, analizarlos y si es posible, ya empezar a con modelos predictivos”.

(06:58) “Cómo llego a esta revolución? Lo primero es entender el poder de cómputo; cómo ha cambiado a lo largo de la historia. Lo segundo es la generación de datos, cómo ha cambiado a lo largo de la historia. Lo tercero es el almacenamiento de datos que hoy nos permite trabajar con los datos almacenados y empezar a armar distintos modelos”.

(09.50) “¿Dónde comenzó la ciencia de datos? Arrancó desde el mundo académico, de la estadística. Ahora, con el poder de cómputos y generación de datos y almacenados, se los puede trabajar mucho más”.
“¿Dónde se comienza el análisis? Con un análisis exploratorio, se lo puede utilizar para hacer reportes”.
¿Por qué los datos ha empezado a pesar tanto dentro de las empresas? Porque podemos empezar a asimilarlos y tomar decisiones del negocio”.

(10:40) “Hoy ya estamos utilizando herramientas del análisis de datos. La Inteligencia Artificial ya pasó a ser una herramienta que todos
nuestros colaboradores están utilizando. Hoy tenemos las redes neuronales que son herramientas que ya permiten generar imágenes. ¿Cómo es el proceso de una empresa en términos de análisis de datos? Arrancamos desde el data set (conjunto de datos) y lo que tienen que hacer nuestros analistas de datos es comprender dónde están, qué tan buenos son y cuáles son las estrategias para recopilarlos”.

(13.13) “Una vez que termino con el proceso de los datos, pasamos al modelado, testeo de diferentes modelos de IA, y cuando encuentro el que está adecuado, lo pongo dentro del servidor y desde allí paso a liberar, ya sea para un cliente o internamente”.

(14.22) “Lo que más nos preguntan las empresas es cómo arrancar. El primer concepto es: si yo tengo un montón de datos de alimentación que no están correctos, lo que tengo que lograr es limpiarlos y tener un data set correcto, porque si le meto datos incorrectos a mi modelo de IA, el resultado será incorrecto. Suena obvio, pero en la práctica sucede mucho. Lo segundo es hacer un análisis exploratorio: entender cómo están mis datos. Hay dos puntos bien importantes que son definir el objetivo que tiene la empresa hacia los datos. Y, una vez que defina objetivos y prioridades, armar un equipo”.

La manera más simple de comprender la IA es con una comparación: las personas recibimos ingreso de datos a través de la vista, la audición, el tacto, el gusto, entre otros, y a partir de ellos tomamos una decisión. La IA es una función de distintos datos que terminan dando un resultado.

(23:00) “Hay dos errores dentro del modelado de IA que son el overfitting y el underfitting. El primero es cuando armo un modelo que
puede mapear exactamente todos los puntos del data set que le di. Si le doy un nuevo dato, le va a costar procesarlo y va a tener un error grande. El segundo, es un modelo que no logra seguir el patrón del conjunto de datos; entonces, cuando le doy un dato nuevo, también termina errado. ¿Qué es lo que buscamos al tener un modelo de IA? Permite un balance: no será tan exacto, pero voy a entender que tengo un error de magnitud, y al mismo tiempo predecir y estar cerca del valor”.

(24:52) “La caja negra en ciencia de datos son las redes neuronales. ¿Qué es una red neuronal? Es el nombre que se le puso a un conjunto de
funciones matemáticas. Una neurona es una serie de datos sobre algo que multiplicado por un factor y hacer una cuenta matemática. Eso me va a dar un valor. Esto por una neurona. Ahora si a esto lo transformo en varias neuronas voy a generar una secuencia matemática de funciones que luego voy a unir y terminará dando un resultado”.

(30:42) “Entonces, tengo los ingresos de datos, las distintas neuronas (una capa de neuronas) y a medida que va creciendo, la complejidad requiere mayor cantidad de poder de cómputo, y así tengo una red neuronal. ¿Qué significa entrenar un modelo de IA o una red neuronal? Es un poder de cómputo que con los datos aportados, da un peso específico. No es más que una ecuación matemática. Cuando tengo un modelo entrenado, lo subo a un servidor (no tiene tanto peso porque son solo pesos específicos), le doy nuevos datos, hace una multiplicación matemática y da el resultado. Eso es el entrenamiento de un modelo”.

(34:28) “No es que uno construye una red neuronal y aplica para todo sino que el trabajo de un cientista de datos es entender cómo tengo que construir la red y qué funciones tengo que utilizar. Los LLMs (Large Language Models) & GenAl (Generative Al) son los temas que más se están hablando. Los primeros toman una enorme cantidad de datos textuales de documentos, libros, páginas webs y demás, y termina
comprendiendo los patrones y estructuras del lenguaje. Así terminan generando la palabra siguiente y así armar párrafos. Los LLMs se utilizan para redactar informes, artículos, traducciones porque también entienden el contexto dentro de una oración. GenAl es algo similar, pero le tengo que dar el dato exacto para el cual lo quiero entrenar. Por ejemplo, si voy a pedir que genere imágenes, tengo que darle una enorme cantidad de datos y de calidad. Entonces, doy data sets, lo entreno y termina generando imágenes, videos, música”.

(37.40) Estructura de equipos y cómo trabajar en cuanto a los datos. Cuántos analistas de datos necesito, cuántos ingenieros de datos. Lo primero es establecer de dónde colecto la información: la extraigo y cargo a mi sistema. Sigue la transformación de los datos y prepararlos para mi data set. Hoy las empresas, procesan todos los datos para que las personas puedan consultarlos de una manera simple y no pedir a un equipo ciertos reportes. Dentro de los roles de los equipos están el analista de datos, el ingeniero de datos, el científico de datos y el arquitecto de datos. Son los 4 más conocidos. Los menos conocidos son el gerente de datos, ingeniero de ML, analista de negocio de datos, ingeniero de datos en la nube y la gobernanza de datos”.

La IA está transformando las industrias. Es como internet de hace 15/20 años y la velocidad a la que avanza y nos llega es muy superior a la que pensamos.

(43:55) «Nosotros nos transformaremos en personas que les daremos comandos a estos modelos agentes. Por más que no hayamos capacitado a los equipos, ya se está utilizando IA. Es importante entender los riesgos que conllevan como filtrar información confidencial dentro de la empresa. Por eso invito a que se armen ambientes de sistema cerrados en los cuales las informaciones no se filtran. Entender y aplicar IA correctamente impacta muy fuertemente en los costos de la empresa. Gran oportunidad de acercarnos a las tareas rutinarias, sacarlas de la empresa, tener mayor valor agregado y menos tareas repetitivas y manuales. Es entrenar a los equipos para que puedan
hacerlo internamente. Hay que perderle el miedo al cambio o esta nueva revolución digital y empezar a acostumbrarse a utilizar estas herramientas que cada vez serán más, por lo que hay que saber cómo utilizarlas de manera beneficiosa”.

Introducción a la Ciencia de Datos e Inteligencia Artificial

Notas más leídas

Mercados financieros tras la salida del cepo minorista: ¿qué sigue para las empresas?

Rediseñar la organización desde la IA: Una mirada AI-First

Marketing de Alto Impacto: cómo escalar tu negocio combinando psicología e inteligencia artificial

Educación francesa en Buenos Aires gracias al Colegio Franco Argentino Adrienne Bolland

Te podría interesar también

Notas más leídas