Cultivando una carrera en datos en la era de la IA generativa

'Carrera en datos en la era de la IA generativa'

Crear conciencia sobre el aprendizaje de tres conceptos fundamentales de datos

Foto de Brett Jordan en Unsplash

Como profesional de datos, me sorprende todo el desarrollo reciente en el área de la IA generativa.

Mientras algunos lo consideran hype y están dispuestos a descartarlo rápidamente como otra tendencia tecnológica, otros están convencidos de que es un cambio de juego.

Independientemente de qué postura apoyes, es difícil ignorar las posibilidades transformadoras que la IA generativa puede aportar al futuro de la educación y el lugar de trabajo.

Para respaldar esta afirmación, basta con mencionar que la Universidad de Harvard está introduciendo un chatbot de IA en las aulas este otoño (otoño de 2023) para aproximar una relación uno a uno entre profesor y estudiante. Los estudiantes utilizarán el chatbot desarrollado por Harvard para guiarlos hacia soluciones en lugar de proporcionarles respuestas directas.

Para mí, esto es un claro indicador de que Harvard está desencadenando una ola de cambio en cómo las nuevas generaciones aprenderán y, en consecuencia, trabajarán.

Es decir, la IA generativa no es solo una tendencia pasajera, y necesitamos comenzar a encontrar una forma de adaptar nuestros entornos de trabajo a ella.

A pesar de mi visión entusiasta de la IA generativa, nunca antes había tenido tanto FOMO.

En otras palabras, aunque he navegado por diversos roles de datos en los últimos 12 años y he adquirido conocimientos sobre conceptos de aprendizaje automático, no puedo mantenerme al día con los nuevos avances en el área de la IA generativa.

Los nuevos términos, el concepto de ingeniería de consignas, el desarrollo de nuevos modelos de lenguaje grandes, numerosas aplicaciones y soluciones construidas sobre ellos, nuevos cursos de aprendizaje en línea y el volumen abrumador de publicaciones sobre este tema: todo esto es simplemente abrumador.

Además, no puedo quitarme la sensación inquietante de que algunas de mis habilidades en datos ahora son simplemente, bueno, obsoletas.

La idea de que mis colegas de negocios reemplacen mis habilidades de consulta, tan arduamente adquiridas, con unos pocos golpes de teclado es aterradora.

Sin embargo, al pensarlo mejor, debo admitir que ni siquiera me importa el hecho de que algunas (pero solo algunas) de mis habilidades sean reemplazadas. Ejecutar consultas ad-hoc varias veces por semana para responder las mismas preguntas comerciales repetitivas es algo que nunca me gustó hacer.

Entre otras cosas, soy consciente de que “yo” estando entre los datos almacenados en el almacén de datos y la generación de conocimientos empresariales solo está ralentizando el proceso de toma de decisiones.

Otra cosa de la que soy consciente es que esta transición, es decir, mi sustitución, no ocurrirá de la noche a la mañana.

En primer lugar, los entornos de desarrollo actuales deben adaptarse, es decir, deben ser más “amigables para el usuario de negocios” y menos “amigables para los desarrolladores”.

En segundo lugar, los usuarios de negocios deberán adquirir una comprensión técnica de lo que está “detrás del centro”. La libertad para generar ideas analíticas a partir de entradas de texto natural también conlleva los mismos problemas.

Problemas como la generación lenta de conocimientos, la generación incorrecta de conocimientos, el enriquecimiento de los conocimientos sin nuevas entradas (nuevas fuentes de datos) y el proceso técnico de verificación de calidad de los conocimientos seguirán existiendo.

Y alguien seguirá teniendo que manejar y “solucionar” estos problemas para los usuarios de negocios.

En otras palabras, la IA generativa no podrá reemplazar fácilmente los conocimientos fundamentales sobre datos.

Entonces, ¿qué quiero decir con conocimiento de datos “fundamental”?

Para respaldar mi respuesta con los problemas mencionados anteriormente, se reduce a tres conceptos fundamentales:

  1. Construcción de Arquitectura de Datos

Argumento: El conocimiento técnico y la comprensión de cómo diseñar una arquitectura de datos adecuada en una industria específica son cruciales.

Permíteme darte un ejemplo de la industria fintech.

En la industria fintech, existen regulaciones estrictas, es decir, los Estándares de Seguridad de Datos de PCI, que deben tenerse en cuenta al construir una plataforma de datos. Además de estos estándares, a veces existen estándares basados en el mercado.

Por ejemplo, en Suiza, entre otros, existen regulaciones de FINMA que deben tenerse en cuenta para que su plataforma de datos, y en consecuencia su arquitectura de datos, sean conformes.

Por supuesto, las regulaciones están sujetas a cambios, lo que implica que la arquitectura de datos debe seguir estos cambios. Y esto impone un desafío real para la IA generativa.

La IA generativa puede respaldar el diseño y desarrollo de la arquitectura hasta cierto nivel específico.

Pero no es capaz de diseñar soluciones arquitectónicas personalizables en industrias donde las regulaciones están cambiando.

No posee la capacidad de aplicar adaptaciones arquitectónicas específicas si no ha sido entrenada en ejemplos históricos similares.

2. Gestión de calidad de datos

Argumento: El dicho “basura entra, basura sale” siempre será válido, y todos los que trabajan en el mundo de los datos saben exactamente cuál es el costo de una mala calidad de entrada de datos.

El uso de soluciones de IA generativa aumenta aún más el costo de una mala calidad de salida.

Por ejemplo, necesito referirme a un artículo reciente que leí en The Guardian. Era un artículo sobre un abogado que utilizaba ChatGPT para proporcionar ejemplos de casos legales anteriores similares. Quería respaldar su argumento sobre por qué la demanda de su cliente contra la compañía de aviación no debería ser desestimada.

Creo que ya puedes imaginar cómo termina la historia: cuando los abogados de la aerolínea verificaron las decisiones citadas y las citas legales, descubrieron que ninguna de ellas existía. En resumen, ChatGPT estaba alucinando.

Para sacar conclusiones de este artículo, la mala calidad de los datos de salida puede costarte un negocio y llevar a la suspensión completa de un proyecto o a perder clientes y reputación.

Por lo tanto, los profesionales de datos estarán aún más ocupados gestionando la calidad de los datos de entrada y salida.

3. Privacidad y seguridad de datos

Argumento: Como profesional de datos, eres consciente de los conceptos de inyecciones SQL y seguridad de bases de datos.

Con los avances en IA generativa y el uso simple de indicaciones, los ataques a almacenes de datos y los escenarios de violación de datos son más probables que nunca.

El peligro de las inyecciones de indicaciones, es decir, la posibilidad de que con una entrada de texto alguien pueda potencialmente eliminar toda la base de datos o acceder a registros confidenciales, debe ser el centro de la seguridad de datos.

Lo que significa que los profesionales de datos y de TI seguirán desempeñando roles cruciales en la protección y seguridad de los datos.

En resumen: los profesionales de datos con conocimiento de conceptos de datos fundamentales permanecerán en el lugar de trabajo como “constantes” que gestionarán los datos de manera eficiente, identificarán problemas y optimizarán soluciones para cumplir con los requisitos, ser seguras y confiables.

Esta es la parte que la IA generativa no podrá reemplazar fácilmente.

Entonces, si eres un profesional joven que busca consejos sobre cómo desarrollar tu carrera en datos en la era de la IA generativa, comienza aprendiendo los conceptos fundamentales mencionados anteriormente.

Créeme en esto: invertir tiempo y recursos para adquirir conocimientos fundamentales de datos tendrá beneficios a largo plazo en tu carrera en datos.

La IA generativa impulsará tu curva de aprendizaje y rendimiento laboral en estas áreas, pero solo te ayudará hasta cierto nivel. El trabajo “importante” seguirá siendo responsabilidad tuya y de tus conocimientos.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Aprendizaje profundo para objetos profundos ZoeDepth es un modelo de IA para la estimación de profundidad en múltiples dominios

¿Alguna vez te has encontrado con ilusiones en las que un niño en la imagen parece más alto y más grande que un adult...

Inteligencia Artificial

Científicos recrean canción de Pink Floyd leyendo las señales cerebrales de los oyentes

El audio suena como si se estuviera reproduciendo bajo el agua. Aún así, es un primer paso hacia la creación de dispo...

Inteligencia Artificial

Cuando la visión por computadora funciona más como un cerebro, ve más como lo hacen las personas.

Entrenar redes neuronales artificiales con datos de cerebros reales puede hacer que la visión por computadora sea más...

Investigación

Usando Inteligencia Artificial, científicos encuentran un medicamento que podría combatir infecciones resistentes a los medicamentos.

El algoritmo de aprendizaje automático identificó un compuesto que mata Acinetobacter baumannii, una bacteria que ace...

Inteligencia Artificial

Evaluando el Potencial de Conciencia en la IA Una Exploración Científica de las Propiedades Indicadoras Basadas en Teorías Neurocientíficas

La posibilidad de sistemas de IA conscientes es un tema candente en este momento. Los principales investigadores se e...