OpenAI presenta GPTBot un rastreador web diseñado para extraer datos de toda la Internet automáticamente

OpenAI presenta GPTBot, un rastreador web para extraer datos automáticamente de toda la Internet.

OpenAI ha respondido a las preocupaciones de privacidad y propiedad intelectual derivadas de la recopilación de datos en sitios web públicos mediante la introducción de una nueva herramienta web llamada GPTBot. Esta tecnología tiene como objetivo recopilar datos web públicos de manera transparente y utilizarlos para entrenar sus modelos de IA, todo bajo el paraguas de OpenAI.

El agente de usuario de GPTBot tiene como objetivo recopilar datos que contribuyan a refinar los futuros modelos de IA. Durante este proceso, GPTBot omitirá fuentes que requieran pago. Sin embargo, es importante tener en cuenta que algunos datos recopilados pueden contener inadvertidamente información o texto identificable, violando las políticas de OpenAI.

OpenAI reconoce la necesidad de proporcionar a los administradores de sitios web opciones con respecto al acceso a la plataforma de GPTBot. Otorgar acceso se percibe como una colaboración para mejorar la precisión de los modelos de IA, mejorando así sus capacidades y reforzando las medidas de seguridad. Por otro lado, OpenAI ha delineado un procedimiento para aquellos que prefieren no incluir sus sitios web en los esfuerzos de recopilación de datos de GPTBot. Esta guía incluye la incorporación de directivas de GPTBot en el archivo robots.txt del sitio web y la configuración de su acceso a segmentos de contenido específicos.

OpenAI ha publicado el rango de direcciones IP vinculado a las actividades de GPTBot para lograr una mayor transparencia. Esta publicación no solo ayuda a identificar las acciones del bot, sino que también proporciona los medios para bloquear su acceso si es necesario.

Estas iniciativas de transparencia destacan la respuesta de OpenAI a las críticas enfrentadas por los operadores de modelos de IA acusados de recopilar datos sin consentimiento explícito. El sentimiento predominante sostiene que las prácticas de la industria han infringido potencialmente los derechos de propiedad intelectual y las protecciones de privacidad al recolectar contenido de sitios web públicos sin autorización adecuada. Esto, a su vez, ha llevado a un llamado para que las entidades de IA ofrezcan mecanismos más completos de aceptación y rechazo, permitiendo a los propietarios de sitios web y custodios de datos tener voz en el uso de su contenido.

La plataforma de recaudación de fondos de Kickstarter introdujo recientemente regulaciones relacionadas con los proyectos de IA. Entre estas regulaciones, un requisito importante es que los proyectos que utilizan fuentes de datos externas deben proporcionar evidencia de acuerdos de licencia adecuados y obtener el consentimiento de los sitios web fuente. Los proyectos que no cumplan con esta obligación no serán elegibles para ser listados en Kickstarter.

En la próxima semana, se espera que OpenAI se someta a una revisión importante, marcada por la transición de la capa fundamental de ChatGPT a GPT-4. Además, las mejoras en el complemento Code Interpreter incluirán el soporte para cargar múltiples archivos en las indicaciones, reflejando el compromiso de OpenAI con la mejora continua y la innovación.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Aprendizaje Automático

Google DeepMind está trabajando en un algoritmo para superar a ChatGPT.

En un anuncio innovador, Demis Hassabis, el CEO del laboratorio de IA DeepMind de Google, presentó el desarrollo de u...

Inteligencia Artificial

Explicar decisiones médicas en entornos clínicos utilizando Amazon SageMaker Clarify

En esta publicación, mostramos cómo mejorar la explicabilidad del modelo en entornos clínicos utilizando Amazon SageM...

Inteligencia Artificial

AI Equipaje para Personas con Discapacidad Visual Recibe Excelentes Críticas

La maleta de IA ofrece características que superan a las de los sistemas de guía tradicionales de teléfonos inteligen...

Inteligencia Artificial

Descubre Davidsonian Scene Graph un marco de IA revolucionario para evaluar la IA de texto a imagen con precisión

Los modelos de texto a imagen (T2I) son difíciles de evaluar y a menudo dependen de métodos de generación y respuesta...

Inteligencia Artificial

Equipo de robots en gira de exploración lunar

Un equipo suizo ha propuesto enviar equipos de robots complementarios en misiones exploratorias a la Luna en lugar de...