Cercanía y Comunidades Analizando Redes Sociales con Python y NetworkX – Parte 3

Analyzing Social Networks with Python and NetworkX - Part 3.

Aprende sobre comunidades y centralidad de cercanía en el análisis de redes sociales con Python y NetworkX

En la Parte 2, ampliamos nuestra comprensión del análisis de redes sociales al graficar las relaciones entre los miembros de las bandas Smashing Pumpkins y Zwan. Luego, examinamos métricas como la centralidad de grado y la centralidad de intermediación para investigar las relaciones entre los miembros de las diferentes bandas. Al mismo tiempo, discutimos cómo el conocimiento de dominio ayuda a informar nuestra comprensión de los resultados.

En la Parte 3, cubriremos los conceptos básicos de la centralidad de cercanía y cómo se calcula. Luego, demostraremos cómo calcular la centralidad de cercanía con NetworkX utilizando la red de Billy Corgan como ejemplo.

Obtén el código para generar este gráfico en mi GitHub. ⭐️ para fácil referencia.

Antes de empezar…

  1. ¿Tienes conocimientos básicos de Python? Si no, comienza aquí.
  2. ¿Estás familiarizado con conceptos básicos en el análisis de redes sociales, como nodos y bordes? Si no, comienza aquí.
  3. ¿Te sientes cómodo con la centralidad de grado y la centralidad de intermediación? Si no, comienza aquí.

Centralidad de cercanía y comunidades

Centralidad de cercanía

La centralidad de cercanía es una medida en el análisis de redes sociales que cuantifica qué tan cerca está un nodo de todos los demás nodos en una red en términos de la distancia del camino más corto.

La centralidad de cercanía se enfoca en la eficiencia del flujo de información o recursos dentro de una red. La idea es que los nodos con una centralidad de cercanía más alta pueden llegar a otros nodos de manera más rápida y eficiente, ya que tienen distancias promedio más cortas al resto de la red.

La centralidad de cercanía de un nodo se calcula como el recíproco de la suma de las distancias del camino más corto (SPD, por sus siglas en inglés) desde ese nodo a todos los demás nodos en la red.

Centralidad de cercanía = 1 / (Suma de SPD desde el nodo a todos los demás nodos)

Los valores más altos indican mayor centralidad y eficiencia en el flujo de información dentro de la red.

Calculando la centralidad de cercanía

Veámoslo paso a paso, utilizando una red simple con ocho nodos.

  1. Calcula las distancias del camino más corto (SPD) desde el nodo A a todos los demás nodos. Para nuestro ejemplo, utilizaremos distancias de ejemplo simples. En la práctica, esto se haría con un algoritmo de camino más corto como Búsqueda en Amplitud o el algoritmo de Dijkstra.

2. Calcula la suma de las distancias del camino más corto desde el nodo A a todos los demás nodos.

3. Aplica la fórmula de centralidad de cercanía.

Cercanía y comunidad

Podemos pensar en las comunidades como grupos de nodos que están más densamente conectados entre sí en comparación con las conexiones con nodos fuera del grupo. Las comunidades capturan la idea de subgrupos o módulos cohesivos dentro de una red, donde los nodos dentro de la misma comunidad tienen conexiones más sólidas entre ellos. Las comunidades se caracterizan por la presencia de conexiones intra-comunidad densas y conexiones inter-comunidad relativamente más dispersas.

Obtén el código para generar este gráfico en mi GitHub. ⭐️ para fácil referencia!

Cuando consideramos a los miembros de las bandas Smashing Pumpkins y Zwan, es fácil imaginar cómo las bandas están conectadas entre sí por los miembros que comparten. Esto demuestra tanto la conectividad intra-grupo entre los miembros de cada banda como la conectividad inter-grupo entre ambas bandas.

Mientras que la centralidad de cercanía mide la importancia individual de los nodos y la eficiencia del flujo de información, las comunidades capturan subgrupos cohesivos con conexiones densas. Juntos, contribuyen a comprender la dinámica del flujo de información y la organización de la red.

Discutamos algunas formas en que podemos utilizar la centralidad de cercanía y la comunidad para interpretar la dinámica de la red.

  1. Centralidad de cercanía dentro de las comunidades

Los nodos que pertenecen a la misma comunidad a menudo tienen valores de centralidad de cercanía más altos dentro de la comunidad. Esto indica que los nodos dentro de una comunidad están estrechamente conectados y pueden alcanzarse entre sí rápidamente en términos de las distancias más cortas. Una mayor centralidad de cercanía dentro de las comunidades refleja la eficiente flujo de información y comunicación dentro de los subgrupos.

Obtén el código para generar este gráfico en mi GitHub. ⭐️ para fácil referencia!

2. Conexión de comunidades con Centralidad de Cercanía

Los nodos que conectan diferentes comunidades o actúan como puentes entre comunidades pueden tener una centralidad de cercanía más alta en comparación con los nodos dentro de comunidades individuales. Estos nodos desempeñan un papel crucial en la conexión de comunidades separadas, facilitando la comunicación y el flujo de información entre ellas.

Obtén el código para generar este gráfico en mi GitHub. ⭐️ para fácil referencia!

3. Análisis a nivel de comunidad utilizando la centralidad de cercanía

La centralidad de cercanía también se puede utilizar a nivel de comunidad para analizar la importancia de las comunidades dentro de la red. Al agregar los valores de centralidad de cercanía de los nodos dentro de una comunidad, se puede evaluar la eficiencia general del flujo de información dentro de la comunidad. Las comunidades con una mayor centralidad de cercanía promedio pueden considerarse más centrales e influyentes en términos de su capacidad para acceder y difundir información dentro de la red.

Obtén el código para generar este gráfico en mi GitHub. ⭐️ para fácil referencia!

La centralidad de cercanía mide la importancia individual de los nodos y la eficiencia del flujo de información, mientras que las comunidades capturan subgrupos cohesivos con conexiones densas. Juntos, contribuyen a comprender la dinámica del flujo de información y la organización de la red.

Cuando se considera la esfera de influencia de Billy Corgan, la centralidad de cercanía puede proporcionar información sobre cómo los miembros de Smashing Pumpkins y Zwan influyen directa e indirectamente en los otros músicos en la red de Billy Corgan. Podemos utilizar el concepto de comunidad para describir cada banda, pero también podemos utilizarlo para describir el agregado de ambas bandas. En realidad, la comunidad de músicos de rock alternativo de los años 90 es vasta, y cuando agregamos más bandas a la red, aparecerán más comunidades.

Billy Corgan circa 1991 — Por Barb Vest, CC BY-SA 4.0

Centralidad de cercanía en NetworkX con Python

  1. Al igual que hicimos en la Parte 2, vamos a crear una función que generará todas las combinaciones de miembros de la banda para cada banda.

2. A continuación, definimos cada banda y aplicamos la función para generar la lista de tuplas. Luego, combinamos las listas y usamos una comprensión de lista para eliminar cualquier duplicado.

3. Ahora podemos dibujar el gráfico.

Debería verse algo así:

4. Finalmente, calculemos la centralidad de cercanía y analicemos los valores.

La salida debería verse así:

¿Qué podemos decir sobre los valores?

  • Billy Corgan y Jimmy Chamberlin tienen la centralidad de cercanía más alta de 1.00, lo que indica que son los miembros más centrales en términos de llegar rápidamente a otros miembros.
  • James Iha, Katie Cole, D’arcy Wretzky, Melissa Auf der Maur, Ginger Pooley, Mike Byrne y Nicole Fiorentino tienen el mismo valor de centralidad de cercanía de 0.785714. Esto sugiere que estos miembros están estrechamente conectados y pueden llegar rápidamente entre sí.
  • Paz Lenchantin, David Pajo y Matt Sweeney tienen un valor ligeramente menor de centralidad de cercanía de 0.611111. Esto indica que pueden ser menos centrales en términos de llegar a otros miembros en comparación con el grupo anterior, pero aún están relativamente bien conectados dentro de la red.

Dado que todavía estamos tratando con una red relativamente simple, estos resultados no revelan nada más allá de lo que aprendimos cuando calculamos la centralidad de grado y la centralidad de intermediación para la red de Billy Corgan. En la Parte 4, agregaremos complejidad al introducir más bandas y músicos a la red. ¡Como bonificación, introduciremos algunas técnicas avanzadas en Matplotlib para hacer que tus gráficos de NetworkX sean aún más atractivos!

Si deseas el tutorial completo de Python anotado , visita mi GitHub !

👩🏻‍💻 Christine Egan | Zepes | github | linkedin

Como miembro de Zepes, una parte de tu tarifa de membresía va a los escritores que lees, y tienes acceso completo a cada historia…

Zepes.com

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Una Bendición y un Monstruo Los Anunciantes Aceptan Cautelosamente la Inteligencia Artificial

Muchos anuncios son más fáciles de hacer con la tecnología en constante mejora. También representa una amenaza para u...

Inteligencia Artificial

La ciudad más avanzada tecnológicamente de Estados Unidos tiene dudas sobre los coches autónomos

Los funcionarios y residentes de San Francisco no están impresionados por los autos autónomos, subrayando los desafío...

Inteligencia Artificial

Comparación de Frameworks de Aprendizaje Profundo

Descubre los principales marcos de trabajo de aprendizaje profundo para desarrolladores. Compara características, ren...

Inteligencia Artificial

Conoce snnTorch Un paquete de Python de código abierto para realizar aprendizaje basado en gradientes con redes neuronales de disparo.

En inteligencia artificial, la eficiencia y el impacto ambiental se han convertido en preocupaciones primordiales. Ab...

Inteligencia Artificial

Google AI presenta WeatherBench 2 un marco de aprendizaje automático para evaluar y comparar diversos modelos de pronóstico del tiempo

El aprendizaje automático (ML) se ha utilizado cada vez más en la predicción del tiempo en los últimos años. Ahora qu...