Рекомендации по обработке запросов по границам и атрибутам node в NetworkX

Использование NetworkX и нового для библиотеки для запроса анализа социальной сети. В Query я имею в виду выбор/создание подграфов атрибутами обоих ребер узлов, где ребра создают путь, а узлы содержат атрибуты. Граф использует MultiDiGraph формы

Есть ли лучший способ запроса? Или лучше всего создавать пользовательские итерации для создания подграфов?

В качестве альтернативы (и отдельного вопроса) график можно упростить, но я не использую приведенный ниже график, потому что объекты типа "ненависть" будут иметь прецессоры. Это упростит запрос? Кажется, что проще перебирать узлы

Ответы

Ответ 1

На основе @Aric answer вы можете найти красную рыбу следующим образом:

red_fish = set(n for u,v,d in G.edges_iter(data=True)
               if d['color']=='red'
               for n in (u, v)
               if G.node[n]['label']=='fish')

print(red_fish)
# set([2])

Ответ 2

Очень просто написать однострочный файл для создания списка или генератора узлов с определенным свойством (здесь показаны генераторы)

import networkx as nx

G = nx.Graph()
G.add_node(1, label='one')
G.add_node(2, label='fish')
G.add_node(3, label='two')
G.add_node(4, label='fish')

# method 1
fish = (n for n in G if G.node[n]['label']=='fish')
# method 2
fish2 = (n for n,d in G.nodes(data=True) if d['label']=='fish')

print(list(fish))
print(list(fish2))

G.add_edge(1,2,color='red')
G.add_edge(2,3,color='blue')

red = ((u,v) for u,v,d in G.edges(data=True) if d['color']=='red')

print(list(red))

Если ваш график большой и фиксированный, и вы хотите быстро найти, вы можете сделать "обратный словарь" таких атрибутов,

labels = {}
for n, d in G.nodes(data=True):
    l = d['label']
    labels[l] = labels.get(l, [])
    labels[l].append(n)
print labels

Ответ 3

Чтобы выбрать ребра на основе атрибутов ребер и узлов, вы можете сделать что-то подобное, используя ваш график, G2:

def select(G2, query):
    '''Call the query for each edge, return list of matches'''
    result = []
    for u,v,d in G2.edges(data=True):
        if query(u,v,d):
            result.append([(u,v)])
    return result

# Example query functions
# Each assumes that it receives two nodes (u,v) and 
# the data (d) for an edge 

def dog_feeling(u, v, d):
    return (d['statementid'] == "3" 
            and G2.node[u]['type'] == "Dog"
            or G2.node[u]['type'] == "Dog")

def any_feeling(u,v,d):
    return (d['statementid'] == "3" 
            and G2.node[u]['type'] == "Feeling"
            or G2.node[u]['type'] == "Feeling")

def cat_feeling(u,v,d):
    return (G2.node[u]['type'] == "Cat"
            or G2.node[v]['type'] == "Cat")

# Using the queries
print select(G2, query = dog_feeling)
print select(G2, query = any_feeling)
print select(G2, query = cat_feeling)

Это абстрагирует процесс итерации на функцию select(), и вы можете писать свои запросы как индивидуальные, проверяемые функции.