Как создать взвешенный список смежности / матрицу из списка edge?

моя проблема очень проста: мне нужно создать список смежности/матрица из списка ребер.

у меня есть список ребер, хранящийся в документе csv с column1 = node1 и column2 = node2, и я хотел бы преобразовать его в взвешенный список смежности или взвешенную матрицу смежности.

чтобы быть более точным, вот как выглядят данные-где числа - это просто идентификаторы узлов:

node1,node2
551,548
510,512
548,553
505,504
510,512
552,543
512,510
512,510
551,548
548,543
543,547
543,548
548,543
548,542

любые советы о том, как добиться конверсии от этого взвешенный список/матрица смежности? Вот как я решил сделать это раньше, без успеха (любезно Дай Шизука):

dat=read.csv(file.choose(),header=TRUE) # choose an edgelist in .csv file format
el=as.matrix(dat) # coerces the data into a two-column matrix format that igraph likes
el[,1]=as.character(el[,1])
el[,2]=as.character(el[,2])
g=graph.edgelist(el,directed=FALSE) # turns the edgelist into a 'graph object'

спасибо!

4 ответов


в этом ответе используется только база R. Результатом является стандартная матрица, используемая для представления матрицы смежности.

 el  <- cbind(a=1:5, b=5:1) #edgelist (a=origin, b=destination)
 mat <- matrix(0, 5, 5)
 mat[el] <- 1
 mat
 #    [,1] [,2] [,3] [,4] [,5]
 #[1,]    0    0    0    0    1
 #[2,]    0    0    0    1    0
 #[3,]    0    0    1    0    0
 #[4,]    0    1    0    0    0
 #[5,]    1    0    0    0    0

здесь mat ваша матрица смежности определена из edgelist el, что является простым cbind векторов 1:5 и 5:1.

если ваш edgelist включает веса, то вам нужно немного другое решение.

el <- cbind(a=1:5, b=5:1, c=c(3,1,2,1,1)) # edgelist (a=origin, b=destination, c=weight)
mat<-matrix(0, 5, 5)
for(i in 1:NROW(el)) mat[ el[i,1], el[i,2] ] <- el[i,3]  # SEE UPDATE
mat
#     [,1] [,2] [,3] [,4] [,5]
#[1,]    0    0    0    0    3
#[2,]    0    0    0    1    0
#[3,]    0    0    2    0    0
#[4,]    0    1    0    0    0
#[5,]    1    0    0    0    0

обновление

некоторое время спустя я понял, что цикл for (3-я строка) в предыдущем примере взвешенного edgelist не требуется. Вы можете заменить его на следующие векторные операции:

mat[el[,1:2]] <- el[,3]

сообщение на моем сайте, которое вы упоминаете в вопросе (https://sites.google.com/site/daishizuka/toolkits/sna/sna_data) использует пакет igraph, поэтому убедитесь, что он загружен.

кроме того, недавно я понял, что igraph обеспечивает гораздо более простой способ создания взвешенной матрицы смежности из edgelists, используя graph.данные.рамка.)( Я обновил это на своем сайте, но вот простой пример:

library(igraph)
el=matrix(c('a','b','c','d','a','d','a','b','c','d'),ncol=2,byrow=TRUE) #a sample edgelist
g=graph.data.frame(el)
get.adjacency(g,sparse=FALSE)

Это должно сделать это. Аргумент sparse=FALSE говорит ему показать 0 в матрице смежности. Если вы действительно не хотите использовать igraph, я думаю, что это неуклюжий способ сделать это:

el=matrix(c('a','b','c','d','a','d','a','b','c','d'),ncol=2,byrow=TRUE) #a sample edgelist
lab=names(table(el)) #extract the existing node IDs
mat=matrix(0,nrow=length(lab),ncol=length(lab),dimnames=list(lab,lab)) #create a matrix of 0s with the node IDs as rows and columns
for (i in 1:nrow(el)) mat[el[i,1],el[i,2]]=mat[el[i,1],el[i,2]]+1 #for each row in the edgelist, find the appropriate cell in the empty matrix and add 1.

начните с ребер фрейма данных и используйте igraph для получения матрицы смежности:

голова(края)

  node1 node2
1   551   548
2   510   512
3   548   553
4   505   504
5   510   512
6   552   543

library(igraph)
as.matrix(get.adjacency(graph.data.frame(edges)))

    551 510 548 505 552 512 543 553 504 547 542
551   0   0   2   0   0   0   0   0   0   0   0
510   0   0   0   0   0   2   0   0   0   0   0
548   0   0   0   0   0   0   2   1   0   0   1
505   0   0   0   0   0   0   0   0   1   0   0
552   0   0   0   0   0   0   1   0   0   0   0
512   0   2   0   0   0   0   0   0   0   0   0
543   0   0   1   0   0   0   0   0   0   1   0
553   0   0   0   0   0   0   0   0   0   0   0
504   0   0   0   0   0   0   0   0   0   0   0
547   0   0   0   0   0   0   0   0   0   0   0
542   0   0   0   0   0   0   0   0   0   0   0

еще одна возможность с qdapTools:

library(qdapTools)

el[rep(seq_len(nrow(el)), el[,'c']), c('a', 'b')] %>%
    {split(.[,'b'], .[,'a'])} %>%
    mtabulate()

##   1 2 3 4 5
## 1 0 0 0 0 3
## 2 0 0 0 1 0
## 3 0 0 2 0 0
## 4 0 1 0 0 0
## 5 1 0 0 0 0