|
|
51CTO旗下网站
|
|
移动端

新的PyTorch图神经网络库,快了14倍:LeCun盛赞,GitHub 2000星

当科学家们发现,图神经网络 (GNN) 能搞定传统CNN处理不了的非欧数据,从前深度学习解不开的许多问题都找到了钥匙。

作者:方栗子来源:量子位|2019-03-15 11:34

 

本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。

“CNN已老,GNN当立!”

当科学家们发现,图神经网络 (GNN) 能搞定传统CNN处理不了的非欧数据,从前深度学习解不开的许多问题都找到了钥匙。

如今,有个图网络PyTorch库,已在GitHub摘下2000多星,还被CNN的爸爸Yann LeCun翻了牌:

它叫PyTorch Geometric,简称PyG,聚集了26项图网络研究的代码实现。

这个库还很,比起前辈DGL图网络库,PyG最高可以达到它的15倍速度。

应有尽有的库

要跑结构不规则的数据,就用PyG吧。不管是图形 (Graphs),点云 (Point Clouds) 还是流形(Manifolds) 。

△ 右边是不规则的,非欧空间

这是一个丰盛的库:许多模型的PyTorch实现,各种有用的转换 (Transforms) ,以及大量常见的benchmark数据集,应有尽有。

说到实现,包括Kipf等人的图卷积网络 (GCN) 和Bengio实验室的图注意力网络 (GAT) 在内,2017-2019年各大顶会的 (至少) 26项图网络研究,这里都能找到快速实现。

到底能多快?PyG的两位作者用英伟达GTX 1080Ti做了实验。

对手DGL,也是图网络库:

在四个数据集里,PyG全部比DGL跑得快。最悬殊的一场比赛,是在Cora数据集上运行GAT模型:跑200个epoch,对手耗时33.4秒,PyG只要2.2秒,相当于对方速度的15倍。

每个算法的实现,都支持了CPU计算和GPU计算。

食用方法

库的作者,是两位德国少年,来自多特蒙德工业大学。

△ 其中一位

他们说,有了PyG,做起图网络就像一阵微风。

你看,实现一个边缘卷积层 (Edge Convolution Layer) 只要这样而已:

  1.  1import torch 
  2.  2from torch.nn import Sequential as Seq, Linear as Lin, ReLU 
  3.  3from torch_geometric.nn import MessagePassing 
  4.  4 
  5.  5class EdgeConv(MessagePassing): 
  6.  6 def __init__(self, F_in, F_out): 
  7.  7 super(EdgeConv, self).__init__() 
  8.  8 self.mlp = Seq(Lin(2 * F_in, F_out), ReLU(), Lin(F_out, F_out)) 
  9.  9 
  10. 10 def forward(self, x, edge_index): 
  11. 11 # x has shape [N, F_in] 
  12. 12 # edge_index has shape [2, E] 
  13. 13 return self.propagate(aggr='max', edge_index=edge_index, x=x) # shape [N, F_out] 
  14. 14 
  15. 15 def message(self, x_i, x_j): 
  16. 16 # x_i has shape [E, F_in] 
  17. 17 # x_j has shape [E, F_in] 
  18. 18 edge_features = torch.cat([x_i, x_j - x_i], dim=1# shape [E, 2 * F_in] 
  19. 19 return self.mlp(edge_features) # shape [E, F_out] 

安装之前确认一下,至少要有PyTorch 1.0.0;再确认一下cuda/bin在$PATH里,cuda/include在$CPATH里:

  1. 1$ python -c "import torch; print(torch.__version__)" 
  2. 2>>> 1.0.0 
  3. 3 
  4. 4$ echo $PATH 
  5. 5>>> /usr/local/cuda/bin:... 
  6. 6 
  7. 7$ echo $CPATH 
  8. 8>>> /usr/local/cuda/include:... 

然后,就开始各种pip install吧。

PyG项目传送门:

https://github.com/rusty1s/pytorch_geometric

PyG主页传送门:

https://rusty1s.github.io/pytorch_geometric/build/html/index.html

PyG论文传送门:

https://arxiv.org/pdf/1903.02428.pdf

【编辑推荐】

  1. 被数据隐私安全“凌迟”的扎克伯格
  2. 2019五大顶尖数据科学GitHub项目和Reddit热帖
  3. 1400 小时数据,Common Voice 成最大开源人类语音数据集
  4. 3 月数据库排行:MySQL 指数持续大涨,PostgreSQL 下跌
  5. 数据科学岗位将在未来5年内重新洗牌,你准备好转型了吗?
【责任编辑:张燕妮 TEL:(010)68476606】

点赞 0
分享:
大家都在看
猜你喜欢

订阅专栏+更多

Jenkins Pipeline可持续化集成

Jenkins Pipeline可持续化集成

优化运维流水线
共3章 | youerning

82人订阅学习

笑熬浆糊之职场那些事

笑熬浆糊之职场那些事

IT人的职场心法
共22章 | Bear_Boss

66人订阅学习

Redis运维秘籍

Redis运维秘籍

运维标配技术
共15章 | one叶孤舟

146人订阅学习

读 书 +更多

XML基础教程

本书分为8章。第1章主要对XML做了简单的介绍。第2章详细讲解规范的XML文件。第3章主要讲解有效的XML文件,特别重点讲解DTD文件。第4章讲解C...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊

51CTO服务号

51CTO播客