登录  注册 退出

密码子图书馆

您现在的位置是: 首页 > 科研绘图 > 平面绘图

平面绘图

Gephi功能总结

密码子图书馆 2021-07-29 14:42:13平面绘图
一、软件介绍1、开源软件2、安装:JAVA环境 + Gephi(https://gephi.org/)3、用于分析各种网络和复杂系统、动态和分层图的交互可视化与探测开源工具。可用作探索性数据分析、链接分析、社交网络分析、生物网络分析等。其目标是成为“

一、软件介绍

1、开源软件

2、安装:JAVA环境 + Gephi(https://gephi.org/)

3、用于分析各种网络和复杂系统、动态和分层图的交互可视化与探测开源工具。可用作探索性数据分析、链接分析、社交网络分析、生物网络分析等。其目标是成为“数据可视化领域的Photoshop”。

二、软件设计思想

1、网络科学致力于研究节点node和边edge组成的网络,节点可以从个体、组织到国家,也可以从分子、基因到网页、地点;边也可以是人际关系、组织关系与国家关系,也可以是从神经网络、网页引用到交通网络。gephi致力于网络科学,正如spss致力于社会科学。Gephi在处理网络时,需要把网络转换为节点与边这样一种简化的形式,这种用节点和边表示一组事物之间关系的方式,来源于图论。

2、gephi提供的分析可以分为两种:

(1)通过不同的布局算法按照一定的方式排列节点在图中的位置,并从节点的位置对网络做出解读,也就是直接把关系转换为图,并以图形的方式研究网络;

(2)通过不同的统计算法根据节点与边的不同连接关系,用不同方式进行计算,计算的内容包括网络的总体特征、网络的模块化、节点的中心度、节点的路径特征、节点的动态度等。这些统计得出的值会存储到节点或边的数据中,并在外观中作用于节点和边,最终显示在图形上,供研究发现网络的特性。

三、功能介绍

Gephi共包括三个主要页面:概览(图处理,可视化编辑的主要界面);数据资料(分为节点数据和连线数据,在数据表上方和下方是用于数据处理的工具);预览(预览输出,图形处理完成后,可以在此输出)。其中,概览(图处理)界面是主要应用界面,下面主要介绍概览界面的主要功能。

(一)数据要求

1、数据生成方式

(1)直接输入(节点、边);(2)导入csv文件;(3)使用随机数

2、三维坐标

Gephi提供了一个三维空间,节点在空间中具有上下、左右和深度坐标。有三种方式可以改变节点的坐标:

(1)通过鼠标拖动改变节点的x和y坐标;

(2)通过布局改变,但目前没有改变z坐标的布局算法;

(3)直接编辑节点的坐标:选中——节点编辑。

3、动态数据

在gephi中可以定义一个节点或一条边的生命期,一个节点或边可以占据图的所有时段,可以存在于某个时间段,也可以是存在于对个时间段,在生命周期内节点或边存在,周期外不存在。用于控制节点和边的生命期的字段为interval,定义动态数据后,展示方法为:单击“启动时间线”。

(二)图窗体:图形编辑和显示

1、操作节点和连线的工具(左侧)

图片

(1)鼠标选取范围尺寸调整:如果将鼠标移动到某一节点上,与这个节点组成边的其他节点就会显示,从而了解该节点的关联状态。单击configure按钮,可以设置鼠标选取的范围,即同时选择一组节点,并且显示这组节点相关联的其他节点。

(2)单选:单独选择一个节点,右击进行操作。

(3)矩形选取:在一个矩形范围内选取一组节点。

(4)移动:按左键拖动节点、按右键拖动图像、滑动鼠标滑轮放大或缩小整个图形。

(5)单节点涂色:单击次数越多,节点颜色越深。在矩形范围内会给多个节点涂色。

(6)节点大小调整:按住鼠标左键上下拖动

(7)关联节点涂色:颜色、颜色强度、扩散模式

(8)新建节点:颜色、直径

(8)新建边:边的类型和权重

(9)节点距离:判断两个节点之间是否存在路径,如果存在就把最短路径用选中的颜色表示出来。

(10)节点范围:以一个节点为起点,根据距离的远近,给不同距离的节点涂上不同的颜色,在涂色中,也会引入权重的参数,在涂色之前需要配置涂色的模式和色彩,其中,涂色的模式分为梯度grandient和调色板palette。

(11)节点属性:节点属性是节点基础数据和统计数据的查看和编辑工具,分为Properties(属性)数据和Attributes(特性)数据。Properties(属性)可以理解为节点天生的、固有的数据,包括尺寸、位置(X/Y/Z)、颜色、标签大小、标签颜色;Attributes(特性)数据可理解为抽象化、动态变更的数据,包括ID、标签、间隔,Attributes(特性)数据可以根据节点数据的增加而扩充。

2、编辑标签和控制显示属性的工具(下方)

图片

(1)图形复位:使图形缩放到能够最大化地全部显示在图窗体中。

(2)全部节点颜色复位:重设全部节点的颜色。

(3)复位标签颜色:标签颜色恢复默认。

(4)复位标签大小:标签大小恢复默认。

(5)背景颜色:重设背景颜色。

(6)节点标签显示:是否显示节点标签,默认关闭

3、工具全局设置

(1)全局设置Global

图片

自动选择邻居:鼠标指向一个节点后,关联节点显示的方式。

高亮选择:鼠标指向一个节点后,这个节点与其他节点颜色的变化方式,勾选后指向的节点保持原来的颜色,其他节点变暗;取消勾选后,指向的节点变暗,其他节点保持原来颜色。

(2)边

图片

Use node color:指边会使用节点的颜色。

选择颜色:勾选后,把鼠标移动到一个节点后,这个节点出边、入边与双向边会用不同的颜色显示。

(3)label

图片

节点标签大小:共有三种类型:fixed(固定大小,标签大小不跟节点大小变化而变化)、scaled(标签随节点大小变化而变化)、node size(节点越大,标签越大,但标签大小本身是固定的,不随节点大小变化而变化)。

节点标签颜色:共有三种类型:unique表示节点标签和边标签都是用选定的颜色;object表示节点标签使用节点颜色,边标签使用边的颜色;text表示节点标签都使用默认黑色。

隐藏未选定 :勾选后,只有鼠标移动到某个节点上后标签才会显示。

重设文本设定 :设置在图中节点和边用什么字段作为标签。

(三)布局:节点与边的排布

布局是根据某种策略对节点和边进行排布,使图形既具有特定需要的合理性,也易于视觉识别。它们的核心都是平衡一个网络中节点的斥力和引力关系。一般来说,布局应满足:使节点均匀分布在有限的区域内;避免边的交叉和弯曲;保持边的长度一致;使整体布局能反映图的内在特性。

默认布局(12种)大致可分为两类:一类是力引导布局(6种:force atlas;force atlas2;fruchterman reingold;openord;yifan hu;yifan hu 比例);另一类是辅助性的、带有编辑和调整性质的布局(6种:noverlap;rotate;扩展;收缩;标签调整;随机布局)

gephi内置布局算法

图片


(四)统计:使用算法测度网络

1、根据统计算法,为节点或边计算出不同的数值

2、研究节点的度:度、加权度、pagerank、聚类系数、特征向量中心度、模块化

3、研究边的连接性:网络直径、连接组件

4、研究图的整体特性:平均度、平均加权度、图密度、平均路径长度

5、研究聚类特性:模块化

注:模块化和连接组件都具有某种归类或聚类的特性,但模块化根本上是统计节点的一种度,并在此基础上把度相同的节点归类;连接组件并不考虑节点度的状态,而仅仅是根据连接关系对节点归类。

主要统计量及解释

图片


(五)外观:节点、边、标签设置

自定义或根据数据设置节点的大小、节点颜色、边的粗细、边的颜色以及节点与边的标签的颜色及大小。在以颜色和大小为目标的编辑中,可以通过两种方式实现,一种是设置为统一的(unique)颜色和大小;另一种是根据数值设定(Attribute)颜色和大小。

图片

在外观设置中,一是可以手动统一设定节点、边、标签的大小和颜色,二是可以通过数据自动定义。数据自定义可以有两种方式可以实现:(1)原始数据本身携带了可以用于设置的数值(2)通过gephi统计功能计算出新的数据用于设置。

1、节点

图片

界面右上方的4个按钮(节点颜色、节点大小、节点标签颜色、节点标签大小)会和“统一的”“数值设定”组合产生不同效果。

2、边

界面右上方的3个按钮(边颜色、边标签颜色、边标签大小)会和“统一的”“数值设定”组合产生不同效果。

图片

在gephi0.9.1版本后,节点与边颜色的“数值设定”细分为partition(分区)与ranking(排名),分区是用有区别的颜色给节点或边涂色,排名是用颜色渐变的方式给节点或边涂色。而节点与边的其他属性(节点大小、节点与边的标签颜色和标签大小)则没有细分,只是数值设定更改为ranking,而没有操作上的变动。

(六)滤波:查询、筛选与分类

过滤器fliters是通过用户设定的规则(包括正则表达式)对网络中的节点或边进行筛选,从而能够更精准的探索与分析网络。过滤界面可以分为三部分:4个与过滤有关的工具、过滤选取分类、过滤界面查询工具。

1、四个与过滤有关的工具

图片

重置是清除所有过滤规则;第二个是往过滤的节点中写入数据;第三个是把过滤出的节点和边移动到一个新的工作空间;第四个是隐藏过滤出的节点和边。

2、过滤选取工具(5种)

图片

(1)动态:根据动态图的特性进行过滤

通过约束范围和空值,观察动态图在不同时间段内结构的变化。

(2)属性:根据图节点或边的属性进行过滤

图片

(3)拓扑:根据图的拓扑结构进行过滤

图片

(4)操作分类:逻辑过滤,可以将多个过滤器以某种逻辑关系结合在一起进行过滤

图片

(5)边:根据边的特性进行过滤

图片

(七)其他工具

1、插件商店

https://gephi.org/plugins/#/

2、Gephi Toolkit

将gephi的核心模块包装在独立的java库文件中,允许任何java项目在gephi软件之外使用该核心功能。

四、教程参考文献

(一)书籍

1、网络数据可视化与分析利器:Gephi 中文教程(刘勇/杜一,电子工业出版社)

(二)教程

1、gephi中文教程:https://www.udemy.com/gephi/

2、github:https://github.com/gephi/gephi/wiki

3、官方教程:https://gephi.org/users/

(三)论文

* gephi介绍类论文

1、Bastian M, Heymann S, Jacomy M. Gephi: An Open Source Software for Exploring and Manipulating Networks[C]// International Conference on Weblogs and Social Media, Icwsm 2009, San Jose, California, Usa, May. DBLP, 2009.

2、邓君,马晓君,毕强. 社会网络分析工具Ucinet和Gephi的比较研究[J]. 情报理论与实践,2014,37(08):133-138. [2017-10-06]. DOI:10.16353/j.cnki.1000-7490.2014.08.001

3、刘鹏,李先贤,王利娥. 社会网络分析软件研究[J]. 计算机科学,2015,42(12):171-174. [2017-10-06].

4、梁辰,徐健. 社会网络可视化的技术方法与工具研究[J]. 现代图书情报技术,2012,(05):7-15. [2017-10-06].

* 使用gephi处理复杂网络的论文

1、徐宝达,赵树宽,张健. 基于社会网络分析的微信公众号信息传播研究[J]. 情报杂志,2017,36(01):120-126. [2017-10-06].

2、王晰巍,赵丹,张长亮,相甍甍. 基于社会网络的新媒体网络舆情信息传播研究——以反腐倡廉话题为例[J]. 情报杂志,2016,35(03):103-110+102. [2017-10-06].

3、韩牧哲,李秀霞,张艺蔓. 基于模块化引文网络的网络计量学知识扩散水平测度[J]. 情报杂志,2015,34(07):189-194+178. [2017-10-06].

4、王晰巍,邢云菲,赵丹,李嘉兴. 基于社会网络分析的移动环境下网络舆情信息传播研究——以新浪微博“雾霾”话题为例[J]. 图书情报工作,2015,59(07):14-22. [2017-10-06]. DOI:10.13266/j.issn.0252-3116.2015.07.002

5、丁绪武,吴忠,夏志杰. 社会化电子商务用户兴趣图谱构建的研究[J/OL]. 情报理论与实践,2015,38(03):90-94. (2015-03-12)[2017-10-06]. http://kns.cnki.net/kcms/detail/11.1762.g3.20150312.1621.019.htmlDOI:10.16353/j.cnki.1000-7490.2015.03.019

6、曹学艳,段飞飞,方宽,张仙,李仕明. 网络论坛视角下突发事件舆情的关键节点识别及分类研究[J]. 图书情报工作,2014,58(04):65-70. [2017-10-06]. DOI:10.13266/j.issn.0252-3116.2014.04.011

7、王新才,丁家友. 复杂网络视角的国外政府信息资源研究[J]. 图书情报工作,2013,57(21):119-125+132. [2017-10-06].

8、王新才,丁家友. 大数据知识图谱:概念、特征、应用与影响[J]. 情报科学,2013,31(09):10-14+136. [2017-10-06]. DOI:10.13833/j.cnki.is.2013.09.018

* Gephi统计指标介绍

1、特征向量中心度Eigenvector Centrality:

Justification and Application of Eigenvector Centrality(L Spizzirri)

2、PageRank算法

The PageRank Citation Ranking: Bringing Order to the Web(TPC Ranking, TPC Ranking, B Order , B Order)

3、网络直径 - 离心率

Eccentricity and centrality in networks(P Hage, F Harary)

4、介数中心度betweenness centrality

A Faster Algorithm for Betweenness Centrality(Ulrik Brandes)

文章来源:微信公众号知链数据