gephi

mvn dependency:tree 使用详解

亡梦爱人 提交于 2021-01-22 21:13:02
Maven Dependency插件Goal tree分析工程artifacts依赖 来自 https://maven.apache.org/plugins/maven-dependency-plugin/tree-mojo.html 常用Optional Parameters 常用参数,可在命令行中作用 -D参数名=参数值指定 appendOutput:追加输出,而不是覆盖 excludes,includes:通过逗号分离,格式[groupId]:[artifactId]:[type]:[version],支持通配符* outputFile:指定输出文件路径 outputType:指定输出文件格式,默认text,还支持dot,graphml,tgf 输出工程依赖关系 mvn dependency:tree 重定向至文本文件 mvn dependency:tree -D outputFile=dependency_tree.txt mvn dependency:tree -Dverbose -D outputFile=dependency_tree.txt graphml格式,可使用Gephi打开,官网链接 https://gephi.org/ 或者使用yWorks的GraphMLViewer,需要嵌入浏览器中,这个比较小,只有1.1MB,https://www.yworks

Python friends network visualization

情到浓时终转凉″ 提交于 2021-01-20 20:31:11
问题 I have hundreds of lists (each list corresponds to 1 person). Each list contains 100 strings, which are the 100 friends of that person. I want to 3D visualize this people network based on the number of common friends they have. Considering any 2 lists, the more same strings they have, the closer they should appear together in this 3D graph. I wanted to show each list as a dot on the 3D graph without nodes/connections between the dots. For brevity, I have included only 3 people here. person1 =

Python friends network visualization

Deadly 提交于 2021-01-20 20:30:41
问题 I have hundreds of lists (each list corresponds to 1 person). Each list contains 100 strings, which are the 100 friends of that person. I want to 3D visualize this people network based on the number of common friends they have. Considering any 2 lists, the more same strings they have, the closer they should appear together in this 3D graph. I wanted to show each list as a dot on the 3D graph without nodes/connections between the dots. For brevity, I have included only 3 people here. person1 =

以《大秦帝国之崛起》为例,来谈大数据舆情分析和文本挖掘

五迷三道 提交于 2020-11-26 07:51:29
本文转自知乎 作者:苏格兰折耳喵 ————————————————————————————————————————————————————— 本文作者将以《大秦帝国之崛起》作为分析对象,来详细阐述在大数据时代数据分析会涉及到的全网舆情分析、微博传播分析以及文本挖掘。 今年开年,因饰演白起的演员王学兵吸毒而拖延上映的《大秦帝国之崛起》(以下简称为“崛起”),终于在剧迷的千呼万唤中播出。 这部根据孙皓晖同名小说改编的电视剧是“大秦帝国”系列的第三部,首部《大秦帝国之裂变》,第二部《大秦帝国之纵横》分别于2009年、2013年播出,均获得不错的口碑,第三部《大秦帝国之崛起》因为上面的原因而补拍,直到今年年初才在央视开播。 本文将以该剧作为分析对象,来详细阐述在大数据时代数据分析会涉及到的三个“子课题”: 全网的舆情分析 :基于全网媒体或网民关于该剧的探讨,进行“ Social Listening(社会化聆听) ”,了解该剧整体口碑概况 微博传播分析 :基于新浪微博某条对于该剧具有重大影响力的微博的传播情况,了解该条微博的传播规律,互动粉丝的画像,以及水军的辨识 文本挖掘 :通过对该剧相关非结构化文本数据的分析,了解其获得观众较高认可的原因 在接下来的分析中,笔者将结合 分析工具 (新浪微舆情、头条媒体实验室、Python、Gephi等)、 分析思路 (分析角度和分析流程)、 业务知识

干货 :使用Spark进行大规模图形挖掘(附链接)

元气小坏坏 提交于 2020-11-18 14:46:18
翻译:陈丹 校对:王雨桐 本文 约4700字 ,建议阅读 15 分钟 本文为大家介绍了多种图挖掘工具,并运用Spark为大家展示了一个标签传播算法LPA构建图的实例。 本教程分为两部分: 第1部分:无监督学习图 (https://towardsdatascience.com/large-scale-graph-mining-with-spark-750995050656) 第2部分(就是本文!) : 如何运用神奇的图。我们将讨论标签传播,Spark GraphFrame和结果。 下文可回顾示例图和笔记: https://github.com/wsuen/pygotham2018_graphmining 在第1部分,我们看到了如何使用图来解决无监督的机器学习问题,因为社区是集群。我们可以利用节点之间的边作为相似性或相关性的指标,特征空间中的距离可用于其他类型的聚类。 本文将深入探讨社区检测的方式。我们构建和挖掘一个大型网络图,学习如何在Spark中实现标签传播算法(LPA)的社区检测方法。 通过标签传播检测社区 尽管有许多社区检测技术,但本文仅关注一种:标签传播。有关其他方法的概述,我推荐Santo Fortunato的“图形中的社区检测”(https://arxiv.org/pdf/0906.0612.pdf)。 Raghavan,Usha Nandini

学术分享丨假肢手的综述(2)

╄→гoц情女王★ 提交于 2020-10-18 17:22:14
   随着学会的队伍不断发展壮大,分支机构的发展愈发完善,丰富多彩的分支活动与学术分享也频频呈现。今年以来,CAAI认知系统与信息处理专委会积极倡导学会“疫情防控不放松,学习充电不间断”的理念,邀请年轻学者结合本专委会自身领域研究精选相关文献进行研究与再解读,本期与大家分享《假肢手的综述(2)》。   第一次假手的应用可以追溯到第二次布匿战争早期(公元前218-201年),罗马将军马库斯·塞尔吉乌斯(Marcus Sergius)在战争中失去了右臂,他的假手臂是用铁制成的。   在16世纪早期,德国雇佣兵戈兹·冯·贝里辛根戴着两只假手。第一个是一个简单的装置,由一个拇指和手指连接的手套组成。手指可以向内移动,这样他就可以握紧他的剑了。另一种升级版的手可以独立移动指骨和拇指,骑士可以握住马缰,拿起羽毛笔。16世纪中叶,法国军医Ambroise Pare发明了弹簧式假肢,手指可以用杠杆和齿轮独立操作。Pare还开发了肘部假手上方,杠杆和链轮机构控制着屈伸。自动身体动力假肢始于18世纪的彼得·巴利夫(Peter Baliff),假肢由肩部和躯干的完整肌肉驱动,使用皮革带作为传输机制。1911年,威廉·T·卡恩斯(William T.Carnes)发明了另一种复杂的机械假肢并获得了专利。以上假体受健康肢体或胸部的整体运动控制。   19世纪初,随着朱利亚诺·万赫蒂博士的“电影整形植入物

Python爬取B站弹幕+Gephi梳理主线剧情

断了今生、忘了曾经 提交于 2020-10-03 00:02:22
作者 | 皖渝 出品 | 凹凸数据(ID:alltodata) 头图 | CSDN 下载自东方IC 爬取介绍 利用 Chrome 浏览器抓包可知,B站的弹幕文件以 XML 文档式进行储存,如下所示(共三千条实时弹幕) 其 URL 为:http://comment.bilibili.com/183362119.xml 数字183362119 则代表 该视频专属 ID ,通过改变数字即可得到相应的弹幕文件。打开第1集的视频,查看源码,如下图所示。 不难看出, CID 则是对应着各个视频的 ID ,接下来用正则提取即可。 完整爬取代码如下 import requests import re from bs4 import BeautifulSoup as BS import os path='C:/Users/dell/Desktop/柯南' if os.path.exists(path)==False: os.makedirs(path) os.chdir(path) def gethtml(url,header): r=requests.get(url,headers=header) r.encoding='utf-8' return r.text def crawl_comments(r_text): txt1=gethtml(url,header) pat='"cid":(\d+

Louvain社区发现算法

半城伤御伤魂 提交于 2020-08-11 10:18:56
Louvain算法主要针对文献[1]的一种实现,它是一种基于模块度的图算法模型,与普通的基于模块度和模块度增益不同的是,该算法速度很快,而且对一些点多边少的图,进行聚类效果特别明显,本文用的画图工具是Gephi,从画图的效果来说,提升是很明显的。 文本没有权威,仅是个人工作中的一点总结与思考,能力与时间有限,理解不免有些浅薄,仅做参考。也可能有理解偏差或错误,如有发现,希望不吝指教,多谢! 由于算法中的公式太多,不方便用markdown编辑,所以就将编排好的文档转成图片,如需完整的文档请点击这里下载。 来源: oschina 链接: https://my.oschina.net/u/4353795/blog/4282396

从数据上看:谁才是漫威的绝对C位

社会主义新天地 提交于 2020-03-01 10:23:47
复联4上映了!这次比美国还早了两天。当然,我还没看,不会给你们剧透,当然也不想不剧透。 这一部不仅是灭霸这一线剧情的结局,也被认为漫威第三阶段的收官之作。据说此部之后,不少影迷熟知的角色(演员)就要离开漫威世界的荧幕了。因此刚上映就备受关注,今天一天国内票房就已超5亿。 上次的文章《 这可能是我用过最“强大”的API:Marvel API 》中,我给大家演示了 漫威开放接口(Marvel API) 的功能,并且在最后留了个“彩蛋”:争取跟《复联4》同步上线一个案例。 很遗憾,最近几天忙着更新网站,眼看要鸽了。但庆幸的是,我们另一位实训生 @清风小筑 站出来把坑给填了: 对 Marvel API 中的数据进行统计分析,将角色之间关系进行可视化展示。 换句话说: 用数据说话,谁才是漫威宇宙中着墨最多的人物 ? 我之前做了个小调查: 仅就我这边的采样来看,钢铁侠在国内是无法撼动的人气王。当然,这可能因为国内更多是漫威系列电影观众。 那么官方的喜好又是如何? 上文中我们说过,在 Marvel API 的开放数据中,包含了: 1491 个角色 43759 本漫画 6200 个创作者 10713 个系列 96740 个故事 75 个事件 我们这次案例选取的是 角色(character) 和 故事(story) 之间的关系: 选取 故事最多的 N 个角色 根据 共同出现的故事数 ,衡量

Gephi最详细安装教程没有之一

戏子无情 提交于 2020-01-18 02:02:54
Gephi安装教程详解 Gephi简介 Gephi是一款用于网络分析的软件。何为网络呢?在Gephi里,会把网络抽象成节点和边的关系,类似于这样的图结构,也就是网络,是Gephi的专长。Gephi提供网络三维和四维的支持,且可以建立具有生命期的四维网络,这种动态网络也为网络科学这一新兴科学提供了基础。 Gephi提供的分析主要分为两种,一种是通过不同的布局算法按照一定的方式排列节点在图中的位置,并从节点的位置对网络做出解读,也就是直接把关系转换为图。另一种是通过不同的统计算法根据节点与边的不同连接关系,用不同的方式进行计算,计算的内容包括网络的总体特征,网络的模块化,节点的中心度,节点的路径特征,节点的动态度。这些统计得出的值会存储到节点或边的数据中,并在外观中作用于节点与边,最终也是显示在图形上,供研究发现网络的特性。 网络科学继承了图论中图的定义,使用相同的概念和术语,也有部分相同的研究内容;Gephi继承了图论中图的定义,使用相同的概念和术语,主要用于网络分析。 Gephi安装 java环境 第一步:查看java环境,打开命令行,输入java -version,回车。 这里我的电脑是没有java环境的,所以需要安装。 第二步:安装java环境,打开java官网,www.java.com。 第三步:点击免费JAVA下载,同意并开始免费下载。 第四步:双击下载后的安装包,开始安装