資源簡介
該資源是文章的資料,壓縮包中包含:Gephi軟件、中國知網數據、展示圖譜、Python代碼。
本篇文章主要采用Python和Gephi構建中國知網某個領域的作者合作關系和主題詞共現的知識圖譜,重點闡述了一種可操作的關系圖譜構建方法,可用于論文發表、課程或企業可視化展示等。其基本步驟如下:
1.在中國知網搜索“清水江”關鍵詞,并導出論文Excel格式。
2.使用Python處理文本,獲取作者合作的共現矩陣及三元組。
3.Gephi導入CSV節點及邊文件,并構建關系圖譜。
4.Gephi調整參數,優化關系圖譜。
原文鏈接:https://blog.csdn.net/Eastmount/article/details/100200437
希望該資源對您有所幫助,建議結合博客來學習。
代碼片段和文件信息
#?-*-?coding:?utf-8?-*-
“““
@author:?eastmount?CSDN?楊秀璋?2019-09-02
“““
import?pandas?as?pd
import?numpy?as?np
import?codecs
import?networkx?as?nx
import?matplotlib.pyplot?as?plt
import?csv
?
#---------------------------第一步:讀取數據-------------------------------
word?=?[]?#記錄關鍵詞
f?=?open(“word2.txt“)????????????
line?=?f.readline()???????????
while?line:
????#print?line
????line?=?line.replace(“\n“?““)?#過濾換行
????line?=?line.strip(‘\n‘)?
????for?n?in?line.split(‘;‘):
????????#print?n
????????if?n?not?in?word:
????????????word.append(n)
????line?=?f.readline()
f.close()
print?len(word)?#作者總數
#--------------------------第二步?計算共現矩陣----------------------------
a?=?np.zeros([23])
print?a
#共現矩陣
#word_vector?=?np.zeros([len(word)len(word)]?dtype=‘float16‘)?
#MemoryError:矩陣過大匯報內存錯誤
#https://jingyan.baidu.com/article/a65957f434970a24e67f9be6.html
#采用coo_matrix函數解決該問題
from?scipy.sparse?import?coo_matrix
print?len(word)
#類型
word_vector?=?coo_matrix((len(word)len(word))?dtype=np.int8).toarray()?
print?word_vector.shape
f?=?open(“word2.txt“)
line?=?f.readline()???????????
while?line:
????line?=?line.replace(“\n“?““)?#過濾換行
????line?=?line.strip(‘\n‘)?#過濾換行
????nums?=?line.split(‘;‘)
????#循環遍歷關鍵詞所在位置?設置word_vector計數
????i?=?0
????j?=?0
????while?i ????????j?=?i?+?1
????????w1?=?nums[i]???????????#第一個單詞
????????while?j ????????????w2?=?nums[j]???????#第二個單詞
????????????#從word數組中找到單詞對應的下標
????????????k?=?0
????????????n1?=?0
????????????while?k ????????????????if?w1==word[k]:
????????????????????n1?=?k
????????????????????break
????????????????k?=?k?+1
????????????#尋找第二個關鍵字位置
????????????k?=?0
????????????n2?=?0
????????????while?k ????????????????if?w2==word[k]:
????????????????????n2?=?k
????????????????????break
????????????????k?=?k?+1
????????????#重點:?詞頻矩陣賦值?只計算上三角
????????????if?n1<=n2:
????????????????word_vector[n1][n2]?=?word_vector[n1][n2]?+?1
????????????else:
????????????????word_vector[n2][n1]?=?word_vector[n2][n1]?+?1
????????????#print?n1?n2?w1?w2
????????????j?=?j?+?1
????????i?=?i?+?1
????#讀取新內容
????line?=?f.readline()
f.close()
#--------------------------第三步??TXT文件寫入--------------------------
res?=?open(“word_word_weight2.txt“?“a+“)
i?=?0
while?i ????w1?=?word[i]
????j?=?0
????while?j ????????w2?=?word[j]
????????#判斷兩個詞是否共現?共現&詞頻不為0的寫入文件
????????if?word_vector[i][j]>0:
????????????#print?w1?+“?“?+?w2?+?“?“+?str(int(word_vector[i][j]))
????????????res.write(w1?+“?“?+?w2?+?“?“+?str(int(word_vector[i][j]))??+??“\r\n“)
????????j?=?j?+?1
????i?=?i?+?1
res.close()
#共現矩陣寫入文件?如果作者數量較多?建議刪除下面部分代碼
res?=?open(“word_jz2.txt“?“a+“)
i?=?0
while?i ????j?=?0
????jz?=?““
????while?j ????????jz?=?jz?+?str(int(word_vector[i][j]))?+?“?“
????????j?=?j?+?1
????res.write(jz?+?“\r\n“)
????i?=?i?+?1
?屬性????????????大小?????日期????時間???名稱
-----------?---------??----------?-----??----
?????目錄???????????0??2019-09-02?17:11??中國知網知識圖譜\
?????文件??????743985??2019-09-02?11:32??中國知網知識圖譜\CNKI-637030207011763750.xls
?????文件??????334891??2019-09-02?11:35??中國知網知識圖譜\CNKI-637030209353170000.xls
?????文件??????531493??2019-09-02?12:46??中國知網知識圖譜\data.csv
?????文件????56230855??2016-11-16?13:56??中國知網知識圖譜\gephi-0.9.1-windows.exe
?????文件??????511869??2016-11-16?13:48??中國知網知識圖譜\gephi教程.pdf
?????目錄???????????0??2019-09-02?17:19??中國知網知識圖譜\主題關鍵詞圖譜\
?????文件??????222813??2019-09-02?16:55??中國知網知識圖譜\主題關鍵詞圖譜\eastmount-best03.gephi
?????文件??????272399??2019-09-02?16:27??中國知網知識圖譜\主題關鍵詞圖譜\edges2.csv
?????文件???????42203??2019-09-02?16:28??中國知網知識圖譜\主題關鍵詞圖譜\nodes2.csv
?????文件????????4213??2019-09-02?16:21??中國知網知識圖譜\主題關鍵詞圖譜\test-word-best999(final).py
?????文件??????183175??2019-09-02?16:22??中國知網知識圖譜\主題關鍵詞圖譜\word-word-weight2.csv
?????文件???????37328??2019-09-02?16:21??中國知網知識圖譜\主題關鍵詞圖譜\word2.txt
?????文件?????1400304??2019-09-02?12:13??中國知網知識圖譜\主題關鍵詞圖譜\清水江文獻分析(958).xls
?????文件??????679074??2019-09-02?17:19??中國知網知識圖譜\主題關鍵詞圖譜\運行結果.pdf
?????文件?????1658036??2019-09-02?17:19??中國知網知識圖譜\主題關鍵詞圖譜\運行結果.png
?????目錄???????????0??2019-09-02?17:08??中國知網知識圖譜\作者共現圖譜\
?????文件???????82494??2019-09-02?16:17??中國知網知識圖譜\作者共現圖譜\eastmount-best01.gephi
?????文件???????33680??2019-09-02?15:36??中國知網知識圖譜\作者共現圖譜\edges.csv
?????文件????????9016??2019-09-02?15:42??中國知網知識圖譜\作者共現圖譜\nodes.csv
?????文件????????4213??2019-09-02?16:21??中國知網知識圖譜\作者共現圖譜\test-word-best999(final).py
?????文件???????19868??2019-09-02?15:47??中國知網知識圖譜\作者共現圖譜\word-word-weight.csv
?????文件???????12260??2019-09-02?14:41??中國知網知識圖譜\作者共現圖譜\word.txt
?????文件??????????26??2019-09-01?18:42??中國知網知識圖譜\作者共現圖譜\word3.txt
?????文件?????1773801??2019-09-02?15:10??中國知網知識圖譜\作者共現圖譜\word_jz.txt
?????文件???????31040??2019-09-02?15:10??中國知網知識圖譜\作者共現圖譜\word_word_weight.txt
?????文件?????1400304??2019-09-02?12:13??中國知網知識圖譜\作者共現圖譜\清水江文獻分析(958).xls
?????文件??????213276??2019-09-02?16:17??中國知網知識圖譜\作者共現圖譜\運行截圖.pdf
?????文件??????256408??2019-09-02?16:17??中國知網知識圖譜\作者共現圖譜\運行截圖.png
?????文件?????1400304??2019-09-02?12:13??中國知網知識圖譜\清水江文獻分析(958).xls
?????文件????37803450??2019-09-01?23:36??中國知網知識圖譜\網絡數據可視化與分析利器??Gephi?中文教程??全彩版_14158088.pdf
............此處省略0個文件信息
評論
共有 條評論