第1章圖情大數(shù)據(jù)概述1
●1.1圖情領域的大數(shù)據(jù)發(fā)展2
1.1.1圖書情報學的歷史和發(fā)展2
1.1.2圖書館對信息資源的管理4
1.1.3圖書情報學與數(shù)據(jù)科學的淵源6
1.1.4圖情與大數(shù)據(jù)的融合發(fā)展9
●1.2圖情大數(shù)據(jù)的范疇、特征和價值11
1.2.1圖情大數(shù)據(jù)的范疇和特征11
1.2.2圖情大數(shù)據(jù)的價值與意義14
●1.3圖情大數(shù)據(jù)相關研究與實踐14
1.3.1圖情科學中的大數(shù)據(jù)研究14
1.3.2圖情機構的大數(shù)據(jù)實踐15
參考文獻18
第2章圖情大數(shù)據(jù)的數(shù)據(jù)資源21
●2.1數(shù)字文獻22
2.1.1數(shù)字期刊23
2.1.2電子圖書26
2.1.3數(shù)字報紙28
2.1.4專利與標準29
2.1.5數(shù)字科技報告30
2.1.6數(shù)字會議與學位論文31
●2.2數(shù)據(jù)庫32
2.2.1源數(shù)據(jù)庫32
2.2.2書目數(shù)據(jù)庫34
2.2.3指南數(shù)據(jù)庫35
●2.3網(wǎng)絡數(shù)據(jù)36
2.3.1搜索引擎36
2.3.2門戶網(wǎng)站37
2.3.3社交媒體37
●2.4其他數(shù)據(jù)38
2.4.1用戶行為數(shù)據(jù)38
2.4.2開放政府數(shù)據(jù)38
參考文獻39
第3章圖情大數(shù)據(jù)的技術運用41
●3.1大數(shù)據(jù)采集與預處理42
3.1.1數(shù)據(jù)庫數(shù)據(jù)采集42
3.1.2網(wǎng)絡數(shù)據(jù)采集43
3.1.3系統(tǒng)日志采集43
3.1.4大數(shù)據(jù)預處理43
3.1.5大數(shù)據(jù)的采集工具44
●3.2文本數(shù)據(jù)的分析方法44
3.2.1文本分詞45
3.2.2詞頻分析48
3.2.3語義分析48
●3.3文本數(shù)據(jù)挖掘的方法50
3.3.1文本分類50
3.3.2文本聚類52
3.3.3文本關聯(lián)分析55
●3.4大數(shù)據(jù)的存儲57
3.4.1大數(shù)據(jù)的存儲方式57
3.4.2大數(shù)據(jù)的存儲技術路線58
3.4.3分布式文件系統(tǒng)59
●3.5圖情大數(shù)據(jù)的標準與規(guī)范59
3.5.1數(shù)字化標準規(guī)范60
3.5.2元數(shù)據(jù)標準規(guī)范61
3.5.3數(shù)據(jù)互操作規(guī)范62
3.5.4數(shù)據(jù)開放應用協(xié)議63
3.5.5數(shù)據(jù)長期保存規(guī)范64
參考文獻65