罗图悦借

内容介绍

《网络舆情事件检测技术》深入探讨数字化时代迅速发展的社交媒体和网络平台中广泛应用的舆情识别技术。《网络舆情事件检测技术》共7章，第1章详细介绍网络舆情事件检测的概念、意义、主要应用场景和目前面临的挑战。第2章系统介绍数据建模、基础模型和优化技术，为读者奠定扎实的理论基础。基于这些基础理论知识，第3～7章对网络舆情事件检测技术涉及的事件建模与表示、流式事件检测、社会事件检测、特征驱动的事件检测、无监督式的社交网络表示学习及事件检测等多个领域进行详细介绍，帮助读者理解如何将理论应用于实际问题，全面探讨网络舆情事件检测技术的多样性和复杂性。

展开

精彩书摘

第1章绪论
　　随着各种信息技术和人类生产生活日益交汇融合，人们已经身处互联网大数据时代。如今全球信息化数据呈现出爆发增长、海量集聚、传播迅速的特点，与人类的社会生活、经济发展、文化传播等方方面面密不可分。在当今社会，互联网的普及和发展使得网络舆情具有了前所未有的影响力和重要性。网络舆情可以说是一把“双刃剑”，既能成为推动社会发展的强大力量，也可能引发各种问题。互联网作为信息时代的产物，在传播信息的速度、广度和深度上有着巨大的优势。随着各社交平台，如论坛、微博、微信等的兴起，每个人都可以成为信息的制造者和传播者，也就意味着每个人都有可能成为网络舆情的受益者或受害者。因此，网络舆情事件检测成为当今时代的重要任务。然而，网络舆情事件的检测和分析也存在一些挑战。网络舆情数据的庞大和复杂使得研究人员对其进行有效的挖掘和分析变得困难。互联网上的信息如海洋般广阔，如何从中找到有价值的信息成为一个难题。网络舆情信息的真实性和可信度也是一个重要问题。网络上存在大量的虚假信息，这给准确识别信息真伪以及判断舆情发展趋势带来了新的挑战。
　　为了解决网络舆情事件的检测和分析问题，人们利用人工智能和大数据技术，研发出了一系列网络舆情事件检测和分析的方法和工具。基于文本挖掘和自然语言处理技术，使用海量的文本数据进行情感分析、情绪识别、观点挖掘等，并通过统计和机器学习算法发现关键词、趋势和规律，为决策者提供科学依据。此外，还可以通过社交网络分析技术构建和分析用户之间的关系，揭示网络舆情的传播规律和影响机制。
　　本章将初步介绍网络舆情事件检测的概念和意义，弄清楚什么是网络舆情事件检测，为什么要做这项工作，网络舆情事件检测的应用场景有哪些，以及目前面临的挑战有哪些。
　　1.1 网络舆情事件检测的概念
　　网络舆情事件是利用网络平台传播大众对某种事件的评价或表达的带有某种倾向性和影响力的观点、感受、评价的表达结果，是网络空间的一类具有快速扩散、影响力极大的群众性社会事件。网络舆情事件检测通过监测和分析网络上的大量数据，识别和理解网络上的舆情事件信息及其变化趋势。在互联网时代，信息的传播速度快、范围广，网络舆情事件的形成和传播速度更是迅猛。因此，准确及时地了解和分析网络舆情事件对政府、企业和个人都具有重要意义。
　　实际的网络舆情事件检测主要采用大数据分析、文本挖掘和自然语言处理等技术和方法。*先，网络舆情事件检测对大量的网络数据进行搜集和整理，建立庞大的数据库；其次，网络舆情事件检测运用文本挖掘技术，对数据进行清洗、筛选和分类，提取关键信息；再次，网络舆情事件检测利用情感分析和情绪识别等自然语言处理技术，对文本进行情感倾向和情绪态度的判断，以及观点的挖掘和分析；*后，网络舆情事件检测通过统计和机器学习算法，揭示网络舆情的趋势和规律。
　　1.2 网络舆情事件检测的意义
　　随着互联网的快速普及和发展，人们越来越多地将信息发布和获取的活动转移到了网络平台上。社交媒体(如论坛和博客)、新闻网站等网络媒体成为人们获取信息和表达意见的主要渠道，网络已经成为大众传媒的重要一环。互联网的普及使得每个人都具备了信息发布和传播的能力，社交媒体平台的兴起更是让信息的传播范围变得更广。人们通过互联网发布各种言论、评论或动态，信息在瞬间传播到全球各个角落，网络舆情也因此迅速形成。互联网的出现使得舆论参与者的范围大大拓宽。传统媒体主要由少数的媒体机构或人物掌握，很难实现全民参与舆论的目标。互联网的出现改变了这种单一格局，任何人都可以通过互联网发表言论、分享看法，成为舆论的参与者，使得网络舆情更加多元化和复杂化。网络舆论逐渐成为社会舆论的重要组成部分。人们通过网络表达和传播自己的意见和情感，网络平台上的评论、点赞和分享等互动行为形象地反映了公众对某一事物的态度。对政府而言，政府可以通过网络舆情事件检测了解民众关注的焦点、热点问题，并及时采取措施应对，增强社会的稳定性和可控性。例如，在突发公共事件中，政府通过网络舆情事件检测及时了解民众的情绪和需求，调整应对策略，提高应急响应能力。对企业而言，网络舆情事件在很大程度上反映了消费者对企业产品和服务的评价和态度。企业可以通过监测和分析网络舆情事件及时了解消费者的反馈意见，进行产品改进和服务优化，提升品牌形象和用户满意度。对个人而言，网络舆情事件检测可以帮助人们了解社会热点和公共话题的演变趋势。个人通过关注网络舆情事件可以掌握社会动态、拓宽思路，提高自己的信息素养和舆论应对能力。此外，个人在网络上的言论和行为也可能成为网络舆情的对象。因此，了解和掌握网络舆情事件的发展变化，有助于个人更好地把握网络言论的态势和走向，避免不必要的争议和风险。网络舆情事件的快速产生和传播性质决定了其具有突发性和时效性。当重大社会事件发生时，网民能在**时间通过各种渠道表达自己的意见，形成一股强大的舆论声势。对于政府和有关机构来说，及时捕捉和分析网络舆情事件，能够更好地了解和应对公众的关切，制定正确的应对策略。同时，随着人工智能、大数据和自然语言处理等技术的迅速发展，网络舆情事件检测的技术手段也得以显著提升，人们可以对网络上的大量信息进行自动化分类、挖掘和分析，从中提取有价值的信息，为网络舆情事件检测提供可靠的技术支撑。
　　网络舆情事件检测可以在早期发现和追踪潜在的问题和危机。通过对大量信息的搜集和分析，相关人员可以发现问题的早期信号和线索，及时采取措施进行解决，避免问题扩大化和危机演变。
　　此外，网络舆情事件检测可以及时掌握社会动态，了解公众对某一事件或问题的看法和态度。通过对事件的分析和研究，相关人员可以发现公众的关注点和热点问题，为政府部门制定决策提供参考和依据。在重大事件或突发事件发生后，政府可以通过网络舆情事件检测及时掌握公众的情绪和态度，制定更科学、合理的应对措施，提高决策的效率和质量。
　　通过对舆情数据的分析，企业可以了解公众的意见和需求，预测市场趋势，评估政策措施的效果，优化产品设计和服务模式，做出更明智的决策和规划，降低风险，提高效率和竞争力。
　　网络舆情事件检测还可以促进信息的开放和透明，为公众提供更多的参与和表达机会。相关人员通过对舆情事件的分析，可以了解公众对政府决策和事件进展的关注和评价情况，增加政府与公众的沟通和互动，提高决策的民主化和参与度。
　　*后，网络舆情事件检测可以加强网络安全管理，保护公民隐私。例如，在网络诈骗等违法行为发生后，政府可以通过网络舆情事件检测及时发现并采取措施进行防范和处理，保护公民的隐私和财产安全。
　　1.3 网络舆情事件检测的应用
　　1.3.1 社交媒体情感分析
　　社交媒体情感分析是一种利用自然语言处理和机器学习技术来分析社交媒体文本中的情感和情感倾向的方法。社交媒体情感分析可以帮助了解人们对特定话题、事件、产品或服务的情感态度，从而更好地做出决策、改进产品、优化营销策略等。如果一家手机制造公司想要了解公众对其*新发布的智能手机的情感倾向，公司可以使用自然语言处理技术对社交媒体平台上关于该智能手机的帖子进行情感分析。相关人员可以设置一个变量表示对文本进行情感分析的过程，分析每个帖子的情感倾向，将帖子分为积极、消极和中性三种类型，然后追踪时间序列中情感倾向的变化趋势。基于情感数据，该手机制造公司可以判断公众对手机的整体情感态度，并相应地调整品牌管理和市场营销策略，提升消费者的兴趣和认可度。这个过程大致步骤如下。
　　(1)相关人员从社交媒体平台获取相关的文本数据，如帖子、评论、推文等。
　　(2)将搜集到的文本数据进行清洗和预处理，包括去除特殊字符、标点符号等，进行词干化或词形还原，并进行分词操作，将文本拆分为词或短语。
　　(3)基于预处理后的文本数据，构建情感分析模型，如支持向量机(support vector machine，SVM)、朴素贝叶斯(naive Bayes)、卷积神经网络(convolutional neural network，CNN)、循环神经网络(recurrent neural network，RNN)以及现代的预训练模型等。
　　(4)将文本数据输入情感分析模型中，模型将对每条文本进行情感分类，通常分为积极、消极或中性，一些模型还可以提供更详细的情感分类，如愤怒、喜悦、悲伤等。
　　(5)在情感分类的基础上，进行情感倾向分析，即确定文本中表达的情感程度，例如判断积极文本是强烈的积极还是相对中性的积极。
　　1.3.2 舆情预警
　　舆情预警是一种通过监测和分析社会媒体、网络平台等多种渠道的信息，应用数据分析和机器学习技术及早发现或预测可能引发公众关注的事件、话题或情感倾向的过程。舆情预警旨在使组织(如企业、政府等)能够在事件发生之前获得关键信息，从而及时采取行动，减少负面影响，或者获得*大化利益。例如，政府部门监测社交媒体平台上关于城市交通问题的帖子，并建立舆情事件检测模型。如果在特定时间段内发布的有关交通问题的帖子数量超过了舆情预警的阈值，系统会发出预警，帮助政府部门及时了解潜在的舆情危机，并采取措施，如提供实时交通信息、加强交通管理等，减轻危机影响。舆情预警的流程如下。
　　(1)收集来自社交媒体、新闻网站等多个数据源的信息，获取广泛的舆情数据。
　　(2)对搜集到的数据进行整理和分析，涉及文本挖掘、情感分析、关键词提取等技术，利用统计学和机器学习方法识别舆情事件。
　　(3)基于数据分析，识别出具有潜在舆情影响的事件、话题或情感倾向，涉及监测特定关键词、热门话题的变化趋势等。
　　(4)设定舆情预警的阈值，即在什么情况下触发预警。
　　(5)当数据分析超过预设阈值时，系统生成舆情预警，预警通过通知、报告等方式传达给相关机构和人员。
　　(6)在收到舆情预警后，组织(如企业、政府)可以采取相应的应急措施，如发布正式声明、调整应对策略等。
　　1.3.3 突发事件监测
　　突发事件监测是一种利用各种数据源和技术手段来实时监测和追踪突发事件(如自然灾害、社会事件、健康危机等)的发生和发展情况的过程。突发事件监测旨在帮助政府和公众能够更快速地了解事件的情况，采取适当的应对措施，减轻负面影响并保护公众安全。通过使用自然语言处理技术和机器学习模型监测社交媒体上与突发事件相关的帖子，政府可以定义一个变量表示与突发事件相关的关键词列表，用于过滤和检测相关帖子，然后构建监测模型，监测帖子的出现频率，并设置另外一个变量表示舆情预警的阈值。如果在特定时间段内有关突发事件的帖子数量超过了阈值，系统将生成舆情预警，政府可以立即采取危机管理措施，如发布紧急通知、调动救援资源等。突发事件监测的流程如下。
　　(1)搜集来自多个数据源的信息，如社交媒体、新闻、气象数据、传感器数据等，这些数据来自不同的渠道，可以提供多方面的信息。
　　(2)为了监测特定类型的突发事件，设定相关的关键词或短语，如地震监测关键词可能包括“地震”“震感”“震源”等。
　　(3)使用技术工具，如网络爬虫、应用程序接口(application program interface，API)等，实时地从数据源中抓取信息，如社交媒体上的帖子、新闻文章、传感器数据等。
　　(4)对搜集到的数据进行整理和过滤，去除无关信息，准确地捕捉与突发事件相关的数据。
　　(5)利用数据分析和机器学习技术，如文本挖掘、情感分析、关键词匹配，识别突发事件。
　　(6)对突发事件进行时空分析，以了解事件的发生时间、地点和影响范围。
　　(7)基于事件的识别和分析，建立预警系统，当监测到特定事件出现时，系统会触发预警通知。
　　(8)收到突发事件监测的预警后，政府和公众可以采取应急措施，如发布警报、调动救援资源、采取避险措施等。
　　1.3.4 新闻媒体监测
　　新闻媒体监测是一种通过

展开

目录
第1章绪论 1
1.1 网络舆情事件检测的概念 1
1.2 网络舆情事件检测的意义 2
1.3 网络舆情事件检测的应用 3
1.3.1 社交媒体情感分析 3
1.3.2 舆情预警 4
1.3.3 突发事件监测 4
1.3.4 新闻媒体监测 5
1.4 网络舆情事件检测面临的挑战 5
1.5 本章小结 6
第2章网络舆情事件检测基础 8
2.1 数据建模 8
2.1.1 异构信息网络概述 8
2.1.2 异构信息网络建模 9
2.1.3 多关系图建模 11
2.2 基础模型 13
2.2.1 图神经网络方法 13
2.2.2 聚类技术 15
2.2.3 流式聚类技术 16
2.2.4 深度强化学习 18
2.2.5 多智能体强化学习 20
2.3 优化技术 22
2.3.1 交叉熵损失 22
2.3.2 对偶学习 23
2.3.3 对比学习 24
2.3.4 不均衡分布表征优化技术 26
2.4 本章小结 27
第3章事件建模与表示 29
3.1 图神经网络简述 29
3.2 基于GNN的事件检测算法 31
3.3 社交注意力图学习的社会事件表示学习 32
3.3.1 图注意力网络 33
3.3.2 元路径聚合图神经网络 34
3.4 异构图卷积的社会事件表示学习 35
3.4.1 异构图注意力网络 36
3.4.2 图变换网络 38
3.5 增强多关系图学习的社会事件表示学习 38
3.5.1 关系图卷积网络 39
3.5.2 多关系图卷积网络 40
3.6 证据性图学习的社会事件表示学习 41
3.6.1 D-S证据性理论 41
3.6.2 ETGNN：证据时间感知图神经网络 41
3.7 质量自感知图学习的社会事件表示学习 43
3.7.1 关于社会事件的基本概念 43
3.7.2 质量感知自改进图神经网络 44
3.7.3 实验结果 47
3.8 本章小结 49
第4章流式事件检测 50
4.1 用于事件检测的聚类算法 50
4.1.1 层次聚类 51
4.1.2 k-means聚类 51
4.1.3 DBSCAN聚类 52
4.2 知识增量学习的流式事件检测 53
4.2.1 基于对比学习的可扩展训练 53
4.2.2 KPGNN：保持知识增量学习的事件检测算法 54
4.2.3 实验结果 57
4.3 尺度自适应学习的流式事件检测 58
4.3.1 LSTM模型 58
4.3.2 GRU模型 59
4.3.3 自适应缩放递归神经网络 60
4.4 社交媒体中的多尺度流式事件检测 62
4.4.1 事件的时空检测 62
4.4.2 基于时空约束的局部事件检测 62
4.4.3 基于小波的多尺度事件检测 63
4.5 多样化尺度自适应的流式事件检测 66
4.5.1 多尺度金字塔网络 66
4.5.2 自适应图学习模块 67
4.5.3 多尺度时间图神经网络 68
4.5.4 规模融合模块 68
4.6 低成本的增量聚类的流式事件检测 69
4.6.1 预处理和后处理 69
4.6.2 TwitterNews+：一种低计算成本的事件检测 70
4.7 本章小结 72
第5章社会事件检测 74
5.1 社会事件检测概述 74
5.2 基于固定模板的特定型事件检测 76
5.2.1 自然灾害类事件检测 76
5.2.2 日常生活类事件检测 77
5.3 基于数据驱动的通用型事件检测 78
5.3.1 小样本驱动事件检测 78
5.3.2 大数据流式场景事件检测 78
5.4 基于社交数据流的实时事件检测 80
5.4.1 术语 80
5.4.2 趋势检测 80
5.4.3 实体操作 81
5.4.4 聚类 82
5.5 基于混合知识蒸馏的跨语言社会事件检测 83
5.5.1 问题定义 83
5.5.2 跨语言知识蒸馏框架 84
5.6 基于多视图图注意网络的社会事件检测 88
5.6.1 问题定义 88
5.6.2 异构社会事件图构建 89
5.6.3 多视图社会事件表示 90
5.6.4 标签引导的多视图图注意力 92
5.7 基于社交信息的强化、增量和跨语言事件检测 93
5.7.1 加权多关系社会信息图 95
5.7.2 多关系图神经网络框架中的多智能体增强聚合 95
5.8 基于不确定性引导学习的不平衡社会事件检测 98
5.8.1 问题定义 98
5.8.2 不确定性引导类不平衡学习框架：UCLSED和UCL-ECSED 100
5.9 基于GCN的社会事件检测 103
5.9.1 面向事件的GCN算法机理 104
5.9.2 问题定义 104
5.9.3 PP-GCN：成对流行图卷积网络 105
5.9.4 实验结果 107
5.10 基于元学习的社会事件检测 110
5.10.1 问题定义 110
5.10.2 MetaEvent：基于元学习的零样本和少样本的事件检测 111
5.11 本章小结 113
第6章特征驱动的事件检测 115
6.1 回顾性事件检测 115
6.1.1 聚类表示 115
6.1.2 基于GAC的层次聚类 116
6.1.3 单步算法聚类 117
6.2 新事件检测 118
6.2.1 检测方法 119
6.2.2 检测阈值 119
6.3 跨语言事件检测 120
6.3.1 在单语中的潜在狄利克雷分布 120
6.3.2 多语言文档中的LDA 120
6.3.3 事件检测 121
6.3.4 聚类 122
6.4 基于社会传感器的实时事件检测 122
6.4.1 问题定义 123
6.4.2 模型介绍 124
6.5 基于时间序列数据的事件检测 126
6.5.1 变化点检测下的事件检测 127
6.5.2 批处理算法 128
6.5.3 增量算法 129
6.6 基于信号聚类的事件检测 129
6.6.1 小波分析 130
6.6.2 EDCoW：基于小波信号聚类事件检测 131
6.7 动态社会网络中的事件检测 134
6.7.1 主要方法概述 134
6.7.2 图分解 135
6.7.3 共识结构 136
6.7.4 层次结构影响 137
6.8 基于特征分布的事件检测 138
6.8.1 突发事件检测问题定义 138
6.8.2 突发事件检测：一种特征中心聚类方法 139
6.9 基于高阶共聚类的社会事件检测 142
6.9.1 问题定义 142
6.9.2 SED-RHOCC：基于高阶共聚类的社会事件检测 143
6.10 本章小结 146
第7章无监督式的社交网络表示学习及事件检测 148
7.1 基于神经网络的无监督词增量表示学习 148
7.2 基于矩阵分解的无监督词增量表示学习 150
7.3 动态社交网络无监督表示学习 151
7.4 无监督主题嵌入故事的社会事件检测 153
7.4.1 问题定义 153
7.4.2 主题嵌入 154
7.4.3 USTORY：通过可扩展主题嵌入从新闻流中发现无监督故事 155
7.4.4 实验结果 158
7.5 无监督结构熵*小化的社会事件检测 159
7.5.1 问题定义 159
7.5.2 HISEvent：基于结构熵的无监督社会事件检测 160
7.6 本章小结 162
参考文献 163
后记 173

展开