2024年12月18日,数据科学与大数据技术教研室举行了一次关于“基于预训练模型的暗网数据作者识别分析”的学术研讨会。本次讲座由行久红老师主讲,教研室全体教师参加。

在本次讲座中,行老师首先介绍了基于预训练模型进行暗网数据作者识别分析的研究背景。行老师指出,随着暗网逐渐成为网络犯罪、非法交易和恶意活动的温床,如何有效识别和追踪暗网中信息的发布者,已经成为网络安全领域亟待解决的难题。传统的作者身份验证方法面临技术瓶颈,而基于自然语言处理(NLP)和深度学习的预训练模型提供了一种潜在的解决方案。

接着,行老师详细介绍了研究的核心内容,包括研究问题的定义、数据集的构建以及研究思路。研究采用了BERT-BiLSTM(双向长短期记忆网络)模型,利用其在文本数据中的上下文理解能力和长短期记忆特性,有效提升了对暗网中作者的识别精度。行老师还分享了所使用的数据集,该数据集涵盖了多种暗网论坛和社交平台的文本数据,具有较高的多样性和代表性。

在随后的讨论环节中,与会教师们围绕研究的应用前景、技术改进、数据集多样性以及项目申报等方面展开了积极的讨论。大家一致认为,该研究在网络安全和犯罪侦查等领域具有广泛的应用潜力,能够为暗网数据的作者识别提供有效支持。部分教师建议优化现有模型的计算效率,探索轻量化的方案或结合图神经网络以提升识别准确度。关于数据集,大家认为应进一步扩大数据来源,涵盖更多语言和地区,提升模型的普适性。教师们还探讨了该研究的项目申报方向,认为其优化之后具备较强的社会价值,值得在网络安全领域争取更多的资助和支持。
本次研讨会为教研室教师们提供了一个宝贵的学术交流平台,也为今后该研究的深入开展和应用落地提供了有力的支持。
(文\行九红…图\许亚杰 审:乔圣宸)