18级毕业生们的优秀毕业设计云展来啦!
相信大家一定都很期待
那就让我们来一饱眼福吧~
作品名称:基于大数据技术的房价数据分析及可视化
作者:蔡勇
指导教师:田恬恬
作品介绍:对于郑州如今饱和的房产及高昂的房价,越来越多的年轻人将住房带来的问题转向二手房。充分了解当地二手房信息能高效解决住房问题。通过scrapy爬虫框架来设计爬虫抓取郑州贝壳二手房网站中二手房信息。在jupyter notebook中对获取的二手房数据进行统计分析,对不同地段的房源数量、房价进行平均值、中位数、最大最小值的统计。使用echarts库将分析得到的结果通过前端页面进行数据可视化的展示。采用随机森林和线性回归进行房价的预测,经实验对比后使用误差较小的随机森林进行房价预估。使用flask框架搭建预测系统实现前端数据传入预测模型,预测模型将结果传入前端页面中展示。
作品名称:基于Python爬虫的北京二手房房价分析及可视化
作者:常凯
指导教师:梁靖涵
作品介绍:随着国家对房地产市场的调整,存量房得到了扩大,二手房市场也逐渐成熟,形成了与一手房市场相当的市场形态,而北京作为我国的政治、经济、文化中心,其一直居高临下的房屋价格备受人们关注。因此分析北京二手房房屋价格,不仅可以给有需求的人提供一种借鉴,而且对我国民生的发展也起到了一定的作用。本作品通过设计爬虫从链家网上爬取北京各个区域的二手房数据,然后对爬取的数据进行清洗、特征选择、可视化分析,最后通过建立机器学习模型来对二手房房价进行预测。
核心截图:
作品名称:基于Python的网站公开招标信息实时数据爬取系统的设计与实现
作者:郝少乾
指导教师:王丹辉
作品介绍:随着网络智能化的普及,越来越多的行业借助互联网这种方式来发布信息、获取信息,政府与各大企业的招标、投标信息也是如此。通过本系统的实现用户可以实时获取招投标公告及信息,并通过数据清洗、数据建模、数据分析等方式挖掘其招投标信息背后的价值,再通过数据可视化的形式将数据信息直观的展现给用户,从而提高效率。本系统主要分为三个模块:第一模块,采用Python Scrapy框架进行招投标数据的实时获取与存储;第二模块,使用Pandas、NumPy、Jieba等工具进行数据分析的过程;第三模块:通过搭建部署可视化平台,将上述数据集进行导入,制作绘图与看板进行可视化展示。
作品截图:
作品名称:基于数据挖掘的社交文本情感分析系统设计
作者:濮正萍
指导教师:许亚杰
作品介绍:本作品为一个文本情感分析系统。作品实现过程如下:首先选取“微博”这一用户众多、信息公开的社交平台作为社交文本数据来源;然后通过爬虫技术获取微博上的文本数据,使用Jieba分词技术完成词语分割,使用Word2vec工具完成词语向量化,得到算法分析数据集;接着,搭建了以SVM、LSTM和朴素贝叶斯分类为基础的分类算法模型,采用混淆矩阵分别对这三种分类方法结果验证,显示SVM、LSTM和朴素贝叶斯算法的精确度分别是85%、88%和86%,召回率分别是86%、88%和86%,F1-score分别是85%,88%,86%。实验结果表明:基于深度学习的LSTM模型具有最优的印证参数,即漏检率、虚警率都为最低,说明针对微博文本,LSTM算法模型具有最优的情感倾向分析效果。最后,设计了一个用户图形界面,以将各个功能直观化展示,方便使用。
作品截图:
作品名称:基于Java爬虫技术的直播平台互动数据可视化分析
作者:张旭鹏
指导老师:王丹辉
作品介绍:随着互联网技术的更新换代,直播行业在近几年发展迅猛,直播已经成为一种潮流,涵盖各行各业:娱乐、比赛、教学、电商等等。行业的兴起使得直播的竞争越来越大,要想从人海中脱颖而出,那么分析直播过程的详细数据就至关重要。本作品通过实时爬取抖音平台“斯诺克比赛”、“红警游戏”和“英雄联盟手游”直播间数据。包括:直播间实时在线观众数量、弹幕信息、关注和点赞信息、礼物信息以及用户信息,再通过Echarts图表工具将爬取到的数据展示到网页,经过对网页展示的内容进行可视化。
图文:大数据与人工智能学院