| Author: |
刘清 |
| Author affiliations: |
暨南大学 |
| Source: |
中国优秀硕士学位论文全文数据库
|
| Publication date: |
2020 |
| Subject terms: |
网络爬虫;;K-means聚类;;旅游线路 |
| Document type: |
|
|
Abstract:
|
近年来,随着人们可支配收入不断增加,大众的出游需求被不断刺激。出游一般会选择在线旅游平台搜索相关信息对旅游行程进行规划,但目前大多数平台的旅游路线只是基于传统天数的景点堆砌,并不能实现个性差异化路线推荐。深圳市旅游景点多元丰富,差异化明显,距离及功能不同,因此传统的路线推荐方法并不能满足每类游客群体的需求。此外由于平台游记内容繁多及不规范性,需要花费大量的精力和时间去做分析汇总,大量的游记内容得不到合理应用也会导致资源的浪费。本文通过对在线旅游平台游记内容进行数据化处理,提取热门旅游路线,结合路线特征的差异性及关联性,为在线旅游平台路线推荐提供更好的理论依据,也为当地政府旅游部门更好的发展本地旅游市场,提供一定的应用参考。首先,本研究利用网络爬虫技术提取在线旅游平台“马蜂窝”及“携程网”上用户生成的网络游记,并分别提取每篇游记中包含的旅游景点、人物关系、出发时间、出行天数、人均花费等特征进行对比分析,表明两个平台游记数据的真实一致性。其次,选用数据量较多的马蜂窝平台游记进行热门路线的提取,对游记中出现次数较多的热门景点进行编码,利用大数据k-means聚类算法分析出重合度最高的五类编码,替换成景点名称,即得出当地最热门的五条旅游路线。随后结合游记中提取的单个路线景点频次、评价高频词等对路线的特征进行分析,并结合人物关系、出行天数、人均消费及出发时间等对路线对应人群特征进行分析,以此了解每条路线的差异性及关联性。最后,依据分析结果进行具体应用探索,一个是在线旅游平台的路线推荐应用,主要基于旅游关系人群维度及路线价值体验维度进行路线匹配,解决当前在线旅游平台按传统的单一路线推荐存在的不精准问题;另一个是当地政府依据热门旅游路线的规划应用,主要体现在基于打造热门旅游路线品牌带动非热门景点的应用,及基于热门旅游路线中景点之间关联性的交通资源调配应用。 |
| Database: |
索引类 |