摘 要
在当今互联网时代,随着电子商务的快速发展,各行各业都面临着海量数据的挑战和机遇,电子商务极大地改变了商业运作的方式,为消费者和企业带来了前所未有的便利和机会。
该毕业设计以京东商品数据为来源,设计与实现基于大数据的电商商品推荐系统。通过对电商商品数据进行深度挖掘,可以发现消费趋势、产品热门度、价格以及地区差异等信息,为市场营销和产品策略提供重要参考。利用Java语言及SpringBoot框架、MySQL数据库以及网络爬虫技术等,实现了系统的用户管理、商品管理、系统管理、我的信息(修改密码、个人信息)、首页、我的信息、看板等核心功能,通过融合用户评分信息和商品属性信息,提高了推荐的准确性和多样性。旨在为用户提供一个界面友好、功能齐全、安全可靠的在线电商商品推荐与管理系统平台。
因此,构建基于大数据的电商商品推荐与管理系统,不仅可以提升竞争力,还可以促进数据驱动决策的落地,助力实现可持续发展。而数据分析和可视化技术的发展为企业和组织提供了更多洞察和决策支持,以提高用户购物体验和增加销售额。该经过系统测试,本系统在该场景下具有较好的性能表现。
关键词:大数据;SpringBoot框架;MySQL数据库;协同过滤算法;网络爬虫技术
Abstract
In today’s Internet era, with the rapid development of e-commerce, all walks of life are facing the challenges and opportunities of massive data. E-commerce has greatly changed the way of business operation, bringing unprecedented convenience and opportunities to consumers and enterprises.
This article takes JD product data as the source to design and implement a product data management system based on JD e-commerce. Through deep mining of e-commerce product data, information such as consumption trends, product popularity, prices, and regional differences can be discovered, providing important references for marketing and product strategies. By utilizing Java language, SpringBoot framework, MySQL database, and web crawler technology, the system has implemented core functions such as user management, product management, system management, my information (password modification, personal information), homepage, my information, and dashboard. By integrating user rating information and product attribute information, the accuracy and diversity of recommendations have been improved. Intended to provide users with a user-friendly, fully functional, secure and reliable online e-commerce product management system platform.
Therefore, building an e-commerce product management system based on big data can not only enhance competitiveness, but also promote the implementation of data-driven decision-making and help achieve sustainable development. The development of data analysis and visualization technology provides enterprises and organizations with more insights and decision support to improve user shopping experience and increase sales. After system testing, this system has shown good performance in this scenario.
Key words: Big data; SpringBoot framework; MySQL database; Collaborative filtering algorithm; Web crawler technology;
目 录
摘 要 I
Abstract II
1 引言 1
1.1研究背景和意义 1
1.2国内外研究现状 1
1.3研究内容 3
2相关技术介绍 4
2.1 网络爬虫技术 4
2.2 Pandas 4
2.3 MYSQL数据库 5
2.3 Echaert可视化图表 6
2.4 协同过滤算法 6
3系统分析 8
3.1 可行性分析 8
3.1.1 技术可行性分析 8
3.1.2 经济可行性分析 8
3.1.3 操作可行性分析 8
3.1.4 管理可行性分析 9
3.2 系统功能分析 9
3.2.1 功能性分析 9
3.2.2 非功能性分析 10
3.3 系统用例分析 10
3.4 系统流程分析 11
3.5数据存储分析 14
4系统设计 14
4.1系统架构设计 14
4.2数据采集设计 15
4.3功能模块设计 16
4.4 数据库设计 16
4.2.1 概念结构设计 16
4.2.2 逻辑结构设计 17
5系统实现 20
5.1数据爬取来源 20
5.2数据采集过程 20
5.3数据预处理过程 21
5.4数据结果集 22
5.5 数据分析及可视化模块 25
5.5.1 数据分析 25
5.5.1 数据可视化 25
5.6协同过滤算法 28
5.6.1协同过滤介绍 28
5.6.2商品推荐模块 28
5.7 用户功能模块 31
5.7.1 注册界面 31
5.7.2 登陆界面 31
5.7.3 商品界面 32
5.7.4我的信息界面 33
5.8 管理员功能模块 34
5.8.1 用户管理界面 34
5.8.2 商品管理界面 34
5.8.3 系统管理界面 35
5.8.4 订单信息界面 35
5.8.5 看板界面 36
6系统测试 37
6.1测试目的 37
6.2功能测试 37
结论 40
参考文献 41
致 谢 43
1 引言
1.1研究背景和意义
在当今互联网时代,各行各业都面临着海量数据的挑战和机遇。数据分析和可视化技术的发展为企业和组织提供了更多洞察和决策支持[1]。在数字化时代背景下,大数据和数据分析技术在各个领域发挥着日益重要的作用。京东作为国内领先的电商平台之一,拥有大量的销售数据,其中包括商品类商品的销售数据[2]。以京东平台的商品数据分析为例,通过对京东的商品数据进行深度挖掘,通过对这些数据进行分析和可视化处理,可以帮助企业更好地了解商品市场的发展趋势、产品热门程度以及消费者喜好等信息,有助于优化商品策略和提升销售效益[3]。
实现基于大数据的电商商品数据分析及可视化对用户和管理员都具有重要意义。对于用户而言,可以通过浏览全面的的商品信息、查看和管理个人信息等;对于管理员而言,可以实现对用户和商品信息的管理,同时也能进行系统管理。值得注意的是,能够通过系统看板功能查看京东商品数据分析和可视化功能,并进行多维度的分析,为企业决策提供支持和帮助。因此,这样一个系统的建立不仅有助于提高用户体验和管理效率,也有助于企业更好地利用数据资产,实现数据驱动的发展[4]。
综上所诉,构建基于大数据的电商商品数据分析及可视化,不仅可以提升竞争力,还可以促进数据驱动决策的落地,助力实现可持续发展。该系统的设计与实现利用Python语言及其丰富的库和框架,实现了系统用户管理、商品管理(商品)、系统管理、的信息(修改密码、个人信息)、首页、我的信息、看板等核心功能,旨在为用户提供一个界面友好、功能齐全、安全可靠的在线电商商品数据分析和可视化的平台[5]。
1.2国内外研究现状
随着互联网和信息技术的迅猛发展,电子商务平台在中国商品行业中的应用日益广泛,带来了大量的数据资源,这为大数据在电商商品数据分析中的应用提供了丰富的素材。近年来,国内学者在大数据电商商品数据分析及可视化方面进行了广泛而深入的研究。首先大数据技术在电商商品数据分析中的应用主要体现在消费者行为分析、市场趋势预测、个性化推荐和供应链优化等方面。消费者行为分析是利用大数据技术,通过对消费者在电商平台上的浏览、点击、购买等行为数据进行分析,挖掘消费者的偏好和需求,帮助企业制定更有针对性的营销策略。市场趋势预测则是通过分析历史销售数据、市场环境数据等,结合机器学习算法,对未来的市场需求进行预测,帮助企业进行合理的库存管理和生产计划。个性化推荐是利用大数据技术,根据消费者的历史行为数据,结合协同过滤算法、内容推荐算法等,为消费者推荐可能感兴趣的商品,提高消费者的购买率。供应链优化则是通过分析供应链各环节的数据,如原材料采购、生产、物流等,优化供应链流程,提高供应链效率,降低成本[6]。
在数据可视化方面,国内学者也进行了大量的研究工作。数据可视化是指利用图表、图形等直观的方式展示数据,帮助用户更好地理解和分析数据。在电商商品数据分析中,数据可视化技术被广泛应用于销售数据分析、消费者行为分析、市场趋势预测等方面[7]。通过数据可视化,用户可以直观地看到销售数据的变化趋势、消费者行为的模式以及市场需求的变化,从而帮助企业做出更加科学的决策。近年来国内在大数据电商商品数据分析及可视化方面取得了显著的研究成果。例如,华南理工大学的研究团队开发了一套基于大数据的电商商品销售预测系统,该系统通过对历史销售数据、市场环境数据等进行分析,结合机器学习算法,实现了对未来销售趋势的精准预测,提高了企业的决策效率。此外,北京大学的研究团队在消费者行为分析方面也取得了重要进展,他们通过对电商平台上的消费者行为数据进行深入分析,开发了一套个性化推荐系统,有效提高了消费者的购买率和用户体验。为了应对这些挑战国内学者和企业在不断探索和尝试新的技术和方法。例如,在数据质量方面,研究人员提出了一些数据清洗和预处理的方法,提高了数据的准确性和可靠性。在数据隐私方面,学者们提出了一些数据加密和匿名化的方法,有效保护了消费者的隐私。在数据分析技术和工具方面,研究人员开发了一些易于使用的数据分析平台和工具,降低了大数据分析的门槛[8]。
在国外、很多学者在大数据电商商品数据分析及可视化方面也开展了大量研究工作,主要集中在消费者行为分析、市场趋势预测、个性化推荐系统和供应链优化等方面。消费者行为分析是通过对消费者在电商平台上的浏览、点击、购买等行为数据进行分析,揭示消费者的偏好和需求,从而帮助企业制定更精准的营销策略。市场趋势预测则是利用大数据技术,通过分析历史销售数据、市场环境数据等,结合机器学习算法,对未来的市场需求进行预测,帮助企业进行有效的库存管理和生产规划。个性化推荐系统利用协同过滤算法、内容推荐算法等,根据消费者的历史行为数据,为其推荐可能感兴趣的商品,从而提高用户的购买率和满意度。供应链优化方面,通过对供应链各环节的数据进行分析,如原材料采购、生产、物流等,优化供应链流程,提高运营效率,降低成本。
在数据可视化领域,国外学者也进行了广泛研究。数据可视化技术通过图表、图形等直观方式展示数据,帮助用户更好地理解和分析数据。在电商商品数据分析中,数据可视化技术被广泛应用于销售数据分析、消费者行为分析和市场趋势预测等方面。通过数据可视化,用户可以直观地看到销售数据的变化趋势、消费者行为模式以及市场需求的变化,从而帮助企业做出更加科学的决策[9]。国外在这一领域的研究主要集中在如何提高数据可视化的效果和用户体验方面,例如开发新的可视化算法、设计更直观的图形界面等。在大数据电商商品数据分析及可视化方面,国外的一些研究成果具有重要的参考价值。例如,麻省理工学院(MIT)的研究团队开发了一套基于大数据的商品销售预测系统,该系统通过对历史销售数据、市场环境数据等进行分析,结合机器学习算法,实现了对未来销售趋势的精准预测,提高了企业的决策效率。斯坦福大学的研究团队在消费者行为分析方面也取得了重要进展,他们通过对电商平台上的消费者行为数据进行深入分析,开发了一套个性化推荐系统,有效提高了消费者的购买率和用户体验。此外,欧洲的一些研究机构在供应链优化方面也进行了大量研究,他们通过对供应链各环节的数据进行分析,提出了一些优化供应链流程的方法,提高了供应链的效率和响应速度。
1.3研究内容
通过分析用户的访问记录、搜索行为、点击行为和购买行为等数据,可以深入了解用户在电商平台上的行为模式和购买偏好。通过挖掘用户行为数据,可以揭示用户对哪些商品感兴趣,如何搜索和筛选产品,以及的购买决策过程。这些洞察可以帮助电商平台了解用户的需求,并针对性地提供个性化的推荐和服务。将分析销售数据,以了解不同商品类别的销售情况和销售趋势[10]。通过统计和分析产品的销售量、销售额、销售渠道等数据,可以发现销售的高峰期、低谷期,了解热门商品和滞销产品,并探索其背后的原因。这些数据分析可以帮助电商平台制定相应的销售策略,提升产品的竞争力和市场占有率。还将分析用户在购买过程中的行为路径,了解用户的转化率和转化路径。通过深入研究用户的购买决策过程,可以找出购买路径上的瓶颈和优化点,优化用户体验,提高购买转化率。例如,可以提供更加便捷的购买渠道、增加用户的购买信心,或提供个性化的促销活动。通过对用户行为和偏好的分析,可以将用户划分为不同的群体,并为其推荐个性化的商品产品。可以根据用户的历史购买记录、浏览记录以及兴趣偏好,构建用户画像,并为用户提供定制化的推荐和服务。这将提高用户满意度,增加用户的忠诚度和购买意愿。
2相关技术介绍
当谈及大数据的相关理论时,可以涵盖一系列概念和原理。大数据的存储和处理方面,涉及分布式存储的理论,如Hadoop分布式文件系统(HDFS)的设计理念和数据分布存储的原理。还有数据模型方面,大数据理论探讨了适用于庞大数据集的数据模型和数据质量相关理论,以确保数据的准确性和可靠性。在数据挖掘领域,理论方面包括各种算法和技术,如聚类分析、关联规则挖掘、分类和预测等,能够从大规模数据中发现潜在的关系和规律[11]。
大数据理论还涉及到数据处理和分析的理论基础,如基于MapReduce编程模型的理论,用于在分布式计算框架中处理和运算大规模数据。还有机器学习算法和模型的理论,可以应用于大数据集的学习和预测。另外,图数据库、关系数据库、NoSQL数据库等方面的理论也是大数据理论的重要组成部分,是大数据存储和管理的基础[12]。
大数据的相关理论覆盖了数据存储、数据模型、数据质量、数据挖掘和机器学习等领域,为应对大数据处理和分析的挑战提供了理论支撑。这些理论和概念的研究进展,在很大程度上推动了大数据技术的发展,并为大数据应用提供了理论基础[13]。
2.1 网络爬虫技术
Scrapy是一个开源且强大的Java爬虫框架,用于快速高效地从网站和互联网上提取结构化数据。它可用于广泛的目的,从数据挖掘到监控和自动化测试。Scrapy的核心是其引擎,它负责调度、下载、解析和处理请求以及项目管道的清理和持久化。Scrapy能够处理登录、cookies、session、用户代理切换等一系列复杂商品。其优势在于可扩展性、中间件支持、内建的下载器和爬虫管理等。通过使用Twisted异步网络库和丰富的API,Scrapy可以高效地处理并发请求,并且具有很好的性能表现。网络爬虫在各种搜索引擎中广泛应用,它构成了搜索引擎的关键部分,主要负责数据的检索商品。简单来说,网络爬虫是一个自动提取HTML文档信息的程序或脚本,它执行网页的下载,并对获取的内容进行整理和建立索引。其工作流程主要包括页面收集、页面解析和链接管理等组件。
2.2 Pandas
Pandas是一种功能强大的数据处理与分析工具,是信息处理与分析的重要工具。Pandas提供了一个有效,灵活,易用的数据结构DataFrame,允许用户将数据作为一个表来保存和处理。Pandas大大简化了对数据的清理与预处理。例如,用 fillna ()函数可以很容易地将缺少的数值补全,而 dropna ()函数能够删除含有遗漏的数值,从而确保了数据的完整与精确。Pandas还提供了 CSV, Excel, SQL等多个数据格式。这样就可以轻松地从不同的资料来源输入并分析资料。在食物信息分析方面,不管是网上商店,实体商店,还是供应链,都可以很容易的整合到 Pandas的工作流中,并对其进行统一的处理与分析。Pandas对数据的分析能力很强。用户可以方便地对数据进行汇总,分组,筛选和分类,从而发现商品销售,库存,消费行为的变化规律[15]。
Pandas还提供了大量的统计函数以及图形化的图形,如直方图、箱线图等,使读者能够更加直观的了解这些数据,并从中挖掘出潜在的价值。Pandas易于使用,易于使用,非常适合于数据分析。Pandas语法简洁,学习曲线平缓,便于用户快速完成对数据的分析[11]。Pandas是数据分析中不可缺少的一种工具,该模型为商品工业中广泛存在的营养成分分析、微生物检测、销售数据等数据分析提供了一种有效、易用的方法[16]。
此外,pandas还提供了数据转换和特征工程的功能,如使用apply()方法对数据进行自定义转换,使用get_dummies()方法对分类变量进行独热编码等。这些功能可以帮助更好地理解和使用数据,为后续的数据分析和建模打下坚实的基础。Pandas不但支持多个数据类型,而且对数据进行清洗、筛选、分组、排序、转化等功能。另外, Pandas还可以与其它数据处理及可视化软件进行有机结合,例如 NumPy用于数值运算, Matplotlib用于图形化,从而实现对食物数据的全面分析[13]。借助Pandas,商品工业能够更准确的了解市场需求,优化配方,控制生产工艺,提高产品品质,增强市场竞争力。
2.3 MySQL数据库
MySQL作为一款具备卓越性能的轻型关系型数据库管理系统,以其安全性、可扩展性和跨平台兼容性而备受赞誉。它的核心构建于C和C++编程语言之上,这赋予了其源代码强大的灵活性。MySQL库包含了丰富的数据类型,包括但不限于标准数据结构,使其在数据库管理领域扮演着日益重要的角色。它不仅简化了日常操作流程,还支持复杂的数据搜索和多样化报告生成,得益于其高度兼容性和适应性,被广泛应用在各行各业。在Web开发领域,MySQL尤其受到企业和个人开发者青睐。众多中小网站倾向于选择MySQL作为底层数据库,它不仅提供了高效的数据浏览能力,还具备强大的数据分析和问题解决方案。Linux和MySQL的开源特性降低了企业的成本,使得许多企业选择它们作为网站数据库,这不仅因为其体积小巧,启动迅速,更保证了用户流畅的体验,不会对网站性能造成负面影响。
MySQL兼容并支持多种操作系统,如AIX、HP-UX、OS/2 Wrap、Solaris、Mac OS、Linux及Windows,其易用性和高效性使其成为数据库市场上的热门选择。基于面向对象的设计哲学,MySQL将用户需求置于首位,通过这种方式实现了功能的高效整合。无论面对大型复杂的数据表还是关系数据库,它都能轻松管理,并将这些复杂的系统集成进小型化的数据库架构中。如今,众多中国企业已成功地将这项先进技术融入日常运营之中[14]。
2.3 Echaerts可视化
ECharts是一个由百度开发并开源的数据可视化库,能够以简单、直观的方式将数据转化为各种图表形式。其主要特点之一是丰富多样的图表类型,包括折线图、柱状图、饼图、雷达图、散点图等[17],以及各种复合图表的组合形式。这些图表类型覆盖了大多数数据可视化的需求场景,使得用户能够根据不同的数据特点选择最合适的展示形式。此外还具有高度的定制化能力。用户可以通过简单的配置参数调整图表的样式、颜色、标签、图例等,满足不同场景和品牌的需求。同时,ECharts支持图表的交互操作,包括鼠标悬停、点击、拖拽等,使得用户能够更加直观地与数据进行交互,深入了解数据背后的含义。采用纯JavaScript实现,支持跨平台运行,可以在Web端、移动端和桌面端等多种环境下使用。其轻量级的特性使得在各种项目中都能够快速集成和部署,为开发者提供了便利。
总的来说ECharts作为一款功能强大、灵活多样的数据可视化库,为用户提供了丰富的图表类型、高度的定制化能力、良好的跨平台支持和优秀的性能表现。它已成为数据可视化领域的热门选择,被广泛应用于各种Web应用、数据分析平台和大数据项目中,为用户带来了便捷和高效的数据展示和分析体验。
2.4 协同过滤算法
基于用户行为的推荐算法中,协同过滤是最常用的方法之一。协同过滤主要分为基于用户的协同过滤(User-Based Collaborative Filtering),以下是这种方法的公式:
基于用户的协同过滤:
基于用户的协同过滤算法通过寻找相似用户,根据相似用户的偏好来推荐物品。假设本毕业设计有用户集合 (U) 和物品集合 (I),用户 (u) 对物品 (i) 的评分为 (r_{u,i})。推荐系统要给用户 (u) 推荐物品 (i) 的预测评分为 (\hat{r}_{u,i})。
计算用户相似度:
通过计算用户之间的相似度来找出与用户 (u) 最相似的用户。常用的相似度计算方法是皮尔逊相关系数和余弦相似度。以余弦相似度为例,用户 (u) 和用户 (v) 之间的相似度 (\text{sim}(u, v)) 计算公式为[19]:
其中,(I_{uv}) 表示用户 (u) 和用户 (v) 都有评分的物品集合。
预测评分:
通过相似用户的评分来预测目标用户对某物品的评分,公式为:
这个公式展示了基于用户的协同过滤核心计算方法,通过以上方法可以有效地实现个性化推荐,提高用户满意度。
3系统分析
系统需求分析是系统开发的一个关键环节,在系统的设计和实现上起到了一个承上启下的位置。系统需求分析是对所需要做的系统进行一个需求的挖掘,如果分析的准确可以精准的解决现实中碰到的问题。如果分析不到位会影响后期系统的实现。一个系统的优秀程度需求分析也是占据了非常大的比例,如果需求分析不到位,后面的系统设计要实现就是一个偏离导航的设计。
3.1 可行性分析
3.1.1 技术可行性分析
基于大数据的电商商品数据分析及可视化在技术可行性方面具有广泛的支持和应用。Python作为一种高级编程语言,拥有丰富的第三方库和工具,可以轻松地处理各种技术需求。例如,Python的数据库访问工具和ORM框架可以方便地与数据库进行交互,存储和管理信息。此外,Python还提供了多种网络编程库具备强大的数据处理和分析能力,可以对数据进行统计和报表生成,实现数据分析可视化。同时,Python也支持图形化界面开发,可以创建友好且易于操作的用户界面[21]。总体而言,基于大数据的电商商品数据分析及可视化在技术可行性方面具备丰富的资源和支持,可以满足系统的各项技术需求,并提供稳定、可靠的功能和性能[22]。
3.1.2 经济可行性分析
开发京东商品数据分析及可视化的技术都是可以从网上直接免费下载,不用花一分钱,而且系统的源代码都是自己进行设计开发的,不需要成本,如果后期想要进行运营,只要把配置到服务器上,花费服务器的租赁费用,在使用中可以进行增加广告收益,因此在经济方面是可行的。
3.1.3 操作可行性分析
当下网络新时代,计算机已经得到了普及,多数人对计算机都比较的熟悉,知道如何使用,当然也存在对计算机比较陌生的这一群体,也需要对其进行考虑。在进行电商商品数据分析及可视化页面的设计的时候,考虑到使用人群,可能也存在对计算机比较陌生的人,所以,在页面的设计方面,设计的很是简单、简洁,布局明了,色调明朗,让无论是对计算机陌生还是对计算机熟悉的使用者,都可以使用自如,这也说明了该程序的操作方面非常可行。
3.1.4 管理可行性分析
本电商商品数据分析及可视化开发完成后只需要一个管理人员进行后台信息的增删改查以及用户管理就可以,不需要进行特别的培训,所以,操作者只要有一点电脑基础就可以进行管理,在管理方面是可行的。
3.2 系统功能分析
3.2.1 功能性分析
按照电商商品数据分析及可视化的角色,系统划分为了用户模块和管理员模块这两大部分。
用户模块:
(1)注册登录:游客可以通过注册成为系统用户,使用账号密码可进行登录,使用系统功能。
(2)商品管理:可查看自己的商品信息,支持标题搜索,可点击详情(来源、标题、图片、价格、店铺、类别、商品产地、分类、商品编号、商品毛量、主要成分)进行查看,点击来源链接可跳转京东商品来源购买页面。
(3)我的信息:可对个修改密码和个人信息等信息进行管控。点击“修改密码”,可修改自己的账号密码,修改完成后,需用新密码进行登录;点击“个人信息”,可查看自己的个人信息(用户账号、用户姓名、性别、联系方式、头像),并可进行修改用户姓名、性别、联系方式、头像等信息。
管理员模块:
(1)登录:管理员账号密码由系统生成,可使用账号密码可进行登录,使用系统功能,并对个人信息和密码进行管理。
(2)用户管理:可对用户进行管控,包括进行增删改查操作,支持用户账号、用户姓名搜索,可点击详情(用户账号、用户姓名、性别、联系方式、头像)进行查看。
(3)商品管理:可查看所有商品信息,进行删除和提取数据操作,支持标题搜索,可点击详情(来源、标题、图片、价格、店铺、类别、商品产地、分类、商品编号、商品毛量、主要成分)进行查看。
(4)系统管理:可对系统简介进行管理,进行查看和修改操作,支持标题搜索,可点击详情(序号、标题、副标题、图片)进行查看。
(5)我的信息:可对个修改密码和个人信息等信息进行管控。点击“修改密码”,可修改自己的账号密码,修改完成后,需用新密码进行登录;点击“个人信息”,可查看自己的个人信息(用户名、头像),并可进行修改用户信息。
(6)看板:可查看所有看板信息,查看数据分析和可视化信息,包括商品、商品价格分析、好评度分析、差评度分析等信息数据分析和可视化图表。
3.2.2 非功能性分析
电商商品数据分析及可视化的非功能性需求比如平台的安全性怎么样,可靠性怎么样,性能怎么样,可拓展性怎么样等。具体可以表示在如下3.1表格中:
表3.1 电商商品数据分析及可视化非功能需求表
安全性 主要指京东商品数据分析和可视化数据库的安装,数据库的使用和密码的设定必须合乎规范
可靠性 可靠性是指京东商品数据分析和可视化能够安装用户的指示进行操作,经过测试,可靠性90%以上
性能 性能是影响京东商品数据分析和可视化占据市场的必要条件,所以性能最好要佳才好
易用性 用户只要跟着京东商品数据分析和可视化的页面展示内容进行操作,就可以了
可扩展性 比如数据库预留多个属性,比如接口的使用等确保了系统的非功能性需求
可维护性 京东商品数据分析及可视化开发的可维护性是非常重要的,经过测试,可维护性没有问题
3.3 系统用例分析
通过3.3的功能分析,得出了系统的用例图:
用户角色用例如图3.1所示。
图3.1 用户角色用例图
管理员是维护整个电商商品数据分析及可视化中所有数据信息的。管理员角色用例如图3.2所示。
图3.2 管理员角色用例图
3.4 系统流程分析
电商商品数据分析及可视化开发时,进行需求分析,进而对系统进行总体的设计规划,设计系统功能模块,数据库的选择等,本系统的开发流程如下图3.3所示。
图3.3 系统开发流程图
为了保证系统的安全性,要使用本系统对系统信息进行管理,必须先登陆到系统中。如下图3.4所示。
图3.4 登录流程图
提取数据流程如图3.5所示。
图3.5 提取数据流程图
删除信息流程图如图3.6所示。
图3.6 删除信息流程图
3.5数据存储分析
结构化数据存储模块:
数据库:使用关系型数据库MySQL存储电商商品分析及可视化相关的结构化数据,包括商品名称、价格、参数、厂商信息等。
数据表设计:根据电商商品数据的属性,设计相应的数据表,如商品名称表、价格表、厂商信息表等,确保数据存储的规范性和一致性。
数据字段:每个数据表包括各种属性字段,存储电商商品相关的信息,如商品名称、价格、参数、厂商信息等,以便对数据进行查询和分析。
非结构化数据存储模块:
文件存储:将电商商品相关的非结构化数据存储为文件,包括商品图片、商品描述文本等。
分类存储:根据非结构化数据的类型,建立相应的存储结构,如将商品图片存储在一个文件夹中,商品描述文本存储在另一个文件夹中。
数据索引:为非结构化数据建立索引,方便检索和访问,提高数据的查询效率。
4系统设计
本章主要讨论的内容包括电商商品数据分析及可视化的功能模块设计、数据库系统设计。
4.1系统架构设计
该体系依托于B/S架构,利用SpringBoot框架进行搭建,爬虫模块采用Python、以及使用Scrapy框架进行数据清洗。整体架构将系统细分为三个层面:视图层(View)、控制层(Controller)和模型层(Model)。视图层作为前端展示界面,直接与用户互动,主要借助HTML和Vue技术;控制层则担当业务逻辑处理,涵盖各类交互逻辑,核心编程语言为Java;模型层专注于数据库管理,包括数据的添加、删除、更新和查询功能,本项目选用MySQL数据库。以上各层次架构构成了如图4-1所示的系统技术框架。
图 4.1 系统架构设计
4.2数据采集设计
该系统采用定制化的网络爬虫技术来获取汽车产品的比较和推荐数据,这些数据直接来源于爬虫程序从汽车销售平台和厂商官网抓取的信息。这个部分的核心商品是构建网络爬虫,它会遍历汽车销售平台和厂商官网,搜集相关汽车详情,并存储到MySQL数据库内。考虑到各大汽车销售平台和厂商官网对商品信息的保护措施不断加强,采用了各种反爬虫策略,而且每个平台的架构和反爬策略各有差异,这给系统的商品信息抓取带来了重大挑战。基于前期的理论研究和对汽车大数据分析系统功能需求的深入分析,本设计的网络爬虫采集模块计划为每个汽车销售平台和厂商官网单独编写定制化的网络爬虫,以高效执行汽车信息的抓取商品。自定义网络爬虫的系统架构示意如图4-2所示。
图 4-2 网络爬虫体系结构图
4.3功能模块设计
系统在结构上的设计至关重要,要考虑周全,设计全面,一个完善的结构体系,能够满足用户在使用时的各种需求,这样会让提高程序的使用率,保证程序被长久的利用。在设计电商商品数据分析及可视化的结构时,也列入重点,采用模块化的方法来进行设计,即将大模块确定下来,再慢慢的将大模块进行补充完善,向下分支出小模块,一起共同组成的系统的结构体系,下图是该电商商品数据分析及可视化的结构设计图,直观明了的可以看出本项目程序的功能[21]。
电商商品数据分析及可视化模块图如图4-3所示。
图4-3电商商品数据分析及可视化功能模块图
4.4 数据库设计
数据库设计一般包括需求分析、概念模型设计、数据库表建立三大过程,其中需求分析前面章节已经阐述,概念模型设计有概念模型和逻辑结构设计两部分。
4.2.1 概念结构设计
下面是整个电商商品数据分析及可视化中主要的数据库表总E-R实体关系图。
图4-4电商商品数据分析及可视化总E-R关系图
4.2.2 逻辑结构设计
在数据库表中会看到系统的表名、主键、外键等信息,通过数据库表的主键、外键把每个表关联起来,在界面中展示,本电商商品数据分析及可视化的主要的数据库表如下:
表4.8 配置文件
字段名称 类型 长度 字段说明 主键 默认值
id bigint 主键 主键
name varchar 100 配置参数名称
value varchar 100 配置参数值
url varchar 500 url
表4.3 分类
字段名称 类型 长度 字段说明 主键 默认值
id bigint 主键 0
addtime timestamp 创建时间 CURRENT_TIMESTAMP
title varchar 200 标题
picture varchar 200 图片
price double 价格
dianpu varchar 200 店铺
category varchar 200 分类
pianhao varchar 200 商品编号
maozhong varchar 200 商品毛重
chandi varchar 200 商品产地
chengfen varchar 200 主要成分
leibie varchar 200 类别
laiyuan varchar 200 来源
表4.4 用户
字段名称 类型 长度 字段说明 主键 默认值
id bigint 主键 主键
addtime timestamp 创建时间 CURRENT_TIMESTAMP
yonghuzhanghao varchar 200 用户账号
mima varchar 200 密码
yonghuxingming varchar 200 用户姓名
xingbie varchar 200 性别
lianxifangshi varchar 200 联系方式
touxiang longtext 4294967295 头像
表4.5 用户表
字段名称 类型 长度 字段说明 主键 默认值
id bigint 主键 主键
username varchar 100 用户名
password varchar 100 密码
image varchar 200 头像
role varchar 100 角色 管理员
addtime timestamp 新增时间 CURRENT_TIMESTAMP
表4.6 系统简介
字段名称 类型 长度 字段说明 主键 默认值
id bigint 主键 主键
addtime timestamp 创建时间 CURRENT_TIMESTAMP
title varchar 200 标题
subtitle varchar 200 副标题
content longtext 4294967295 内容
picture1 longtext 4294967295 图片1
picture2 longtext 4294967295 图片2
picture3 longtext 4294967295 图片3
表4.7 商品
字段名称 类型 长度 字段说明 主键 默认值
id bigint 主键 主键
addtime timestamp 创建时间 CURRENT_TIMESTAMP
laiyuan varchar 200 来源
title varchar 200 标题
picture longtext 4294967295 图片
price double 价格
dianpu varchar 200 店铺
leibie varchar 200 类别
chandi varchar 200 商品产地
category varchar 200 分类
pianhao varchar 200 商品编号
maozhong varchar 200 商品毛重
chengfen varchar 200 主要成分
5系统实现
5.1数据爬取来源
在基于Spark的大数据商品推荐系统开发中,数据爬取是获取有效信息的关键步骤之一。本设计的数据爬取主要来源于某知名电商平台如图5.12所示(示例链接:https://www.jd.com)。该电商平台是中国领先的在线购物平台,提供了丰富的商品相关信息,包括商品价格、用户评价、商品描述等,为广大消费者和业界人士提供了重要的参考依据。通过该电商平台获取丰富的商品数据,为大数据分析系统提供可靠的数据基础,支持更为精准和高效的商品推荐和市场分析。通过对这些数据的深入分析,可以发现用户的购物习惯和偏好,从而为用户提供个性化的商品推荐,提升用户满意度和平台销售额。
图5.11数据爬取来源界面
5.2数据采集过程
定义一个Scrapy爬虫类"shangpinxinxiSpider",用于爬取指定网站的商品信息。"name"定义了爬虫的名称,"spiderUrl"指定了目标网站的URL,"start_urls"将目标网站的URL按分号拆分成一个列表,作为爬取的起始URL。"protocol"和"hostname"用于定义协议和主机名,暂时为空。"realtime"用于指定是否实时获取数据,初始化为False。使用parse方法中进行一些初始化操作和判断条件。首先,通过urlparse函数解析self.spiderUrl得到URL的协议和主机名,并将其分别赋值给self.protocol和self.hostname。然后,通过platform.system().lower()获取当前操作系统的名称,并将其转换为小写字母,保存在plat变量中。 接着,判断条件如果不是实时爬取(self.realtime为False)并且当前操作系统是Linux或Windows,建立数据库连接,并将连接对象赋值给connect变量。获取数据库的游标对象,并将其赋值给cursor变量,调用table_exists函数检查数据库中是否存在名为"5nw5u40i_Shangpinxinxi "的表,如果存在就执行关闭游标和连接,调用temp_data函数。 使用Scrapy爬虫的回调函数,进行解析详情页面,从response的meta中获取字段对象fileds,最后对其进行赋值和处理。
5.3数据预处理过程
在基于大数据的商品推荐系统开发中,数据集处理是至关重要的环节。以下是本文详细的数据集处理流程:首先,通过各种渠道搜集商品信息数据集,这可能涉及抓取在线电商平台的数据、接收来自商品供应商的资料,以及整合市场销售报告等。这些数据应涵盖商品的核心详情,例如价格走势统计、销量统计、用户评价、商品分类统计、品牌统计等。获取到数据集后,重要的一环是执行数据清洗和预处理步骤。数据清洗的目的是保证数据质量和完整性,涉及消除重复记录、处理缺失值、修正不准确的信息等。预处理阶段则涵盖数据的格式统一、标准化和转化操作,以适应后续的分析需求。这一过程中,本文利用pandas库来进行数据洞察,并结合Scrapy架构进行高效的数据采集和清洗,从而保证数据的精确度和实用性。为了数据的可靠存储和扩展能力,选用MySQL数据库系统。通过以上流程,确保所收集和处理的商品数据具有高质量和高完整性,为后续的推荐算法提供坚实的数据基础。Spark在处理大规模数据集方面的强大能力,可以帮助本文实现更精准的商品推荐,从而提高用户的购物体验和平台的销售效率。
为了建立与MySQL数据库的连接,本文将使用root用户,其密码设定为123456,目标数据库名为food_data。采用pandas的read_sql方法,可以从数据库中提取所需的数据。
首先检查DataFrame对象df是否存在重复的行,使用’df.drop_duplicates()'函数删除对象中重复行。调用’df.isnull()'函数检测对象df’中的缺失值。随后调用’df.dropna()'函数删除具有缺失值的行。‘df.fillna(value=‘暂无’)函数将对象df中的缺失值替换为指定的值’暂无’。
生成一个包含80个介于0到1000之间的随机整数的数组a,然后定义了一个布尔条件cond,用于筛选满足a在100到800之间的元素。生成一个包含10万个符合标准正态分布的随机数的数组b,定义一个布尔条件cond,用于筛选满足b的绝对值大于3的元素。
创建一个形状为10000行3列的DataFrame df2,其中的数据是符合标准正态分布的随机数。定义一个布尔条件cond,用于筛选在df2中任意一列的值大于三倍标准差的行。该行代码使用索引操作df2[cond].index,获取满足条件cond的行的索引。删除具有指定索引的行,并返回更新后的对象df2。
移除HTML标签,首先,检查html参数是否为None,如果是则返回空字符串。然后使用正则表达式模式匹配HTML标签的正则表达式(<[^>]+>),并通过re.sub函数将匹配到的HTML标签替换为空字符串。最后使用strip函数去除字符串两端的空白字符,并返回处理后的结果。
在初始化数据库链接流程时,首要商品是从配置文件中提取必要的连接参数,这些参数涵盖了数据库的种类标识、服务器地址、端口、登录凭证,如用户名和密码。如果数据库名称未明确指定,系统会尝试从self.databaseName属性中寻找。接下来,根据所识别的数据库类型动态选择适配的连接技术。例如,如果确认是MySQL,会选择pyMySQL库进行无缝对接;反之,如果不是MySQL,程序将同样采用pyMySQL库来建立连接。最终,这段代码将执行并返回一个有效的连接对象,记作connect,整个过程逻辑严谨且高效。以下是具体实现的代码段如下所示:
将处理好的数据进行数据存储,定义一个包含插入语句的sql字符串,目标数据库表是Shangpinxinxi,列名包括id、jobname、salary等,从表5nw5u40i_Shangpinxinxi中选择符合条件的数据,将这些数据插入到目标表中,
5.4数据结果集
通过爬取https://api.m.jd.com网站数据集。数据如图5.2图5.3所示。
图5.2 数据集
图5.3 数据集
经过数据预处理,将爬取数据存储到数据库中如上图5.4所示。
图5.4 数据存储
5.5 数据分析及可视化模块
5.5.1 数据分析
使用Python的pandas库进行数据分析,是一种高效而且灵活的方式。pandas库内置的功能包括数据重塑、缺失值处理、数据规整、数据合并和切片等。此外,pandas库还支持广泛的数据类型,包括文本、时间序列等。这使得pandas库非常适合用于多种数据集,如金融、政治、社会等。
pandas库也提供了丰富的数据分析工具, pandas库支持聚类分析、分类和回归分析等多种机器学习算法。聚类分析可以帮助对数据进行分组,以便更好地理解数据集。分类和回归分析则可以帮助预测未来事件和预测结果,这在商业和金融上具有重要意义。本设计使用 pandas库进行全面的数据分析,包括排序、聚类、分类等,从而为数据分析和预测建模提供有力支持。经过数据分析结果如下图5.2 图5.3所示。
图5.2 价格排序
图5.3 分类排序
5.5.1 数据可视化
使用 Python 的数据可视化库,可以对数据进行多种可视化展示,包括直方图、线图、散点图、热力图、箱线图等,以展示数据的分布、趋势和关联性等。使用 Earchts绘制,通过散点图、饼图、直方图等可视化结果,可以更直观地展示数据的特征、趋势和关联性,为数据分析和决策提供可视化支持。详细处理如下图5.2 图5.3图5.4所示。
图5.2 品牌差评图
图5.2 价格统计数量直方图
图5.4 品牌词云图
5.6协同过滤算法
5.6.1协同过滤介绍
协同过滤(Collaborative Filtering)是一种通过分析具有相似兴趣和共同经验群体的喜好来推荐用户感兴趣信息的方法。其核心思想是利用用户之间的合作机制,通过用户对信息的反馈(如评分)来实现信息过滤,从而帮助其他用户筛选信息。反馈不仅限于用户感兴趣的信息,不感兴趣的信息记录也同样重要。协同过滤可以进一步分为评比(rating)和群体过滤(social filtering)。
显性反馈指用户明确表达对物品喜好的行为,主要方式包括评分以及喜欢/不喜欢。隐形反馈则指那些不能直接反映用户喜好的行为,例如收藏记录、点击记录和浏览记录。
基于用户的协同过滤算法(UserCF)是一种通过推荐与目标用户兴趣相似的其他用户喜欢的产品来进行推荐的方法。
5.6.2商品推荐模块
在本功能中,主要通过基于用户的协调过滤算法和随机推荐算法来给用户推荐合适的商品。分为以下两种情况:
当用户没有登录时,点击主页的商品列表按钮,系统会默认推荐一些商品并显示出来。
本功能推荐页面如图所示。
本基于用户行为的协同过滤功能实现的核心代码所示。这段代码实现了基于协同过滤的商品数据推荐功能。首先通过@RequestBody
和HttpServletRequest
接收前端传递的请求和用户ID。如果用户ID不为空,系统会从数据库中获取该用户的详细信息,并判断其用户类型。如果用户类型不是0(即非普通用户),则系统会获取所有类型为1的用户,并收集他们的用户标记信息。接着使用协同过滤算法(CFUtils.CF_shujus)基于这些用户的标记信息和当前用户ID生成推荐的数据ID列表。然后系统从数据库中查询所有数据,并将其ID与推荐的数据ID列表进行匹配,生成推荐的数据对象列表。如果推荐列表不为空,返回推荐的商品数据;否则随机从所有数据中选择6条数据作为推荐内容返回。
5.7 用户功能模块
5.7.1 注册界面
游客可以查看系统信息,也有注册成为用户的权限。游客可以通过注册成为系统用户,使用账号密码可进行登录,使用系统功能。注册界面展示如图5.9所示。
图5.9 用户注册页面图
5.7.2 登陆界面
当用户注册成功以后就成为了用户,使用账号密码可进行登录,使用系统功能,登录界面如图5.8所示。
图5.8 登录界面图
5.7.3 商品界面
可查看自己的商品信息,支持标题搜索,可点击详情(来源、标题、图片、价格、店铺、类别、商品产地、分类、商品编号、商品毛量、主要成分)进行查看,点击来源链接可跳转京东商品来源购买页面。界面如下图5.10所示。
图5.10 商品信息界面图
5.7.4我的信息界面
可对个修改密码和个人信息等信息进行管控。点击“修改密码”,可修改自己的账号密码,修改完成后,需用新密码进行登录;点击“个人信息”,可查看自己的个人信息(用户账号、用户姓名、性别、联系方式、头像),并可进行修改用户姓名、性别、联系方式、头像等信息。界面如下图5.11所示。
图5.11 我的信息界面图
5.8 管理员功能模块
5.8.1 用户管理界面
可对用户进行管控,包括进行增删改查操作,支持用户账号、用户姓名搜索,可点击详情(用户账号、用户姓名、性别、联系方式、头像)进行查看,界面如下图5.12所示。
图5.12 用户管理界面图
5.8.2 商品管理界面
可查看所有商品信息,进行删除和提取数据操作,支持标题搜索,可点击详情(来源、标题、图片、价格、店铺、类别、商品产地、分类、商品编号、商品毛量、主要成分)进行查看。界面如下图5.13所示。
图5.13 商品管理界面图
5.8.3 系统管理界面
可对系统简介进行管理,进行查看和修改操作,支持标题搜索,可点击详情(序号、标题、副标题、图片)进行查看。界面如下图5.14所示。
图5.14 系统管理界面图
5.8.4 订单信息界面
在订单管理模块中,用户可以方便地对订单进行管理和操作。点击“查看订单”,可以浏览当前和历史订单的详细信息,包括订单编号、商品名称、数量和总价等。界面如下图5.15所示。
图5.15 订单信息界面图
5.8.5 看板界面
可查看所有看板信息,查看数据分析和可视化信息,包括差评度、好评度、价格统计、商品总数、图片、介绍、商品产地分析、商品、商品价格分析、等信息数据分析和可视化图表。看板界面如图5.16所示。
图5.16 看板界面图
6系统测试
6.1测试目的
本文介绍了一种电子商务商品信息推荐与管理系统,包括用户登录,食物管理,看板信息,修改密码等。本系统设计的目的是为用户提供一个简单、易于使用的人机交互接口,使系统的使用者和管理者可以更容易、更有效地进行各种工作。在此基础上,本系统着重于用户体验,通过简洁、简洁的界面、顺畅的操作过程,给用户带来极佳的使用体验。同时,该系统具有较高的开放性,可以在一个开放的硬件架构下稳定地工作,并且可以与其它系统进行无缝对接,为电商产业的发展提供数据支撑与服务。从用户的登录,到商品信息的保存,到看板信息的实时监测,再到设置密码,都可以快速的做出反应,并且能够很好的满足用户的要求,已经成为了电子商务商品产业中不可缺少的一个管理工具。
6.2功能测试
用户登录功能测试:
该系统具有完备的用户登陆机制,保证了用户资料的安全与隐私。在此基础上,用户只需输入用户名称、密码即可登陆,然后由系统对其进行身份认证,并授予其相应的权限。同时,它还提供了一种新的登录方式,让新用户只需一步就可以建立自己的账号,并设定好自己的密码。
表6.1 用户登录功能测试表
用例名称 用户登录系统
目的 测试用户通过正确的用户名和密码可否登录功能
前提 未登录的情况下
测试流程 1) 进入登录页面
2) 输入正确的用户名和密码
预期结果 用户名和密码正确的时候,跳转到登录成功界面,反之则显示错误信息,提示重新输入
实际结果 实际结果与预期结果一致
商品管理查看功能测试:
其中一个重要的功能就是食物的管理。通过该系统,管理员可以对商品进行全方位的管理,包括添加,修改,删除,查询等功能。该系统可以对商品的名称、描述、价格、库存量等进行详尽的输入,从而保证了使用者可以正确地获得产品信息。另外,本系统也提供了食物类别及标签的管理,让使用者可以很容易地找到所需食物。
表6.2 商品管理查看功能测试表
用例名称 商品管理查看
目的 测试商品管理查看功能
前提 管理员、用户登录
测试流程 点击商品管理
预期结果 可以查看到所有的商品管理信息
实际结果 实际结果与预期结果一致
看板查看界面测试:
通过对看板信息的管理,实现了一个直观的可视化管理平台。通过这个功能,管理者可以对销售数据、用户活跃度、库存情况等重要数据进行实时监测,从而能够对运营战略进行及时的调整,并对资源进行最优分配。同时,为满足用户个性化的需要,还提供了看板的定制和数据可视化显示功能。
表6.3 看板查看界面测试表
用例名称 看板查看测试用例
目的 测试看板查看功能
前提 管理员正常登录情况下
测试流程 点击看板进入看板查看页面
预期结果 可以查看到所有的商品管理信息
实际结果 实际结果与预期结果一致
密码修改功能测试:
该系统还具有更改密码的功能,以保证用户帐号的安全。用户只需在登陆后对自己的口令进行更改,就能有效防止帐号被人利用。为了保证帐户的安全,系统对密码的修改提出了严格的要求,如密码的长度和复杂程度等。
表6.4 密码修改功能测试表
用例名称 密码修改测试用例
目的 测试管理员密码修改功能
前提 管理员、用户正常登录情况下
测试流程 1)管理员密码修改并完成填写
2)点击进行提交
预期结果 使用新的密码可以登录
实际结果 实际结果与预期结果一致
结论
本设计是基于Java语言和大数据技术的电子商务商品信息分析和可视化系统。本项目将充分利用Java在数据处理和并发处理等领域的优势,与大数据技术在处理海量数据上的优势相结合,为本项目的开展提供新的研究思路。
基于大数据的电商商品推荐系统基于请求的HTTP请求,通过Jsoup库对网页内容进行解析,从而获得商品名称、价格、销量等相关信息。在编写爬虫程序时,本文对目标网站的防爬虫机制进行了深入研究,并通过设置合适的请求头,采用代理IP,控制请求频率,避免被封禁。本文选择了具备高效数据抓取功能和灵活性的Apache Nutch框架,以确保数据采集的高效和稳定。
为了实现数据的分析和可视化,本文使用了Java和Vue以及Python爬虫等技术,并结合协同过滤算法对商品进行推荐。协同过滤算法通过分析用户的历史行为和相似用户的行为,提供个性化的商品推荐,提高用户的满意度和销售转化率。为了展示分析结果,本文使用了Echarts等可视化工具,生成了各种直观易懂的柱状图、折线图和饼图,以直观的方式展示商品的销售趋势和用户的行为模式。
参考文献
[1]王晖,张慧.个性化商品推荐系统的混合推荐算法研究[J].科技资讯,2023,21(22):248-252.DOI:10.16661/j.cnki.1672-3791.2305-5042-4395…
[2]林万芳.面向物联网专业的“Python程序设计”课程教学改革探索[J].物联网技术,2024,14(03):153-155.DOI:10.16667/j.issn.2095-1302.2024.03.039.
[3]胡克富.基于数据挖掘的个性化商品推荐系统的研究与应用[D].江苏科技大学,2023.DOI:10.27171/d.cnki.ghdcc.2023.000234…
[4]陈力.基于Java的会员制商品交易系统的设计与实现[D].浙江工业大学,2019…
[5]陆江伟.基于JAVA的家装APP的开发[D].浙江工业大学,2020.DOI:10.27463/d.cnki.gzgyu.2020.001169…
[6]蔡文乐,秦立静.基于Python爬虫的招聘数据可视化分析[J].物联网技术,2024,14(01):102-105.DOI:10.16667/j.issn.2095-1302.2024.01.028.
[7]王延忻,王宏娟,石玉仁等.Python在结构化学可视化教学中的应用探索[J/OL].大学化学,1-10[2024-03-22].http://kns.cnki.net/kcms/detail/11.1815.O6.20240111.0926.004.html.
[8]宋文杰.大数据环境下基于Python大学生就业指导的数据可视化[J].微型电脑应用,2023,39(12):127-129+134.
[9]邓林.基于Java的农产品销售系统的研究与设计[J].电脑知识与技术,2022,18(12):43-45.DOI:10.14004/j.cnki.ckt.2022.0625…
[10]朱彤.基于多种策略的商品推荐系统研究与实现[D].西北农林科技大学,2021.DOI:10.27409/d.cnki.gxbnu.2021.000937…
[11]王蔷,郭琪.基于Python语言的微博网络数据可视化系统设计与应用[J].电脑编程技巧与维护,2023,(11):101-104.DOI:10.16184/j.cnki.comprg.2023.11.012.
[1]张芙蓉.基于微博热门话题的商品推荐系统[D].华中科技大学,2021.DOI:10.27157/d.cnki.ghzku.2021.005367…
[13]Jingjing Yu, Yan Wang, Isabelle Ragueneau Majlessi. Risk of Enzymeand Transporter-Mediated Drug Interactions With Drugs Approved by the US Food and Drug Administration in 2022: A Detailed Analysis of In Vitro and Clinical Data Available in New Drug Application Reviews.[J]. Clinical therapeutics, 2024,
[14]Huseyin Naci, Yichen Zhang, Steven Woloshin, Xiaodong Guan, Ziyue Xu, Anita K Wagner. Overall survival benefits of cancer drugs initially approved by the US Food and Drug Administration on the basis of immature survival data: a retrospective analysis.[J]. The Lancet. Oncology, 2024,
[15]Zhu Hong, Wu Meng. Data mining and safety analysis of avatrombopag: a retrospective pharmacovigilance study based on the US food and drug administration’s adverse event reporting system[J]. Scientific Reports, 2024, 14 (1):
[16]Li L , Miao Y .Innovation of E-commerce fresh agricultural products marketing based on big internet data platform[J].Revista de la Facultad de Ingenieria, 2020, 32(1):475-486.
[17]Liu Y .Innovation of marketing pattern of fresh agricultural products based on internet + and big data platform[J]. 2021.
[18]Xiaoqing,Bi,Pu,et al.Research on Innovation of E-commerce Logistics Service Based on Big Data[C]//2023.
[19]Gang T ,ZHANGMeng, Yi Z ,et al.Impact of E-commerce Model Innovation of Fresh Agricultural Products on Firm Performance[J].Journal of Agrotechnical Economics, 2021.
[20]Corney D P A .Intelligent Analysis of Small Data Sets for Food Design[J].University College London, 2022.DOI:10.1145/1122935.1122953.
[21]Choudhary S , Chhabra C .Sentiment Analysis of Amazon Food Review Data[C]//International Conference on Computational Intelligence and Communication Technologies.IEEE, 2021.DOI:10.1109/CCICT53244.2021.00033.
[22]Zhu,Jing,Zhong,et al.Grain Promotion and Food Consumption: Analysis of Chinese Provincial Data[J].Applied Economic Perspectives and Policy, 2020.
致 谢
通过设计与实现本电商商品推荐系统,首先,我要向我的导师致以最深的感谢。感谢老师细心的教导,能够学到如此多的专业性知识。系统开发技术要学习的东西很多,前台框架、后台框架、数据结构、操作系统等各种知识非常的丰富,都需要我继续了解学习。其次我要对在本设计中引用的所有文献的作者表示感谢,正是站在前人的肩膀上,我才得以看得更远。虽然篇幅有限,无法一一致谢,但每一份贡献都铭记于心。最后,要感谢我的室友和同学,由于知识掌握得不够产生各种问题,正因为有了你们的帮助,给提出很多很好的建议,才能更好的解决问题。还要感谢我的家人和朋友,是你们的理解、鼓励与默默支持,在这段日子里,是你们的陪伴与关怀,让这段旅程充满温暖。
在这过程中,不仅学习了编程方面的知识,还将理论应用到了实践中。在最初接到商品书的那一刻,感到比较迷茫,没有任何头绪。在经过了老师的指导并调查了一些数据分析和可视化系统的相关资料后,逐渐有了思路,开始入手开题,明确了系统的内容,并对系统进行了可行性分析。确定系统的可行性和功能内容后,按照初步设计的内容进行完善,逐步补充和学习,最终完成了该毕业设计。通过这次毕业设计,深刻体会到了数据分析和推荐系统在电子商务中的重要性。虽然艰辛,但也学习到了很多,动手能力得到了提高,这是书本上无法学到的。
通过这次毕业设计,我不仅加深了对大数据技术的理解与应用,更学会了感恩与回馈。希望自己在未来的道路上能够走得更远,不辜负在大学的学习,以及老师们的细致的教导。