为了巩固所学的知识,作者尝试着开始发布一些学习笔记类的博客,方便日后回顾。当然,如果能帮到一些萌新进行新技术的学习那也是极好的。作者菜菜一枚,文章中如果有记录错误,欢迎读者朋友们批评指正。
(博客的参考源码可以在我主页的资源里找到,如果在学习的过程中有什么疑问欢迎大家在评论区向我提出)
前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。【宝藏入口】。
一、版面集合: catalogues
主键id(数据类型为整形)
关键字:keywords(数据类型为字符串)
isFuzzy: 0
搜索位置:searchArea(数据类型为字符串)
时间筛选:year(数据类型为时间类)
类型:form(数据类型为字符串)
领域:type(数据类型为字符串)
第几页:page(数据类型为整型)
来源:origin(数据类型为字符串)
source: 2
更新时间:updateTime(数据类型为时间类)
二、内容 cards
主键:id (数据类型为整形)
标题:title
来源: origin
原始网页html dom结构:htmlcontent
清洗后的html dom结构:content
第几页:page(数据类型为字符串)
搜索位置:searchArea(数据类型为字符串)
时间筛选:year(数据类型为时间类)
类型:form(数据类型为字符串)
领域:type(数据类型为字符串)
地址:url(数据类型为字符串)
内容图片存储的位置:illustrations(数据类型为数组)
更新时间:updateTime(数据类型为时间类)
为了生成 MongoDB 数据库,你首先需要安装 MongoDB 数据库服务器,并确保你的 Python 环境中安装了 PyMongo,这是 MongoDB 官方提供的 Python 驱动程序。
接下来,你可以按照以下步骤创建一个 Python 脚本来实现数据库的创建和数据插入:
1.安装 MongoDB:在你的机器上安装 MongoDB 数据库服务器。你可以从 MongoDB 官方网站下载安装程序并按照说明进行安装。
’
2.安装 PyMongo:在你的 Python 环境中安装 PyMongo 包。你可以通过 pip 进行安装:
pip install pymongo
3.编写 Python 脚本:编写一个 Python 脚本来连接 MongoDB,并创建两个集合(catalogues 和 cards),然后将数据插入这两个集合。
下面是一个示例 Python 脚本:
from datetime import datetime
from pymongo import MongoClient
# 连接 MongoDB 数据库服务器
client = MongoClient('mongodb://localhost:27017/')
# 创建或选择数据库
db = client['my_database']
# 创建或选择集合
catalogues_collection = db['catalogues']
cards_collection = db['cards']
# 插入示例数据到 catalogues 集合
catalogue_data = {
'id': 1,
'keywords': 'example keyword',
'isFuzzy': '0',
'searchArea': 'example search area',
'year': datetime(2023, 1, 1),
'form': 'example form',
'type': 'example type',
'page': 1,
'origin': 'example origin',
'source': 2,
'updateTime': datetime.now()
}
catalogues_collection.insert_one(catalogue_data)
# 插入示例数据到 cards 集合
card_data = {
'id': 1,
'title': 'Example Title',
'origin': 'example origin',
'htmlcontent': '<html>Example HTML content</html>',
'content': 'Example content',
'page': 'example page',
'searchArea': 'example search area',
'year': datetime(2023, 1, 1),
'form': 'example form',
'type': 'example type',
'url': 'example url',
'illustrations': ['illustration1.jpg', 'illustration2.jpg'],
'updateTime': datetime.now()
}
cards_collection.insert_one(card_data)
# 输出成功信息
print("Data inserted successfully into MongoDB.")
请注意,这只是一个示例脚本,用于演示如何连接 MongoDB 并将数据插入数据库中。在实际应用中,你可能需要根据你的需求来调整代码和数据结构。
要修改 MongoDB 中集合(Collection)的结构,你需要执行以下步骤:
1.连接到 MongoDB 数据库:首先,使用 Python 的 PyMongo 模块或 MongoDB 的客户端工具连接到你的 MongoDB 数据库。
2.备份数据:在修改集合结构之前,强烈建议对数据进行备份,以防止意外数据丢失。
3.修改集合结构:根据你的需求,修改集合结构可能涉及添加、删除或修改字段,或者重命名集合。下面是一些常见的操作:
-添加字段:可以通过更新现有文档或添加新文档的方式来添加字段。
-删除字段:使用 $unset 操作符从现有文档中删除字段。
-修改字段:可以使用 $set 操作符来修改现有文档中的字段值。
-重命名集合:使用 rename_collection() 方法重命名集合。
-验证修改:在修改集合结构后,验证修改是否正确。你可以查询集合以确保修改已成功应用,并且数据仍然可用和完整。
-更新应用程序代码:如果修改了集合结构,确保更新你的应用程序代码以反映这些更改。
以下是一个使用 PyMongo 修改 MongoDB 集合结构的示例代码:
from pymongo import MongoClient
# 连接到 MongoDB
client = MongoClient('mongodb://localhost:27017/')
db = client['my_database']
# 获取要修改的集合
collection = db['my_collection']
# 添加新字段到文档
collection.update_many({}, {"$set": {"new_field": "default_value"}})
# 删除字段
collection.update_many({}, {"$unset": {"old_field": 1}})
# 重命名集合
db.rename_collection('old_collection', 'new_collection')
# 验证修改
for doc in collection.find():
print(doc)
# 关闭连接
client.close()
在这个示例中,我们假设已经连接到了名为 my_database 的数据库,并且要修改其中名为 my_collection 的集合。我们添加了一个名为 new_field 的新字段,删除了名为 old_field 的旧字段,并将集合重命名为 new_collection。最后,我们验证了修改是否成功,并关闭了数据库连接。