对于网站和Web APP来说,相同的类型的产品,响应速度越好,那么用户量就越高。不可否认的是,响应速度是用户黏粘性最好的方式之一,但往往不知道如何下手解决,希望这篇文章可以给予你一些思路
对于网站和Web APP来说最影响网站性能的就是数据库查询了,因为,而查询返回的数据集非常大时还会占据很多内存。这里从django orm的角度来探索数据库查询的优化
网站和Web APP,对于数据的常规处理方式肯定是数据库存储查询,反复从数据库读写数据很耗时间和计算资源。也因此开发者们设计制作出了多个数据库连接方式,其中在Django框架中ORM(语法有哪些?)占很大比重。通过它可以使用filter, exclude, get等方法进行数据库查询,从数据库中查询出来的结果一般是一个集合,这个集合叫就做 QuerySet。QuerySet是惰性的!QuerySet自带缓存!
注:Object Relational Mapping,即对象关系映射,是在pymysq之上又进行了一层封装,对于数据的操作,我们无需再去编写原生sql,取代代之的是基于面向对象的思想去编写类、对象、调用相应的方法等,ORM会将其转换/映射成原生SQL然后交给pymysql执行
# 惰性查询:如果只是书写了orm语句,在后面根本没有用到该语句所查询出来的参数,那么orm会自动识别出来,直接不执行。
# 举例:
res = models.Book.objects.all() # 这时orm是不会走数据库的
print(res) # 只有当要用到的上述orm语句的结果时,才回去数据库查询。
class Student(models.Model):
name = models.CharField(max_length=20)
age = models.IntegerField()
hobbies = models.ManyToManyField(Hobby)
class Hobby(models.Model):
name = models.CharField(max_length=20)
from django.db.models import Max, Min, Avg, Sum, Count
#####################aggregate应用###############################
# 学生平均年龄, 自定义key
Student.objects.aggregate(average_age = Avg('age')) # { 'average_age': 12 }
# 同时获取学生年龄均值, 最大值和最小值, 返回字典
Student.objects.aggregate(Avg('age‘), Max('age‘), Min('age‘))
# { 'age__avg': 12, 'age__max': 18, 'age__min': 6, }
# 根据Hobby反查学生最大年龄。查询字段student和age间有双下划线
Hobby.objects.aggregate(Max('student__age')) # { 'student__age__max': 12 }
#####################annotate应用###############################
# 按学生分组,统计每个学生爱好数量,并自定义key
Student.objects.annotate(hobby_count_by_student=Count('hobbies'))
# 按爱好分组,再统计每组学生最大年龄
Hobby.objects.annotate(Max('student__age'))
#####################annotate&filter应用###############################
# 先按爱好分组,再统计每组学生数量, 然后筛选出学生数量大于1的爱好。
Hobby.objects.annotate(student_num=Count('student')).filter(student_num__gt=1)
# 先按爱好分组,筛选出以'd'开头的爱好,再统计每组学生数量。
Hobby.objects.filter(name__startswith="d").annotate(student_num=Count('student‘))
#####################annotate&order_by应用###############################
# 先按爱好分组,再统计每组学生数量, 然后按每组学生数量大小对爱好排序。
Hobby.objects.annotate(student_num=Count('student‘)).order_by('student_num')
# 统计最受学生欢迎的5个爱好。
Hobby.objects.annotate(student_num=Count('student‘)).order_by('-student_num')[:5]
#####################annotate&values应用###############################
# 按学生名字分组,统计每个学生的爱好数量。
Student.objects.values('name').annotate(Count('hobbies'))
你还可以使用values方法从annotate返回的数据集里提取你所需要的字段,如下所示:
# 按学生名字分组,统计每个学生的爱好数量。
Student.objects.annotate(hobby_count=Count('hobbies')).values('name', 'hobby_count')
假设现在有文章表(Article)、类别表(Category)、标签表(Tag)。它们关系是文章与类别是一对多关系,文章与标签是多对多关系
# 查询类别、标签信息
articles = Article.objects.all()
for article in articles:
print(article.title)
print(article.category.name)
for tag in article.tags.all():
print(tag.name)
# 查询类别
articles = Article.objects.all().select_related('category')
# 获取id=13的文章对象同时,获取其相关category信息
Article.objects.select_related('category').get(id=13)
# 获取id=13的文章对象同时,获取其相关作者名字信息
Article.objects.select_related('author__name').get(id=13)
# 获取id=13的文章对象同时,获取其相关category和相关作者名字信息。下面方法等同
Article.objects.select_related('category', 'author__name').get(id=13)
Article.objects.select_related('category').select_related('author__name').get(id=13)
# 使用select_related()可返回所有相关主键信息,all()非必需
Article.objects.all().select_related()
# 获取Article信息同时获取blog信息,filter方法和selected_related方法顺序不重要
Article.objects.filter(pub_date__gt=timezone.now()).select_related('blog')
Article.objects.select_related('blog').filter(pub_date__gt=timezone.now())
# 查询类别及标签
articles = Article.objects.all().select_related('category').prefecth_related('tags')
# 文章列表及每篇文章的tags对象名字信息
Article.objects.all().prefetch_related('tags__name')
# 获取id=13的文章对象同时,获取其相关tags信息
Article.objects.prefetch_related('tags').get(id=13)
用Prefetch方法可以给prefetch_related方法额外添加额外条件和属性
# 获取文章列表及每篇文章相关的名字以P开头的tags对象信息
Article.objects.all().prefetch_related(
Prefetch('tags', queryset=Tag.objects.filter(name__startswith="P"))
)
# 文章列表及每篇文章的名字以P开头的tags对象信息, 放在article_p_tag列表
Article.objects.all().prefetch_related(
Prefetch('tags', queryset=Tag.objects.filter(name__startswith="P")), to_attr='article_p_tag'
)
例1
article = Article.objects.get(title='文章2')
article.thumb_count += 1
article.save()
例2 使用F()函数
Article.objects.filter(title='文章1').update(thumb_count=F('thumb_count')+1)
# 很明显使用F()函数的执行效率会更高,只需要一条sql完全的数据库操作,而例1则需要先查询,缓存,然后再更新
# 例1的方法是存在竞态条件的,如第一个线程完成取值、更新值、保存新值,而第二个线程操作还是使用就的值来进行操作,使用F()函数的话,因为是数据库层面的原子操作,第二个线程再来取值那也是取到更新后的值了
# 同一数据不同字段比较
article = Article.objects.filter(thumb_count__gt=F('view_count'))
# 两个操作数都是常数和F()函数的加、减、乘、除、取模、幂计算等算术操作
article = Article.objects.filter(view_count__gt=F('thumb_count') * 2)
# 配合annotate使用
article = Article.objects.annotate(all_count=F('view_count') + F('thumb_count'))
合适的索引可以加快数据的检索速度。无论是在Django还是在原生SQL查询上都支持检查某条语句是否有用到索引,语法为explain
# 统计一个查询所消耗的执行时间,更好地优化查询结果
Blog.objects.filter(title='My Blog').explain(verbose=True)
explain select * from user where user_no ='00022139'
注:Django也支持原生SQL语法:raw
from django.db import connection
with connection.cursor() as cursor:
cursor.execute('select * from user')
data = cursor.fetchall()