Django项目优化数据库操作总结

参考网址:Django官方数据库优化

使用 QuerySet.explain() 来了解你的数据库是如何执行特定的 QuerySet 的。

你可能还想使用一个外部项目,比如 django-debug-toolbar ,或者一个直接监控数据库的工具。

合理的创建索引

索引可能有助于加快查询速度,但是也要注意索引会占用磁盘空间,创建不必要的索引只会形成浪费。数据库表中的主键、外键、唯一键默认会创建索引。
那么哪些字段需要创建索引呢?这是一个好的且令人疑惑的问题,下面列出的几条可以作为参照意见:

  • 频繁出现在WHERE条件子句的字段(也就是Django里filter筛选的字段)
  • 经常被用来分组(group by)或者排序(order by)的字段
  • 在经常存取的多个列上创建复合索引,但要注意复合索引的顺序要按照使用的频度来决定
class ModelName(models.Model):
	# 字段添加索引使用db_index
	name = models.CharField(db_index=True, max_length=100)
	class Meta:
		# 联合唯一索引使用index_together
		index_together = ('字段1', '字段2')

设置数据库持久连接

减少SQL的执行次数

多次访问数据库比单次查询所有内容的效率低。因此理解并学会使用 select_related() 和 prefetch_related() 。

select_related():创建一个 SQL 连接,并在 SELECT 语句中包含相关对象的字段。一般用于一对多(ForeignKey)和一对一(OneToOneField)关系

# 标准查询
# Hits the database.
e = Entry.objects.get(id=5)
# Hits the database again to get the related Blog object.
b = e.blog
# select_related 查询
# Hits the database.
e = Entry.objects.select_related('blog').get(id=5)
# Doesn't hit the database, because e.blog has been prepopulated
# in the previous query.
b = e.blog

prefetch_related(): 一般用于多对一(GenericForeignKey)和多对多(ManyToManyField)关系

from django.db import models
class Topping(models.Model):
    name = models.CharField(max_length=30)
class Pizza(models.Model):
    name = models.CharField(max_length=50)
    toppings = models.ManyToManyField(Topping)
    def __str__(self):
        return "%s (%s)" % (
            self.name,
            ", ".join(topping.name for topping in self.toppings.all()),
        )
# Good
pizza.objects.all().prefetch_related('toppings')


仅获取需要的字段数据

使用 QuerySet.values() 和 values_list()

使用 QuerySet.defer() 和 only()

使用 QuerySet.count()

使用 QuerySet.exists()

请不要过度使用 count() 和 exists()

使用批量创建、更新和删除,不随意对结果排序

批量创建: 当创建对象时,尽可能使用 bulk_create() 方法来减少 SQL 查询数量。比如:

# Good
Entry.objects.bulk_create([
    Entry(headline='This is a test'),
    Entry(headline='This is only a test'),
])
# Bad
Entry.objects.create(headline='This is a test')
Entry.objects.create(headline='This is only a test')

批量更新: 当更新对象时,尽可能使用 bulk_update() 方法来减少 SQL 查询数。给定对象的列表或查询集:

# Good
entries[0].headline = 'This is not a test'
entries[1].headline = 'This is no longer a test'
Entry.objects.bulk_update(entries, ['headline'])
# Bad
entries[0].headline = 'This is not a test'
entries[0].save()
entries[1].headline = 'This is no longer a test'
entries[1].save()

批量插入: 当插入对象到 ManyToManyFields 时,使用带有多个对象的 add() 来减少 SQL 查询的数量。

举例:

# Good
my_band.members.add(me, my_friend)
# Bad
my_band.members.add(me)
my_band.members.add(my_friend)
# Good
PizzaToppingRelationship = Pizza.toppings.through
PizzaToppingRelationship.objects.bulk_create([
    PizzaToppingRelationship(pizza=my_pizza, topping=pepperoni),
    PizzaToppingRelationship(pizza=your_pizza, topping=pepperoni),
    PizzaToppingRelationship(pizza=your_pizza, topping=mushroom),
], ignore_conflicts=True)
# Bad
my_pizza.toppings.add(pepperoni)
your_pizza.toppings.add(pepperoni, mushroom)

批量删除: 当从 ManyToManyFields 删除对象时,可以使用带有多个对象的 remove() 来减少 SQL 查询的数量。

比如:

# Good
my_band.members.remove(me, my_friend)
# Bad
my_band.members.remove(me)
my_band.members.remove(my_friend)
# Good
from django.db.models import Q
PizzaToppingRelationship = Pizza.toppings.through
PizzaToppingRelationship.objects.filter(
    Q(pizza=my_pizza, topping=pepperoni) |
    Q(pizza=your_pizza, topping=pepperoni) |
    Q(pizza=your_pizza, topping=mushroom)
).delete()
# Bad
my_pizza.toppings.remove(pepperoni)
your_pizza.toppings.remove(pepperoni, mushroom)

以上就是Django项目优化数据库操作总结的详细内容,更多关于Django项目优化数据库的资料请关注脚本之家其它相关文章!

你可能感兴趣的:(Django项目优化数据库操作总结)