Django系列 4:ORM之select_related方法

参考1:ForeignKey,ManyToManyField和OneToOneField的辨析

参考2:Django文档—Model中的ForeignKey、ManyToManyField、OneToOneField 

参考3:Django之Model操作之select_related的应用

class Province(models.Model):

            name = models.CharField(max_length=10)

            def __unicode__(self):

                        return self.name

            def __str__(self):

                        return self.name


class City(models.Model):

            name = models.CharField(max_length=5)

            province = models.ForeignKey(Province, null=True, blank=True, on_delete=models.CASCADE)

            def __unicode__(self):

                        return self.name

class Order(models.Model):

            customer = models.ForeignKey("Person", on_delete=models.CASCADE)

            orderinfo = models.CharField(max_length=50)

            time = models.DateTimeField(auto_now_add=True)

            def __unicode__(self):

                        return self.orderinfo

class Person(models.Model):

            firstname = models.CharField(max_length=10)

            lastname = models.CharField(max_length=10)

            needs = models.ForeignKey(to=Order, related_name='require', null=True, blank=True, on_delete=models.DO_NOTHING)

            visitation = models.ManyToManyField(City, related_name="visitor", null=True, blank=True)

            hometown = models.ForeignKey(City, related_name="birth", on_delete=models.CASCADE)

            living = models.ForeignKey(City, related_name="citizen", on_delete=models.CASCADE)

            def __unicode__(self):

                        return self.firstname +self.lastname


对 select_related 的操作,主要针对以上model来进行说明:

常用

model.tb.objects.all().select_related('外键字段')

model.tb.objects.all().select_related('外键字段__外键字段')

概念

对于一对一字段(OneToOneField)和外键字段(ForeignKey,多对一),可以使用select_related 来对QuerySet进行优化

在对QuerySet使用select_related()函数后,Django会获取相应外键对应的对象,从而在之后需要的时候不必再查询数据库了

city_objs = City.objects.all()

for cin city_objs:

            print(c.province)

这样会导致线性的SQL查询,如果对象数量n太多,每个对象中有k个外键字段的话,就会导致n*k+1次SQL查询。在本例中,因为假设有30个city对象就导致了30 + 1 次SQL查询

以下是部分sql日志

[2021-11-06 12:05:00,383] [utils.py:123] [utils:debug_sql] DEBUG (0.000) SELECT `orm_practice_city`.`id`, `orm_practice_city`.`name`, `orm_practice_city`.`province_id` FROM `orm_practice_city`; args=()

[2021-11-06 12:05:00,384] [utils.py:123] [utils:debug_sql] DEBUG (0.000) SELECT `orm_practice_province`.`id`, `orm_practice_province`.`name` FROM `orm_practice_province` WHERE `orm_practice_province`.`id` = 11 LIMIT 21; args=(11,)

[2021-11-06 12:05:00,385] [utils.py:123] [utils:debug_sql] DEBUG (0.000) SELECT `orm_practice_province`.`id`, `orm_practice_province`.`name` FROM `orm_practice_province` WHERE `orm_practice_province`.`id` = 12 LIMIT 21; args=(12,)

[2021-11-06 12:05:00,386] [utils.py:123] [utils:debug_sql] DEBUG (0.000) SELECT `orm_practice_province`.`id`, `orm_practice_province`.`name` FROM `orm_practice_province` WHERE `orm_practice_province`.`id` = 13 LIMIT 21; args=(13,)

[2021-11-06 12:05:00,387] [utils.py:123] [utils:debug_sql] DEBUG (0.000) SELECT `orm_practice_province`.`id`, `orm_practice_province`.`name` FROM `orm_practice_province` WHERE `orm_practice_province`.`id` = 14 LIMIT 21; args=(14,)

[2021-11-06 12:05:00,387] [utils.py:123] [utils:debug_sql] DEBUG (0.000) SELECT `orm_practice_province`.`id`, `orm_practice_province`.`name` FROM `orm_practice_province` WHERE `orm_practice_province`.`id` = 15 LIMIT 21; args=(15,)

[2021-11-06 12:05:00,388] [utils.py:123] [utils:debug_sql] DEBUG (0.000) SELECT `orm_practice_province`.`id`, `orm_practice_province`.`name` FROM `orm_practice_province` WHERE `orm_practice_province`.`id` = 16 LIMIT 21; args=(16,)


现在如果我们使用select_related()函数:

city_objs = City.objects.select_related("province").all()

for cin city_objs:

            print(c.province)

就只有一次SQL查询,显然大大减少了SQL查询的次数,看到他做了了inner  join,把foreign key的表连接过来

[2021-11-06 12:12:39,386] [utils.py:123] [utils:debug_sql] DEBUG (0.000) SELECT `orm_practice_city`.`id`, `orm_practice_city`.`name`, `orm_practice_city`.`province_id`, `orm_practice_province`.`id`, `orm_practice_province`.`name` FROM `orm_practice_city` LEFT OUTER JOIN `orm_practice_province` ON (`orm_practice_city`.`province_id` = `orm_practice_province`.`id`); args=()

再比如:

zhu = Person.objects.select_related("living__province").get(id=10)

print(zhu.living.province)

[2021-11-06 12:15:22,440] [utils.py:123] [utils:debug_sql] DEBUG (0.000) SELECT `orm_practice_person`.`id`, `orm_practice_person`.`firstname`, `orm_practice_person`.`lastname`, `orm_practice_person`.`needs_id`, `orm_practice_person`.`hometown_id`, `orm_practice_person`.`living_id`, `orm_practice_city`.`id`, `orm_practice_city`.`name`, `orm_practice_city`.`province_id`, `orm_practice_province`.`id`, `orm_practice_province`.`name` FROM `orm_practice_person` INNER JOIN `orm_practice_city` ON (`orm_practice_person`.`living_id` = `orm_practice_city`.`id`) LEFT OUTER JOIN `orm_practice_province` ON (`orm_practice_city`.`province_id` = `orm_practice_province`.`id`) WHERE `orm_practice_person`.`id` = 10 LIMIT 21; args=(10,)

这样查询 living做关联的时候就不用再查询一次了;可以看到,Django使用了2次 INNER JOIN 来完成请求,获得了city表和province表的内容并添加到结果表的相应列,这样在调用zhu .living的时候也不必再次进行SQL查询。


select_related() 支持三种方法:

1:指定 *fields 参数

这个参数是需要获取的外键(父表内容)的字段名,用来关联外键的字段名,比如:

   - 有外键的外键。 比如这里的  

 zhu = Person.objects.select_related('living__province').get(firstname="zhu")

 zhu = Person.objects.select_related('living__province').get(firstname="zhu")

 zhu.living.province // 没有产生其他sql

然而,未指定的外键则不会被添加到结果中,就会产生一条查询sql

 zhu.hometown.province

(0.000) SELECT "select_related_province"."id", "select_related_province"."name" FROM "select_related_

   - 有多个外键时需要指定到哪个外键做关联(默认全部都关联)

 zhu = Person.objects.select_related('living__province', 'hometown__province').all()  

或者

 zhu = Person.objects.select_related('living__province').select_related('hometown__province').all()

2 :指定 depth 参数 (已废弃了)

    select_related() 接受depth参数,depth参数可以确定select_related的深度。Django会递归遍历指定深度内的所有的OneToOneField和ForeignKey

3 :不指定参数

select_related() 也可以不加参数,这样表示要求Django尽可能深的select_related

Django本身内置一个上限,对于特别复杂的表关系,Django可能在你不知道的某处跳出递归,从而与你想的做法不一样。具体限制是怎么工作的我表示不清楚。

Django并不知道你实际要用的字段有哪些,所以会把所有的字段都抓进来,从而会造成不必要的浪费而影响性能。

注意: 由于Person的外键字段needs与Order的外键字段customer是相互引用情况,在不给定具体参数时,默认不会join (已测)

[2021-11-06 12:29:35,365] [utils.py:123] [utils:debug_sql] DEBUG (0.000) SELECT `orm_practice_person`.`id`, `orm_practice_person`.`firstname`, `orm_practice_person`.`lastname`, `orm_practice_person`.`needs_id`, `orm_practice_person`.`hometown_id`, `orm_practice_person`.`living_id`, `orm_practice_city`.`id`, `orm_practice_city`.`name`, `orm_practice_city`.`province_id`, T3.`id`, T3.`name`, T3.`province_id` FROM `orm_practice_person` INNER JOIN `orm_practice_city` ON (`orm_practice_person`.`hometown_id` = `orm_practice_city`.`id`) INNER JOIN `orm_practice_city` T3 ON (`orm_practice_person`.`living_id` = T3.`id`) WHERE `orm_practice_person`.`id` = 10 LIMIT 21; args=(10,)

小结

1: select_related主要针一对一多对一(外键)关系进行优化。

2: select_related使用SQL的JOIN语句进行优化,通过减少SQL查询的次数来进行优化、提高性能。

3 :可以通过可变长参数指定需要select_related的字段名。也可以通过使用双下划线“__”连接字段名来实现指定的递归查询。没有指定的字段不会缓存,没有指定的深度不会缓存,如果要访问的话Django会再次进行SQL查询。

4 :也接受无参数的调用,Django会尽可能深的递归查询所有的字段。但注意有Django递归的限制和性能的浪

你可能感兴趣的:(Django系列 4:ORM之select_related方法)