scrapy取不规则结构

工商管理
市场营销
财务管理
人力资源管理
电子商务

今天爬页面的时候遇到这种结构的,要求把每一个分开,最开始直接用text()发现取出来的在一起,不能分开。
于是采用了一种折中的方法:用正则

';'.join((''.join(tr.xpath('td[5]').re('(.*?)'))).split('
'))

有更好的方法,欢迎大家评论讨论

你可能感兴趣的:(scrapy取不规则结构)