正则表达式匹配多行文本

今天做爬虫项目要用正则表达式匹配,以前没学过正则表达式,发现正则表达式功能真的是很强大,就用了几个简单的匹配的方式就完成了解析了一个html页面的信息。但是如何匹配多行文本?我首先想到的是用\s*匹配空字符(回车、换行、水平制表符等),然后用.*匹配所以非空字符,发现这样只能够一个段落一个段落的匹配,很不方便。想了一晚上没有想出来,最后搜索到可以开启多行模式(?s),就不要担心这些空格换行了


                                      《2001太空漫游》后9年,前国家航天委员会主任弗洛伊德博士(罗伊•谢德 Roy Scheider 饰)接受苏美合作计划,带领发现号航天站设计者科脑博士(约翰•利思戈 John Lithgow 饰)和HAL9000电脑的创始人钱德拉博士(鲍勃•巴拉班 Bob Balaban 饰)登录木星附近的苏联航空站,与苏联宇航员卡布珂(海伦•米伦 Helen Mirren 饰)等合作,空中接轨美国发现号航天站,调查九年前的事故原因,探索木卫二的神秘黑石,并查明宇航员大卫•伯曼(凯尔•杜拉 Keir Dullea 饰)缘何神秘失踪。然而任务执行尚未过半,美苏关系愈发紧张,战争一触即发;与此同时,大卫•伯曼竟突然现身对弗洛伊德博士发出神秘警告。
                                        
  本片改编自亚瑟•克拉克的小说《2010太空漫游》,获第59界奥斯卡最佳艺术指导—布景,最佳服装设计,最佳视觉效果,最佳化妆...

正则表达式:(?s)(.*?)

你可能感兴趣的:(正则表达式)