关于网页正则问题

雨燕双飞 提交于 2019-11-29 13:34:14

爬网页的时候出现[] 的补充吧

一般情况就是把两个位置的关键字全部都复制下来对比
先看这种比较难的:

href=“http://product.dangdang.com/27911609.html” target="_blank">春日序曲(《请以你的名字呼唤我》第90届奥斯卡获奖影片原著作者全新
href=“http://product.dangdang.com/27916585.html” target="_blank">我们都曾受过伤,却有了更好的人生

由于里面的文字是我们要的爬的内容,所以先不看先弄成这样:

href=“http://product.dangdang.com/27911609.html” target="_blank">(.?)
href=“http://product.dangdang.com/27916585.html” target="_blank">(.
?)
现在应该很明显了吧,就只是那串数字不一样

所以继续用正则啦。。。
href="http://product.dangdang.com/..html" target="_blank">(.?)
将数字变成 正则 .*就好了嘛

再看一个简单的:
没有找到例子就简单说明一下把,就是这样的:

<里面是一些网页的关键字> 名字 <里面是一些网页的关键字>

只需要把里面的名字用正则替换就好了

<里面是一些网页的关键字> (.*?) <里面是一些网页的关键字>

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!