Beautiful soup的使用方法

為{幸葍}努か 提交于 2019-12-27 20:24:47

如何使用

  • 将一段文档传入BeautifulSoup 的构造方法,就能得到一个文档的对象, 可以传入一段字符串或一个文件句柄.
    •   from bs4 import BeautifulSoup
        soup = BeautifulSoup(open("index.html"))
        soup = BeautifulSoup("<html>data</html>")
      
    • 首先,文档被转换成Unicode,并且HTML的实例都被转换成Unicode编码
      •    	BeautifulSoup("Sacr&eacute; bleu!")
           	<html><head></head><body>Sacré bleu!</body></html>
        
    • 然后,Beautiful Soup选择最合适的解析器来解析这段文档,如果手动指定解析器那么Beautiful Soup会选择指定的解析器来解析文档.(参考 解析成XML ).
标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!