jsoup - strip all formatting and link tags, keep text only

前端 未结 3 1353
太阳男子
太阳男子 2020-12-08 09:40

Let\'s say i have a html fragment like this:

foo bar foobar baz

<
3条回答
  •  小蘑菇
    小蘑菇 (楼主)
    2020-12-08 10:13

    With Jsoup:

    final String html = "

    foo bar foobar baz

    "; Document doc = Jsoup.parse(html); System.out.println(doc.text());

    Output:

    foo bar foobar baz
    

    If you want only the text of p-tag, use this instead of doc.text():

    doc.select("p").text();
    

    ... or only body:

    doc.body().text();
    

    Linebreak:

    final String html = "

    Tarthatatlan biztonsági viszonyok

    " + "

    Tarthatatlan biztonsági viszonyok

    "; Document doc = Jsoup.parse(html); for( Element element : doc.select("p") ) { System.out.println(element.text()); // eg. you can use a StringBuilder and append lines here ... }

    Output:

    Tarthatatlan biztonsági viszonyok  
    Tarthatatlan biztonsági viszonyok
    

提交回复
热议问题