jsoup - strip all formatting and link tags, keep text only

前端 未结 3 1354
太阳男子
太阳男子 2020-12-08 09:40

Let\'s say i have a html fragment like this:

foo bar foobar baz

<
3条回答
  •  不思量自难忘°
    2020-12-08 10:31

    Using Regex: -

    String str = "

    foo bar foobar baz

    "; str = str.replaceAll("<[^>]*>", ""); System.out.println(str);

    OUTPUT: -

      foo   bar  foobar  baz 
    

    Using Jsoup: -

    Document doc = Jsoup.parse(str); 
    String text = doc.text();
    

提交回复
热议问题