Maven:

    <dependency>
        <groupId>org.jsoup</groupId>
        <artifactId>jsoup</artifactId>
        <version>1.10.2</version>
    </dependency>

获取网页内容、加载为Document对象

 Document doc = Jsoup.connect(String url).get();
 Document doc = Jsoup.parse(Strng url);
 Document doc = Jsoup.parse(String htmlSource);
<div id="main">
    <a id="title" name="title" class="large">
        Jsoup操作Document对象
    </a>
</div>

查找元素

getElementById(String id)

Element element = doc.getElementById("title");

element为 
<a id="title" name="title" class="large">
    Jsoup操作Document对象
</a>

getElementsByTag(String tag)
getElementsByClass(String className)
getElementsByAttribute(String key)

元素数据

attr(String key) 获取属性

element.attr("class")为large

attributes() 获取所有属性
id(),className(),tag()
text()文本内容
html()元素内HTML
outerHtml()元素外HTML

使用语法选择器查找元素

使用类似jQuery的语法查找和选择元素

Element.select(String selector);

selector可以是tagname,#id,.class,attribute,[attr=value],[attr^=value],attr~=regex,以上内容组合使用el#id,伪选择器:eq(n)

更多语法可以查看Selector APIJsoup官网

标签: jsoup

添加新评论