看了下,有很多parser,没有一个个看,下了个http://sourceforge.net/projects/htmlparser/files/
节点解析是用遍历方式的,或者遍历时加个filter
public static void printNode(NodeList nodelist) {
for (int i = 0; nodelist != null && i < nodelist.size(); i++) {
Node node = nodelist.elementAt(i);
System.out.print(node.getText());
printNode(node.getChildren());
}
}
public static void main(String[] args) {
try {
Parser parser = new Parser(url);
NodeList nodelist = parser.parse(null);
//printNode(nodelist);
NodeFilter filter = new TagNameFilter("tr");
NodeList list = nodelist.extractAllNodesThatMatch(filter, true);
printNode(list);
} catch (ParserException e) {
e.printStackTrace();
}
}
加入html中有
...
<div id=xxx>
...
</div>
...
在js中,有getElementById(xxx)马上就能找到此div,但是java里貌似没有此现成的方法,难不成要一个个遍历,然后加if--then--else,那太累了。
http://www.open-open.com/30.htm 里面还有其他的parser,没一个个看
大家说说你们经历。
分享到:
相关推荐
java解析网页,可以根据标签的路径获取网页的内容 比如html/body/div/div/
NULL 博文链接:https://wangtianhui.iteye.com/blog/2023988
java解析html抓取网站数据采集网站信息
用于解析html的java开源工具,很有用
纯Java写的html解析类,解析为自上而下顺序解析。解析效率一般,不支持js,可以满足日常使用。
用于java解析获取到的document的各个节点,可以根据标签的各种属性确定标签
Java中解析html的开源项目04部分 bin
NULL 博文链接:https://rensanning.iteye.com/blog/1551831
java的 html解析工具,使用时直接将包添加到工程即可
如何在Java程序中利用正则表达式实现对字符串的解析.另外,HTMLParser是一款很强大的对HTML网页进行解析的工具,其中大量地用到正则表达式.
Java解析html的实用工具jsoup和它一个简单的例子,方便使用jsoup进行html的解析
jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。
jsoup Java HTML解析器 jsoup Java HTML解析器 jsoup Java HTML解析器 jsoup Java HTML解析器 jsoup Java HTML解析器
java 解析 chm 文件 生成 html 解析 chm 文件
java解析html.采集网站专用。有用的可以下载
java实现对html解析,实现通过id,class等tag进行解析。
使用java编程来解析HTML文档,使大家更容易了解怎么用Java编程去解析HTML文档
js html java servlet 前台接收base64数据后台转图片保存上传 全套代码 直接可以用
用于实现html转图片,包含html2image-0.9.jar , html2image-0.9-javadoc.jar ,html2image-0.9-sources.jar
java_HttpClient学习,和解析htmljava_HttpClient学习,和解析html java_HttpClient学习,和解析htmljava_HttpClient学习,和解析html java_HttpClient学习,和解析htmljava_HttpClient学习,和解析html java_...