
类型: 游戏辅助工具 版本: V10.8
大小: 494.0 时间: 2025-11-21





写一个测试用的html文件:html-clean-demo.html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd " >
< html xmlns = "http://www.w3.org/1999/xhtml " xml:lang = "zh-CN" dir = "ltr" >
< head >
< meta http-equiv = "Content-Type" content = "text/html; charset=GBK" />
< meta http-equiv = "Content-Language" content = "zh-CN" />
< title > html clean demo </ title >
</ head >
< body >
< div class = "d_1" >
< ul >
< li > bar </ li >
< li > foo </ li >
< li > gzz </ li >
</ ul >
</ div >
< div >
< ul >
< li > < a name = "my_href" href = "1.html" > text-1 </ a > </ li >
< li > < a name = "my_href" href = "2.html" > text-2 </ a > </ li >
< li > < a name = "my_href" href = "3.html" > text-3 </ a > </ li >
< li > < a name = "my_href" href = "4.html" > text-4 </ a > </ li >
</ ul >
</ div >
</ body >
</ html >
Html代码
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="zh-CN" dir="ltr">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=GBK"/>
<meta http-equiv="Content-Language" content="zh-CN"/>
<title>html clean demo</title>
</head>
<body>
<div class="d_1">
<ul>
<li>bar</li>
<li>foo</li>
<li>gzz</li>
</ul>
</div>
<div>
<ul>
<li><a name="my_href" href="1.html">text-1</a></li>
<li><a name="my_href" href="2.html">text-2</a></li>
<li><a name="my_href" href="3.html">text-3</a></li>
<li><a name="my_href" href="4.html">text-4</a></li>
</ul>
</div>
</body>
</html>
模拟需求:取出title,name="my_href"的链接,div的class="d_1"下的所有li内容。下面用htmlcleaner写代码,HtmlCleanerDemo.java
package com.chenlb;
import java.io.File;
import org.htmlcleaner.HtmlCleaner;
import org.htmlcleaner.TagNode;
/**
* htmlcleaner 使用示例.
*
* @author chenlb 2008-11-26 下午02:12:02
*/
public class HtmlCleanerDemo {
public static void main(String[] args) throws Exception {
HtmlCleaner cleaner = new HtmlCleaner();
TagNode node = cleaner.clean(new File( "html/html-clean-demo.html" ), "GBK" );
//按tag取.
Object[] ns = node.getElementsByName("title" , true ); //标题
if (ns.length > 0 ) {
System.out.println("title=" +((TagNode)ns[ 0 ]).getText());
}
System.out.println("ul/li:" );
//按xpath取
ns = node.evaluateXPath("//div[@class='d_1']//li" );
for (Object on : ns) {
TagNode n = (TagNode) on;
System.out.println(" text=" +n.getText());
}
System.out.println("a:" );
//按属性值取
ns = node.getElementsByAttValue("name" , "my_href" , true , true );
for (Object on : ns) {
TagNode n = (TagNode) on;
System.out.println(" href=" +n.getAttributeByName( "href" )+ ", text=" +n.getText());
}
}
}
Java代码
package com.chenlb;
import java.io.File;
import org.htmlcleaner.HtmlCleaner;
import org.htmlcleaner.TagNode;
/**
* htmlcleaner 使用示例.
*
* @author chenlb 2008-11-26 下午02:12:02
*/
public class HtmlCleanerDemo {
public static void main(String[] args) throws Exception {
HtmlCleaner cleaner = new HtmlCleaner();
TagNode node = cleaner.clean(new File("html/html-clean-demo.html"), "GBK");
//按tag取.
Object[] ns = node.getElementsByName("title", true); //标题
if(ns.length > 0) {
System.out.println("title="+((TagNode)ns[0]).getText());
}
System.out.println("ul/li:");
//按xpath取
ns = node.evaluateXPath("//div[@class='d_1']//li");
for(Object on : ns) {
TagNode n = (TagNode) on;
System.out.println(" text="+n.getText());
}
System.out.println("a:");
//按属性值取
ns = node.getElementsByAttValue("name", "my_href", true, true);
for(Object on : ns) {
TagNode n = (TagNode) on;
System.out.println(" href="+n.getAttributeByName("href")+", text="+n.getText());
}
}
}
cleaner.clean()中的参数,可以是文件,可以是url,可以是字符串内容。个人认为:比较常用的应该是evaluateXPath、getElementsByAttValue、getElementsByName方法了。另外说明下,htmlcleaner对不规范的html兼容性比较好。
它被设计的小,快速,灵活而且独立。HtmlCleaner也可用在Java代码中,当命令行工具或Ant任务。解析后编程轻量级文档对象,能够很容易的被转换到DOM或者JDom标准文档,或者通过各种方式(压缩,打印)连续输出XML。激光雕刻摆地摊挣钱吗
1.HtmlCleaner的文档对象模型拥有了一些函数,处理节点和属性,所以在序列化之前搜索或者编辑是非常容易的。
2.提供基本HtmlCleanerDOM的XPath支持
3.使用XML配置文件让创建定制tag变得更加容易
4.修复多个bug以及API改进
HtmlCleaner是一个免费开源的适用范围广的Java语言Html文档解析器,它能重新整理HTML文档的每个元素并生成结构良好(Well-Formed)的HTML文档。默认它遵循的规则是类似于大部份web浏览器为创文档对象模型所使用的规则,户可以提供自定义tag和规则组来进行过滤和匹配。
斗地主赚钱网站源码
1,493.4M
翡翠交易软件,闲翠app专注二手玉石翡翠,有专业鉴定师在线鉴定,自由贸易,自由定价珠宝,官方验货不用担心自己买到的商品不放心。闲翠商城介绍闲翠有中国检验认证的翡...
蜀都棋牌游戏
1,711.6M
暗世天歌是一款古色古香的角色扮演手游,主打暗黑风格,以格斗对战为主要玩法,专业级3D引擎打造,原汁原味还原真实地还原了江湖上的血雨腥风和快意恩仇。游戏呈现出这个...
聊城手赚骗局
27.8M
食尸鬼游戏,一款恐怖氛围浓厚的游戏,玩家在游戏中将扮演一个小偷,前往一个旅店偷取客户所需要的档案袋,随之而来发生的一些列事情。食尸鬼游戏简介到墓地中寻找有没有被...
医院职工企业兼职
847.5M
Edgecam2016有着更加强大的性能,更高的效率,为你节省更多的时间。2016版本操作更简单,提高了精度和表面光洁度的质量,它同时处理所有五轴加工,和驱动其...
什么兼职可以自己单干
242.9M
这是昆明本地的一个口罩预约平台,完全免费使用,帮助广大用户在线预约口罩,实名进行登记,每日都可以预约购买口罩。软件简介1、一个完全免费的口罩预约平台,在线登记;...
跑付通过什么赚钱
265.9M
宝宝趣味数学是一款专为儿童设计的学习数学的小游戏,家长下载这个软件以后可以在上面通过趣味加法,趣味减法,数字乐园,快乐拼图等等玩法锻炼孩子的数学能力。软件介绍宝...
芬兰语兼职
962.1M
桔子手电筒是一款功能强大的工具软件,界面简洁,功能强大,点击就可以打开超级手电筒,先进的算法保证可以在超亮的亮度下长时间使用,减少电池耗电,同时支持自定义手电筒...
赚钱代理项目
1,580.9M
圣耀永恒游戏,一款魔幻厮杀类的rpg游戏,以北欧神话世界为背景,游戏具有丰富的推图式副本等着你来闯关,解锁霸气无敌的魔法绝技,让你随时随地历练升级。圣耀永恒手游...
2020年最火爆微信赚钱方法
291.3M
月靓妈妈app是一款专为孕妈打造的服务APP,为孕妈提供专业的孕期营养指导、孕期知识等服务,还有专业的月嫂服务、催乳、摄影、产后恢复的方面,为新妈妈提供全套的优...
在线日语教学兼职
1,693.6M
王爷盒2.0apk里面收录了清朝王爷的语音包素材,有了这款软件,可以让大家也体验一把当清朝王爷的感觉,软件也可以拿来恶搞恶作剧,十分的欢乐。软件简介语音素材来源...
牛大圣棋牌源码
1,546.0M
美剧侠pro内部版是一款高清美剧视频追剧神器,拥有各种影视资源,高清无卡顿,免费无广告,海量正版影视资源,第一时间同步更新,让大家随时愉悦的追剧,快来下载体验吧...
个人兼职微商城排行
1,997.5M
完美解码(完美者解码)是一款能实现各种流行视频、HDTV回放及编码的全能型影音解码包,完美解码自带MediaPlayerClassic、KMPlayer、BSP...
5元可提现的试玩任务
710.0M
问剑超V版手游是一款玄幻修仙手游,超高的游戏福利,游戏中画风非常的好看,可以有多种职业去选择,放肆全自由的PK,热血激情帮会战,趣味娱乐互动,打造国内最强手游。...
神来棋牌安卓手机下载
1,840.9M
火星传媒是一款网罗全球区块链知识的全方位整合平台,里面有非常多的关于区块链的知识,用户除了学习知识以外还可以与行业大咖零距离交流,充分了解区块链!火星传媒APP...
平台对刷套利犯法吗
445.3M
拳击战斗2游戏下载,延续领取前作的玩法,一些令人兴奋的新功能将其升级为11,选择你喜欢的拳击手前往擂台去感受拳拳到肉的打击感,游戏格斗非常的激烈,多个挑战等你来...
餐饮店服务员兼职
2025/09/30 22:16
手机屏锁赚钱
2025/09/17 21:19
处处赚人坑
2025/09/19 05:27
可以领红包的消消乐游戏
2025/09/14 05:12
残疾人在家赚钱投资小
2025/09/28 16:53
中国体育彩票怎么赚钱
2025/09/16 21:10
棋牌互娱源码
2025/09/22 01:57
上班期间赚钱
2025/09/16 09:38
龙权棋牌
2025/09/24 08:21
八方欢乐厅棋牌
2025/09/21 10:59
微信广告推广怎么赚钱
2025/09/28 03:36
挣钱求带
2025/09/26 07:33
小生意赚钱项目
2025/09/14 13:14
易发棋牌游戏下载
2025/09/23 00:01
横琴兼职
2025/10/01 10:59
横琴兼职
2025/10/01 10:59更新
玩效相机app(XEFX)是一款非常好用的特效相机软件,功能强大,支持制作魔法天空,支持超现实的景象和独家定制的动态壁纸等操作,很好用。玩效相机app(XEFX...
支持 ( 26 ) 盖楼(回复)
支持 ( 19 ) 盖楼(回复)
支持 ( 50 ) 盖楼(回复)
支持 ( 83 ) 盖楼(回复)
支持 ( 16 ) 盖楼(回复)
支持 ( 100 ) 盖楼(回复)
支持 ( 11 ) 盖楼(回复)
支持 ( 79 ) 盖楼(回复)
支持 ( 41 ) 盖楼(回复)
支持 ( 146 ) 盖楼(回复)
支持 ( 92 ) 盖楼(回复)
支持 ( 156 ) 盖楼(回复)
支持 ( 67 ) 盖楼(回复)
支持 ( 149 ) 盖楼(回复)
支持 ( 123 ) 盖楼(回复)
支持 ( 188 ) 盖楼(回复)
支持 ( 20 ) 盖楼(回复)
支持 ( 38 ) 盖楼(回复)
支持 ( 36 ) 盖楼(回复)
支持 ( 117 ) 盖楼(回复)