ant引⼊html页⾯,使⽤Ant脚本解析HTML
如其他答案中所述,您⽆法在“纯”XML中执⾏此操作.你需要嵌⼊⼀种编程语⾔.我个⼈最喜欢的是Groovy,它的integration with ANT⾮常棒.
这是⼀个从groovy主页检索徽标URL的⽰例:
parse:
print:
[echo]
[echo]
Build使⽤ivy plug-in来检索所有第三⽅依赖项.
import org.htmlcleaner.*
def address = '/'
// Clean any messy HTML
def cleaner = new HtmlCleaner()
def node = cleaner.URL())
// Convert from HTML to XML
def props = Properties()
def serializer = new SimpleXmlSerializer(props)
def xml = XmlAsString(node)
// Parse the XML into a document we can work with
def page = new XmlSlurper(false,false).parseText(xml)
// Retrieve the logo URL
properties["logo"] = page.body.div[0].div[1].div[0].div[0].div[0].img.@src
ant安装包
Logo URL: ${logo}
解析逻辑是纯粹的groovy编程.我喜欢你轻松浏览页⾯DOM树的⽅式:
// Retrieve the logo URL
properties["logo"] = page.body.div[0].div[1].div[0].div[0].div[0].img.@src
的l
Ivy与Maven类似.它管理您对第三⽅软件的依赖性.在这⾥它被⽤来拉下Groovy和Groovy逻辑正在使⽤的HTMLCleaner库:
如何安装常春藤
Ivy是标准的ANT插件.下载它的jar并将其放在以下⽬录之⼀:
$HOME/.ant/lib
$ANT_HOME/lib
我不知道为什么ANT项⽬不附带常春藤.
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论