正则表达式,js去掉html标记,去掉字符,截取字符
关键字: js
1,得到网页上的链接地址:
      string matchString = @"<a[^>]+href=\s*(?:'(?<href>[^']+)'|""(?<href>[^""]+)""|(?<href>[^>\s]+))\s*[^>]*>";
2,得到网页的标题:
          string matchString = @"<title>(?<title>.*)</title>";
3,去掉网页中的所有的html标记:
          string temp = Regex.Replace(html, "<[^>]*>", "");        //html是一个要去除html标记的文档
js教程removechild        java 中去掉网页中的所有标签
          str = placeAll("<[^>]*>", "");
4, string matchString = @"<title>([\S\s\t]*?)</title>";
5,js去掉所有html标记的函数:
          function delHtmlTag(str)
          {
            place(/<\/?.+?>/g,"");//去掉所有的html标记
          }
        这个可能IE5会错,那用这个,梅花的:
        function delHtmlTag(str)
{
        place(/<[^>]+>/g,"");//去掉所有的html标记
}
document方法:
getElementById(id)                            返回指定结点的引用
getElementsByTagName(name)        返回文档中所有匹配的元素的集合
createElement(name)                          创建指定类型的新结点
createTextNode(text)                          创建一个纯文本结点
element方法:
getAttribute(id)                                    返回指定属性的值
setAttribute(id,value)                          给属性赋值
removeAttribute(id)                            移除指定属性和它的值
getElementsByTagName(name)        返回结点内所有匹配的元素的集合
node方法:
appendChild(child)                              给指定结点添加一个新的子结点
removeChild(child)                              移除指定结点的子结点
replaceChild(newChild,oldChild)        替换指定结点的子结点
insertBefore(newChild,refChild)        在同一层级的结点前面插入新结点
hasChildNodes()                                  如果结点有子结点则返回true
node属性:
nodeName                                          以字符串的格式存放结点的名称
nodeType                                            以整型数据格式存放结点的类型
nodeValue                                          以可用的格式存放结点的值
parentNode                                        指向结点的父结点的引用
childNodes                                          指向子结点的引用的集合
firstChild                                            指向子结点结合中的第一个子结点的引用
lastChild                                              指向子结点结合中的最后一个子结点的引用

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。