首页 > 开发 > XML > 正文

XPath快速解析XML

2020-03-22 16:47:26
字体:
来源:转载
供稿:网友
  • 为什么要使用XPATH,上一篇博客查询越靠近下面单词,时间会越长,超过2s就不太好了,XPAth就是用来提高解析XML速度的。还可以解析html,效率也是不错的!

    分别查询下列信息

    代码:

    <?php// 详细学习可以参考w3cschool 构造一个XPATH查询器$xml = new DOMDocument('1.0','utf-8');$xml->load('book.xml');$xpath = new DOMXPATH($xml);/*$sql = 'xxx'; // 路径表达式$xpath->query($sql);*//*xpath的路径表达式如何写?xpath是从根节点到某个节点声经过的路径*/// 查询book.xml下面的每本书的title// /bookstore/book/title/*$sql = '/bookstore/book/title';$rs = $xpath->query($sql);print_r($rs);echo $rs->item(1)->nodeValue;*/// 查询book.xml下面book节点的下面的第2个title节点,哪来的第2个title节点? 这样写是不对的/*$sql = '/bookstore/book/title[2]';$rs = $xpath->query($sql);print_r($rs->length);*/// 查询bookestore下面的第2本书下面的title节点./*$sql = '/bookstore/book[2]/title';$rs = $xpath->query($sql);print_r($rs->item(0)->nodeValue);*/// 查询bookstore下面的book节点并且价格>40元/*$sql = '/bookstore/book[price>40]/title';$rs = $xpath->query($sql);echo $rs->item(0)->nodeValue;*/// 查询侠客行的价格// /bookstore/下面的book,且title=='侠客行'的书的价格$sql = '/bookstore/book[title="侠客行"]/price';$rs = $xpath->query($sql);echo $rs->item(0)->nodeValue;

    xpath如何不考虑路径的层次,来查询某个节点


    比如我们刚才严格层次查询 /bookstore/book/title
    现在我们加了一个,<a><title></title></a>

    <?php$xml = new DOMDocument('1.0','utf-8');$xml->load('book.xml');$xpath = new DOMXPATH($xml);$sql = '/bookstore/book[last()]/title';$rs = $xpath->query($sql);// 只能查到书名的title//echo $rs->item(0)->nodeValue; // 思考 ,如何查询所有的title,不考虑层次关系?$sql = '/title'; // 这样不行,这样查的是根节点下的title,而根节点下没有title/*/a/b,这说明,a,b就是父子关系,而如果用/a//b,这样说明a只是b的祖先就行,忽略了层次*/// 不分层次,查出所有的title/*$sql = '//title';foreach($xpath->query($sql) as $v) {    echo $v->nodeValue,'<br />';}*//*$sql = '//title[2]'; // 这样又理解成<title>a</title><title>b</title>,查询所有相邻的title节点,且第2个foreach($xpath->query($sql) as $v) {    echo $v->nodeValue,'<br />';}*/

    上面是简单应用,来改善上篇博客效率问题

    <?php// 接收单词并解析XML查询相应的单词$word = isset($_GET['word'])?trim($_GET['word']):'';if(empty($word)) {    exit('你想查啥?');}// 解析XML并查询$xml = new DOMDocument('1.0','utf-8');$xml->load('./dict.xml');/*$namelist = $xml->getElementsByTagName('name');$isfind = false;foreach($namelist as $v) {    if($v->nodeValue == $word) {        //print_r($v);        echo $word,'<br />';        echo '意思:',$v->nextSibling->nodeValue,'<br />';        echo '例句:',$v->nextSibling->nextSibling->nodeValue,'<br />';        $isfind = true;        break;    }}if(!$isfind) {    echo 'sorry';}*/// 接下来用xpath来查询词典$xpath = new DOMXpath($xml);// 查询/dict下的word,且name=$word的节点下面的/name节点$sql = '/dict/word[name="' . $word . '"]/name'; //echo $sql;$words = $xpath->query($sql);if($words->length == 0) {    echo 'sorry';    exit;}// 查到了$name = $words->item(0);echo $word,'<br />';echo '意思:',$name->nextSibling->nodeValue,'<br />';echo '例句:',$name->nextSibling->nextSibling->nodeValue,'<br />';

    来解析一下的html

    <?php/***====笔记部分====xpath是根据DOM标准来查询,html也是DOM,也能查,岂只是xml***/$html = new DOMDocument('1.0','utf-8');$html->loadhtmlfile('dict.html');$xpath = new DOMXPATH($html);$sql = '/html/body/h4';echo $xpath->query($sql)->item(0)->nodeValue,'<br />';// 查询id="abc"的div节点$sql = '//div[@id="abc"]';echo $xpath->query($sql)->item(0)->nodeValue;// 分析第2个/div/下的p下的相邻span的第2个span的内容$sql = '//div/p/span[2]';echo $xpath->query($sql)->item(0)->nodeValue;

    PHP编程

    郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

  • 发表评论 共有条评论
    用户名: 密码:
    验证码: 匿名发表