首页 > 开发 > PHP > 正文

DOMXML函数笔记

2024-05-04 22:57:41
字体:
来源:转载
供稿:网友
  • 本文来源于网页设计爱好者web开发社区http://www.html.org.cn收集整理,欢迎访问。
  • <?php
    /**
    * domxml函数笔记
    * 连接php_domxml.dll后
    * 用get_defined_functions()得到domxml支持函数
    *
    * 目前domxml不支持非iso-8859-1以外的语言声明
    * <?xml version="1.0" encoding="iso-8859-1"?> 支持
    * <?xml version="1.0" encoding="gb2312"?> 不支持
    * <?xml version="1.0"?> 因此需要改造成这样,可能需要
    * utf8_encode() utf8_decode() 函数进行处理
    *
    * 函数列表
    * string domxml_version(void)  返回domxml的版本号
    * object xmldoc(string str)    从字符串创建xml的domdocument对象
    * object xmldocfile(string filename)   从文件创建xml的domdocument对象
    * object xmltree(string str)   解析xml文档,返回树状结构,不能用domxml函数改变
    * resource domxml_add_root(resource doc,string name)  添加根节点
    * string domxml_dumpmem(resource doc)  将domxml对象转化为xml串。这个函数有一个问题,他会在第一个汉字前面加一个扩展ascii字符,形如&#nnn;
    * domxml_node_attributes
    * domxml_elem_get_attribute
    * domxml_elem_set_attribute
    * array domxml_node_children(object doc|node)  返回子节点
    * domxml_node_new_child
    * object domxml_node(string name)  创建一个节点节点
    * domxml_node_unlink_node
    * int domxml_node_set_content(resource doc,string content)  设置节点内容
    * object domxml_new_xmldoc(string version)  创建新的空xml对象
    * xpath_new_context
    * xpath_eval
    * xpath_eval_expression
    * xptr_new_context
    * xptr_eval
    * object domxml_root(object doc)  返回根节点
    * array domxml_attributes(resource note)  获取节点属性
    * object domxml_get_attribute(resource doc,string name)  读取属性
    * domxml_getattr
    * object domxml_set_attribute(resource doc,string name,string value)  添加属性
    * domxml_setattr
    * array domxml_children(object doc|node)  返回子节点
    * resource domxml_new_child(string name,string content)  添加子节点
    * domxml_unlink_node
    * set_content
    * new_xmldoc
    *
    */
    ?>
    <pre>
    <?php
    // 文档 xml源树.xml 内容
    $testxml = '
    <?xml version="1.0" encoding="gb2312"?>
    <root>
    <note>读取xml文档时,处理器将形成一个树,我们将其叫做源树。该树具有表中的各种类型的节点。
    </note>
    <title>源树具有的节点</title>
    <table>
    <tr><th>节点类型</th><th>说明</th></tr>
    <tr><td>root(根)</td><td>这是树的根节点。可以出现在树的任何地方。根节点只具有一个子节点,子节点指的是xml文档中的文档元素节点。</td></tr>
    <tr><td>element(元素)</td><td>这种节点用于文档中的任何元素。元素节点的子节点可以是其内容的元素节点、注释节点、处理信息节点以及文本节点。</td></tr>
    <tr><td>text(文本)</td><td>文档中出现的所有文本,都分组归入到文本节点中。文本节点不可以有同为文本节点的紧接着的前或后的兄弟节点。</td></tr>
    <tr><td>attribute(属性)</td><td>每一个元素节点都有一套自己附加的属性节点。默认的属性值以与指定属性一样的方法来处理。这些节点都没有子节点。</td></tr>
    <tr><td>namespace(名称)</td><td>对于每一个以xlmns:和属性节点开头的元素,都有一个名称空格节点。这些节点没有子节点。</td></tr>
    <tr><td>processing instruction(处理指令)</td><td>每一个处理指令都有一个单独的节点。这些节点都没有子节点。</td></tr>
    <tr><td>comment(注释)</td><td>每一个都有一个注释节点。这些节点都没有子节点。</td></tr>
    </table>
    </root>
    ';

    echo "domxml版本:".domxml_version();
    echo "<p>  </p>";
    // xmltree domxml_dumpmem
    $filename = "xml源树.xml";
    //$filename = "resume.xml";
    $fp = fopen($filename,"r");
    $inxml = fread($fp,filesize($filename));
    fclose($fp);
    // 删除语言设定
    //$inxml = str_replace(' encoding="gb2312"',"",$inxml);
    $inxml = eregi_replace(' encoding="[a-z0-9_-]+"',"",$inxml);

    $doc = xmltree($inxml);    // 使用xmltree解析
    $myxml = $doc->dumpmem();  // 转换成字串,头为  xml version="1.0"
                               // 如果再执行一次,头将变成  xml version="1.0" encoding="iso-8859-1"
    //$myxml = eregi_replace('&#[0-9]+;',"",$myxml); // 删除
    echo "用xmltree解析<br>";
    echo "<textarea cols=60 rows=5>$myxml</textarea><br>";
    //print_r($doc);  // 可以看到整个树 亦可用var_dump($doc);

    // xmldoc
    $doc = xmldoc($inxml);
    $myxml = $doc->dumpmem();
    echo "用xmldoc解析<br>";
    echo "<textarea cols=60 rows=5>$myxml</textarea><br>";
    //print_r($doc); // 只能看到根节点

    // domxml_new_xmldoc
    $doc = domxml_new_xmldoc("1.0");

    $root = $doc->add_root("html");
    $head = $root->new_child("head", "");
    $head->new_child("title", "domxml 测试0");
    $head->new_child("title", "domxml 测试1");
    $head->set_attribute("language", "ge");
    domxml_node_set_content($head,"ppp"); // 设置节点的内容,多次执行是叠加的
    domxml_node_set_content($head,"ttt");

    // 是乎函数名中只有1-2个"_"的函数,可作为对象的方法使用

    $myxml = $doc->dumpmem();
    echo "自定义xml<br>";
    echo "<textarea cols=60 rows=5>$myxml</textarea><br>";

    // 节点的遍历
    /**
      节点结构
      domelement object
        type = 1
        tagname = 节点名
      domtext object
        type = 3
        content = 节内容点
      domcdata object
        type = 4
        content = 节内容点

      domprocessinginstruction object
        type 无
        target = 处理指令
        data = 参数
                        
    */
    $ar[] = $doc->root();  // 取得根节点
    $ar[] = $ar[count($ar)-1]->children();
    $ar[] = $ar[count($ar)-1][0]->children();

    // 函数domxml_children() 不能返回节点参数
    // 返回节点参数需要使用domxml_attributes()
    //var_dump(domxml_attributes($head));
    //print_r($ar[1][0]->attributes());
    //print_r($ar);

    function xml_dumpmem($xmldoc) {
      static $mode = 0;
      $xmlstr = "";
      // 获取节点,保存在数组中
      if(get_class($xmldoc) == "domdocument") {
        $xmlstr = '<?xml version="1.0" encoding="gb2312"?>'."/n";
        if(count($xmldoc->children) == 1)  // 根节点,没有其他成员
          $docs[] = $xmldoc->root();
        else
          $docs = $xmldoc->children();  // 根节点,有其他成员
      }else {
        $docs = $xmldoc->children();  // 一般节点
      }
      
    //  echo __line__."<br>";
      foreach($docs as $doc) {
        $attr = $doc->attributes();
        switch($doc->type) {
          case 1:
            $xmlstr .= "<{$doc->tagname}";  // 标签头
            if($attr) {
              foreach($attr as $key)
                $xmlstr .= " {$key->name}=/"{$key->value}/"";  // 标签参数
            }
            $xmlstr .= ">";  // 标签结束
            $xmlstr .= xml_dumpmem($doc);  // 进入子节点
            $xmlstr .= "</{$doc->tagname}>";  // 闭合标签
            break;
          case 3:
            $xmlstr .= $doc->content;
            break;
          case 4:
            $xmlstr .= "<![cdata][";
            $xmlstr .= $doc->content;
            $xmlstr .= "]]>";
            break;
          default:
            if(get_class($doc) == "domprocessinginstruction") {
              $xmlstr .= "<?{$doc->target}";
              $xmlstr .= " {$doc->data}?>/n";
            }
            break;
        }
      }
      return $xmlstr;
    }

    if(1) {
      $filename = "resume.xml";
    //  $filename = "resume.xsl";
      $filename = "xml源树.xml";
      $fp = fopen($filename,"r");
      $inxml = fread($fp,filesize($filename));
      fclose($fp);
      $inxml = eregi_replace(' encoding="[a-z0-9_-]+"',"",$inxml);
    //  $doc = xmltree($inxml);    // 使用xmltree解析
      $doc = xmldoc($inxml);    // 使用xmldoc解析
    }

    // 不能用来解析xsl文档

    $myxml = xml_dumpmem($doc);
    echo "自己写一个dumpmem就不出错了<br>";
    echo "<textarea cols=60 rows=5>$myxml</textarea><br>";
    print_r($doc);

    ?>
    </pre>
    发表评论 共有条评论
    用户名: 密码:
    验证码: 匿名发表