首页 > CMS > 织梦DEDE > 正文

修复DEDECMS5.5采集功能的一些bug

2024-07-12 08:40:26
字体:
来源:转载
供稿:网友
修复1:将开始标签和结束标签以在网页源码中第一次出现的位置为准  修改文件/include/dedecollection.class.php  在成员函数GethtmlArea中的  $posend = @strpos($html,$areaRules[1],$posstart);  语句前增加语句:  $posstart=$posstart+strlen($areaRules[0]);  将:  return substr($html,$posstart+strlen($areaRules[0]),$posend-$posstart-strlen($areaRules[0]));  替换为:  return substr($html,$posstart,$posend-$posstart);    修复2:下载图片时对图片的扩展名判断错误  相同文件  将    eregi("/.gif",$v)  替换为  eregi("/.gif$",$url)    eregi("/.png",$v)  替换为  eregi("/.png$",$url)   修复3:采集软件地址的正则表达式不准确  /include/dedecollection.func.php  将TurnLinkTag函数中  preg_match_all("/<a(?:.*)href=['/"](.+?)['/"]([^>]+?)>(.+?)<//a>/is",$body,$match); 换为:  preg_match_all("/<a(?:[^/>]+?)href//s*=//s*[/'/"]?([^//s/>/"/']+)([^/>]+?)>(.+?)<//a>/is",$body,$match); 修复4:采集图片的正则表达式不准确 相同文件 将 preg_match_all('/src=[/'"](.+?)[/'"]/is',$body,$match);  $ttx = '';  if(is_array($match[1]) && count($match[1])>0)  {   for($i=0;isset($match[1][$i]);$i++)   {    $ttx .= "{dede:img text='' }".$match[1][$i]." {/dede:img}"."/r/n";   }  } 改为 $patten = "/<//s*img//s.*?src//s*=//s*([/"//'])?(?(1)(.*?)//1|([^//s//>/"//']+))/isx";     preg_match_all( $patten, $body, $images );     $returnArray1 = $images[2];     $returnArray2 = $images[3];     foreach ( $returnArray1 as $key => $value )     {         if ( $value )         {             $ttx .= "{dede:img ddimg='$litpicname' text='图 ".($key+1)."'}".$value."{/dede:img}"."/r/n";         }         else         {             $ttx .= "{dede:img ddimg='$litpicname' text='图 ".($key+1)."'}".$returnArray2[$key]."{/dede:img}"."/r/n";         }  
发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表