首页 > 开发 > PHP > 正文

简单站内HTML文件搜索程序

2024-05-04 22:53:35
字体:
来源:转载
供稿:网友

最大的网站源码资源下载站,

    自己写来简单的搜索自己电脑上的技术资料的. 大概的思路就是寻找指定目录下的文本, 然后如果有与关键字相匹配的数据就把文件名返回, 最后把所有搜索结果显示出来. 显示结果类似于baidu/google, 呵呵, 这个是纯粹为了好玩.

 程序代码:

<?php
/**
 * 文件: search.php
 * 功能: 搜索指定目录下的html文件
 * 创建: 2005-9-23
 * 作者: heiyeluren <heiyeluren at gmail.com>
 */


/* 基本函数 */

//获取目录下文件函数
function getfile($dir)
{
 $dp = opendir($dir);
 $filearr = array();
 while (!false == $curfile = readdir($dp)) {
  if ($curfile!="." && $curfile!=".." && $curfile!="") {
   if (is_dir($curfile)) {
    $filearr = getfile($dir."/".$curfile);
   } else {
    $filearr[] = $dir."/".$curfile;
   }
  }
 }
 return $filearr;
}

//获取文件内容
function getfilecontent($file)
{
 if (!$fp = fopen($file, "r")) {
  die("cannot open file $file");
 }
 while ($text = fread($fp, 4096)) {
  $filecontent .= $text;
 }
 return $filecontent;
}

//搜索指定文件
function searchtext($file, $keyword)
{
 $text = getfilecontent($file);
 if (preg_match("/$keyword/i", $text)) {
  return true;
 }
 return false;
}

//搜索出文章的标题
function getfiletitle($file, $default="none subject")
{
 $filecontent = getfilecontent($file);
 $sresult = preg_match("/<title>.*<//title>/i", $filecontent, $matchresult);
 $title = preg_replace(array("/(<title>)/i","/(<//title>)/i"), "", $matchresult[0]);
 if (empty($title)) {
  return $default;
 } else {
  return $title;
 }
}

//获取文件描述信息
function getfiledescribe($file,$length=200, $default="none describe")
{
 $metas = get_meta_tags($file);
 if ($meta['description'] != "") {
  return $metas['description'];
 }
 $filecontent = getfilecontent($file);
 preg_match("/(<body.*<//body>)/is", $filecontent, $matchresult);
 $pattern = array("/(<[^/x80-/xff]+>)/i","/(<input.*>)+/i", "/(<a.*>)+/i", "/(<img.*>)+/i", "/([<script.*>])+.*([<//script>])+/i","/&amp;/i","/&quot;/i","/&#039;/i", "//s/");
 $description = preg_replace($pattern, "", $matchresult[0]);
 $description = mb_substr($description, 0, $length)." ...";

 return $description;
}

//加亮搜索结果中的关键字
function highlightkeyword($text, $keyword, $color="#c60a00")
{
 $newword = "<font color=$color>$keyword</font>";
 $text = str_replace($keyword, $newword, $text);
 return $text;
}

//获取文件大小(kb)
function getfilesize($file)
{
 $filesize = intval(filesize($file)/1024)."k";
 return $filesize;
}

//获取文件最后修改的时间
function getfiletime($file)
{
 $filetime = date("y-m-d", filemtime($file));
 return $filetime;
}

//搜索目录下所有文件
function searchfile($dir, $keyword)
{
 $sfile = getfile($dir);
 if (count($sfile) <= 0) {
  return false;
 }
 $sresult = array();
 foreach ($sfile as $file) {
  if (searchtext($file, $keyword)) {
   $sresult[] = $file;
  }
 }
 if (count($sresult) <= 0) {
  return false;
 } else {
  return $sresult;
 }
}


/* 测试代码 */

//指定要搜索的目录
$dir = "./php_linux";
//要搜索的关键字
$keyword = "sendmail";

$filearr = searchfile($dir, $keyword);
$searchsum = count($filearr);

echo "搜索关键字: <b>$keyword</b> &nbsp; 搜索目录: <b>$dir</b> &nbsp; 搜索结果: <b>$searchsum</b><br><hr size=1><br>";

if ($searchsum <= 0) {
 echo "没有搜索到任何结果";
} else {
 foreach ($filearr as $file) {
  echo "<a href='$file' target='_blank'>". highlightkeyword(getfiletitle($file), $keyword) .
    "</a> - ".getfilesize($file)."&nbsp;". getfiletime($file) .
    "<br>/n<font size=2>".highlightkeyword(getfiledescribe($file), $keyword) .
    "</font><br><br>";
 }
}

?>

 完全可以用在自己已经生成静态内容的的搜索, 但是程序效率不高. 如果能够适当的加上 索引/缓存 等机制的话, 我想程序会有趣很多.

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表