Regular Expression 正则表达式-1 (C#)
2024-07-21 02:18:54
供稿:网友
起因是因为一片帖子,问到了一个问题,帖子是这样的:
originally posted by 人就是这样
我想编一个程序,但学compsci是很久以前的事情了。想请教请教大家。
有两个txt文件,一个叫source.txt(有很多数据), 一个叫target.txt(空白的)
我想把source.txt里的一些数据提取出来(稍微修改一下),然后写到target.txt里面。
举个例子:
sourse.txt里的数据:
2oi)[email protected]##( "data:001%abc">dsi-23)(*32##("data:dce%xy3"#(*eoij2308eld
想提取的数据就是橘黄色的。
data:001%abc
全部提取出来以后,我还想把%换成*, 然后每条数据后面加个逗号","
最后target.txt就应该这样:
data:001*abc,
data:dce*xyz
请问应该怎么做啊?实在java忘光了。求教~~
如果帮我做的话付点酬劳也可以。
以前我也面临过类似的问题,总是通过程序描述的办法解决,现在问题又提起来了,于是静下心来想一想。有了上学期330编译原理的基础,并且做过有限状态自动机以后,已经非常明确这种文字处理的事情应该交给regular expression(正则表达式),只不过自己总因为正则表达式晦涩难懂,因此没有好好的琢磨过。
于是我就打算借这个机会把regular expression好好的熟悉一下。结果发现程序原来如此好写:
using system;
using system.io;
using system.text;
using system.text.regularexpressions;
namespace regexpression
{
/// <summary>
///
/// </summary>
public class datafilter
{
public static void main(string[] args)
{
if( args.length < 2 )
{
console.error.writeline("please enter 2 filenames(e.g. in.txt out.txt)");
return;
}
string result;
using( streamreader sr = new streamreader(args[0]) )
{
result = filter( sr.readtoend() );
}
using( streamwriter wr = new streamwriter(args[1]) )
{
wr.write(result);
}
}
private static string filter(string input)
{
stringbuilder result = new stringbuilder();
regex r = new regex("/"(?<data>//w+):(?<key>//w+)%(?<value>//w+)/"", regexoptions.compiled);
for( match m = r.match(input); m.success; m = m.nextmatch() )
{
result.append( m.result("${data}:${key}*${value},"+environment.newline) );
}
return result.tostring();
}
}
}
实现这个功能的关键代码也就不超过10行就够了,一个字,爽。
略加修正:
·using statement
·end of line (environment.newline)
·use stringbuilder to improve performence
这些要感谢cumcum给与指正。