C#泛型相关讲解

2020-01-24 03:16:44

字体：大中小

来源：转载

供稿：网友

我们在编写程序时，经常遇到两个模块的功能非常相似，只是一个是处理int数据，另一个是处理string数据，或者其他自定义的数据类型，但我们没有办法，只能分别写多个方法处理每个数据类型，因为方法的参数类型不同。有没有一种办法，在方法中传入通用的数据类型，这样不就可以合并代码了吗？泛型的出现就是专门解决这个问题的。读完本篇文章，你会对泛型有更深的了解。
为什么要使用泛型为了了解这个问题，我们先看下面的代码，代码省略了一些内容，但功能是实现一个栈，这个栈只能处理int数据类型：

复制代码代码如下:

public class Stack
    {
        private int[] m_item;
        public int Pop(){...}
        public void Push(int item){...}
        public Stack(int i)
        {
            this.m_item = new int[i];
        }
}

上面代码运行的很好，但是，当我们需要一个栈来保存string类型时，该怎么办呢？很多人都会想到把上面的代码复制一份，把int改成 string不就行了。当然，这样做本身是没有任何问题的，但一个优秀的程序是不会这样做的，因为他想到若以后再需要long、Node类型的栈该怎样做呢？还要再复制吗？优秀的程序员会想到用一个通用的数据类型object来实现这个栈：

复制代码代码如下:

public class Stack
    {
        private object[] m_item;
        public object Pop(){...}
        public void Push(object item){...}
        public Stack(int i)
        {
            this.m_item = new[i];
        }
    }
    

这个栈写的不错，他非常灵活，可以接收任何数据类型，可以说是一劳永逸。但全面地讲，也不是没有缺陷的，主要表现在：
当Stack处理值类型时，会出现装箱、折箱操作，这将在托管堆上分配和回收大量的变量，若数据量大，则性能损失非常严重。在处理引用类型时，虽然没有装箱和折箱操作，但将用到数据类型的强制转换操作，增加处理器的负担。在数据类型的强制转换上还有更严重的问题（假设stack是Stack的一个实例）： Node1 x = new Node1();
stack.Push(x);
Node2 y = (Node2)stack.Pop();
上面的代码在编译时是完全没问题的，但由于Push了一个Node1类型的数据，但在Pop时却要求转换为Node2类型，这将出现程序运行时的类型转换异常，但却逃离了编译器的检查。

针对object类型栈的问题，我们引入泛型，他可以优雅地解决这些问题。泛型用用一个通过的数据类型T来代替object，在类实例化时指定T的类型，运行时（Runtime）自动编译为本地代码，运行效率和代码质量都有很大提高，并且保证数据类型安全。

使用泛型下面是用泛型来重写上面的栈，用一个通用的数据类型T来作为一个占位符，等待在实例化时用一个实际的类型来代替。让我们来看看泛型的威力：

复制代码代码如下:

public class Stack<T>
    {
        private T[] m_item;
        public T Pop(){...}
        public void Push(T item){...}
        public Stack(int i)
        {
            this.m_item = new T[i];
        }
}

类的写法不变，只是引入了通用数据类型T就可以适用于任何数据类型，并且类型安全的。这个类的调用方法：
//实例化只能保存int类型的类
Stack<int> a = new Stack<int>(100);
      a.Push(10);
      a.Push("8888"); //这一行编译不通过，因为类a只接收int类型的数据
      int x = a.Pop();

//实例化只能保存string类型的类
Stack<string> b = new Stack<string>(100);
b.Push(10);    //这一行编译不通过，因为类b只接收string类型的数据
      b.Push("8888");
string y = b.Pop();

这个类和object实现的类有截然不同的区别：
1.       他是类型安全的。实例化了int类型的栈，就不能处理string类型的数据，其他数据类型也一样。
2.       无需装箱和折箱。这个类在实例化时，按照所传入的数据类型生成本地代码，本地代码数据类型已确定，所以无需装箱和折箱。
3.       无需类型转换。

泛型类实例化的理论 C#泛型类在编译时，先生成中间代码IL，通用类型T只是一个占位符。在实例化类时，根据用户指定的数据类型代替T并由即时编译器（JIT）生成本地代码，这个本地代码中已经使用了实际的数据类型，等同于用实际类型写的类，所以不同的封闭类的本地代码是不一样的。按照这个原理，我们可以这样认为：
泛型类的不同的封闭类是分别不同的数据类型。
例：Stack<int>和Stack<string>是两个完全没有任何关系的类，你可以把他看成类A和类B，这个解释对泛型类的静态成员的理解有很大帮助。

泛型类中数据类型的约束程序员在编写泛型类时，总是会对通用数据类型T进行有意或无意地有假想，也就是说这个T一般来说是不能适应所有类型，但怎样限制调用者传入的数据类型呢？这就需要对传入的数据类型进行约束，约束的方式是指定T的祖先，即继承的接口或类。因为C#的单根继承性，所以约束可以有多个接口，但最多只能有一个类，并且类必须在接口之前。这时就用到了C#2.0的新增关键字：
public class Node<T, V> where T : Stack, IComparable
        where V: Stack
    {...}
以上的泛型类的约束表明，T必须是从Stack和IComparable继承，V必须是Stack或从Stack继承，否则将无法通过编译器的类型检查，编译失败。
通用类型T没有特指，但因为C#中所有的类都是从object继承来，所以他在类Node的编写中只能调用object类的方法，这给程序的编写造成了困难。比如你的类设计只需要支持两种数据类型int和string，并且在类中需要对T类型的变量比较大小，但这些却无法实现，因为object是没有比较大小的方法的。了解决这个问题，只需对T进行IComparable约束，这时在类Node里就可以对T的实例执行CompareTo方法了。这个问题可以扩展到其他用户自定义的数据类型。
如果在类Node里需要对T重新进行实例化该怎么办呢？因为类Node中不知道类T到底有哪些构造函数。为了解决这个问题，需要用到new约束：
public class Node<T, V> where T : Stack, new()
        where V: IComparable
需要注意的是，new约束只能是无参数的，所以也要求相应的类Stack必须有一个无参构造函数，否则编译失败。
C#中数据类型有两大类：引用类型和值类型。引用类型如所有的类，值类型一般是语言的最基本类型，如int, long, struct等，在泛型的约束中，我们也可以大范围地限制类型T必须是引用类型或必须是值类型，分别对应的关键字是class和struct:
public class Node<T, V> where T : class
        where V: struct

泛型方法泛型不仅能作用在类上，也可单独用在类的方法上，他可根据方法参数的类型自动适应各种参数，这样的方法叫泛型方法。看下面的类：

复制代码代码如下:

public class Stack2
    {
        public void Push<T>(Stack<T> s, params T[] p)
        {
            foreach (T t in p)
            {
                s.Push(t);
            }
        }
}

原来的类Stack一次只能Push一个数据，这个类Stack2扩展了Stack的功能（当然也可以直接写在Stack中），他可以一次把多个数据压入Stack中。其中Push是一个泛型方法，这个方法的调用示例如下：

复制代码代码如下:

Stack<int> x = new Stack<int>(100);
    Stack2 x2 = new Stack2();
    x2.Push(x, 1, 2, 3, 4, 6);
    string s = "";
    for (int i = 0; i < 5; i++)
    {
        s += x.Pop().ToString();
    }    //至此，s的值为64321

 

泛型中的静态成员变量在C#1.x中，我们知道类的静态成员变量在不同的类实例间是共享的，并且他是通过类名访问的。C#2.0中由于引进了泛型，导致静态成员变量的机制出现了一些变化：静态成员变量在相同封闭类间共享，不同的封闭类间不共享。
这也非常容易理解，因为不同的封闭类虽然有相同的类名称，但由于分别传入了不同的数据类型，他们是完全不同的类，比如：
Stack<int> a = new Stack<int>();
Stack<int> b = new Stack<int>();
Stack<long> c = new Stack<long>();
类实例a和b是同一类型，他们之间共享静态成员变量，但类实例c却是和a、b完全不同的类型，所以不能和a、b共享静态成员变量。
泛型中的静态构造函数静态构造函数的规则：只能有一个，且不能有参数，他只能被.NET运行时自动调用，而不能人工调用。
泛型中的静态构造函数的原理和非泛型类是一样的，只需把泛型中的不同的封闭类理解为不同的类即可。以下两种情况可激发静态的构造函数：
1. 特定的封闭类第一次被实例化。
2. 特定封闭类中任一静态成员变量被调用。

泛型类中的方法重载方法的重载在.Net Framework中被大量应用，他要求重载具有不同的签名。在泛型类中，由于通用类型T在类编写时并不确定，所以在重载时有些注意事项，这些事项我们通过以下的例子说明：

复制代码代码如下:

public class Node<T, V>
    {
        public T add(T a, V b)          //第一个add
        {
            return a;
        }
        public T add(V a, T b)          //第二个add
        {
            return b;
        }
        public int add(int a, int b)    //第三个add
        {
            return a + b;
        }
}

上面的类很明显，如果T和V都传入int的话，三个add方法将具有同样的签名，但这个类仍然能通过编译，是否会引起调用混淆将在这个类实例化和调用add方法时判断。请看下面调用代码：
Node<int, int> node = new Node<int, int>();
    object x = node.add(2, 11);
这个Node的实例化引起了三个add具有同样的签名，但却能调用成功，因为他优先匹配了第三个add。但如果删除了第三个add，上面的调用代码则无法编译通过，提示方法产生的混淆，因为运行时无法在第一个add和第二个add之间选择。
Node<string, int> node = new Node<string, int>();
        object x = node.add(2, "11");
   这两行调用代码可正确编译，因为传入的string和int，使三个add具有不同的签名，当然能找到唯一匹配的add方法。
由以上示例可知，C#的泛型是在实例的方法被调用时检查重载是否产生混淆，而不是在泛型类本身编译时检查。同时还得出一个重要原则：
当一般方法与泛型方法具有相同的签名时，会覆盖泛型方法。

泛型类的方法重写方法重写（override）的主要问题是方法签名的识别规则，在这一点上他与方法重载一样，请参考泛型类的方法重载。

泛型的使用范围本文主要是在类中讲述泛型，实际上，泛型还可以用在类方法、接口、结构（struct）、委托等上面使用，使用方法大致相同，就不再讲述。
小结 C# 泛型是开发工具库中的一个无价之宝。它们可以提高性能、类型安全和质量，减少重复性的编程任务，简化总体编程模型，而这一切都是通过优雅的、可读性强的语法完成的。尽管 C# 泛型的根基是 C++ 模板，但 C# 通过提供编译时安全和支持将泛型提高到了一个新水平。C# 利用了两阶段编译、元数据以及诸如约束和一般方法之类的创新性的概念。毫无疑问，C# 的将来版本将继续发展泛型，以便添加新的功能，并且将泛型扩展到诸如数据访问或本地化之类的其他 .NET Framework 领域。

C#泛型编程
       泛型：通过参数化类型来实现在同一份代码上操作多种数据类型。利用“参数化类型”将类型抽象化，从而实现灵活的复用。
例子代码：

复制代码代码如下:

class Program
    {
        static void Main(string[] args)
        {
            int obj = 2;
            Test<int> test = new Test<int>(obj);
            Console.WriteLine("int:" + test.obj);
            string obj2 = "hello world";
            Test<string> test1 = new Test<string>(obj2);
            Console.WriteLine("String:" + test1.obj);
            Console.Read();
        }
    }

    class Test<T>
    {
        public T obj;
        public Test(T obj)
        {
            this.obj = obj;
        }
}

输出结果是：
int:2
String:hello world

程序分析：
1、 Test是一个泛型类。T是要实例化的范型类型。如果T被实例化为int型，那么成员变量obj就是int型的，如果T被实例化为string型，那么obj就是string类型的。
2、根据不同的类型，上面的程序显示出不同的值。

C#泛型机制：
C#泛型能力有CLR在运行时支持：C#泛型代码在编译为IL代码和元数据时，采用特殊的占位符来表示范型类型，并用专有的IL指令支持泛型操作。而真正的泛型实例化工作以“on-demand”的方式，发生在JIT编译时。

看看刚才的代码中Main函数的元数据

复制代码代码如下:

.method private hidebysig static void  Main(string[] args) cil managed
{
  .entrypoint
  // Code size       79 (0x4f)
  .maxstack  2
  .locals init ([0] int32 obj,
           [1] class CSharpStudy1.Test`1<int32> test,
           [2] string obj2,
           [3] class CSharpStudy1.Test`1<string> test1)
  IL_0000:  nop
  IL_0001:  ldc.i4.2
  IL_0002:  stloc.0
  IL_0003:  ldloc.0
  IL_0004:  newobj     instance void class CSharpStudy1.Test`1<int32>::.ctor(!0)
  IL_0009:  stloc.1
  IL_000a:  ldstr      "int:"
  IL_000f:  ldloc.1
  IL_0010:  ldfld      !0 class CSharpStudy1.Test`1<int32>::obj
  IL_0015:  box        [mscorlib]System.Int32
  IL_001a:  call       string [mscorlib]System.String::Concat(object,
                                                              object)
  IL_001f:  call       void [mscorlib]System.Console::WriteLine(string)
  IL_0024:  nop
  IL_0025:  ldstr      "hello world"
  IL_002a:  stloc.2
  IL_002b:  ldloc.2
  IL_002c:  newobj     instance void class CSharpStudy1.Test`1<string>::.ctor(!0)
  IL_0031:  stloc.3
  IL_0032:  ldstr      "String:"
  IL_0037:  ldloc.3
  IL_0038:  ldfld      !0 class CSharpStudy1.Test`1<string>::obj
  IL_003d:  call       string [mscorlib]System.String::Concat(string,
                                                              string)
  IL_0042:  call       void [mscorlib]System.Console::WriteLine(string)
  IL_0047:  nop
  IL_0048:  call       int32 [mscorlib]System.Console::Read()
  IL_004d:  pop
  IL_004e:  ret
} // end of method Program::Main
 

再来看看Test类中构造函数的元数据

复制代码代码如下:

.method public hidebysig specialname rtspecialname
        instance void  .ctor(!T obj) cil managed
{
  // Code size       17 (0x11)
  .maxstack  8
  IL_0000:  ldarg.0
  IL_0001:  call       instance void [mscorlib]System.Object::.ctor()
  IL_0006:  nop
  IL_0007:  nop
  IL_0008:  ldarg.0
  IL_0009:  ldarg.1
  IL_000a:  stfld      !0 class ConsoleCSharpTest1.Test`1<!T>::obj
  IL_000f:  nop
  IL_0010:  ret
} // end of method Test`1::.ctor
 

1、第一轮编译时，编译器只为Test<T>类型产生“泛型版”的IL代码与元数据――并不进行泛型的实例化，T在中间只充当占位符。例如：Test类型元数据中显示的<!T>
2、JIT编译时，当JIT编译器第一次遇到Test<int>时，将用int替换“范型版”IL代码与元数据中的T――进行泛型类型的实例化。例如：Main函数中显示的<int>
3、CLR为所有类型参数为“引用类型”的泛型类型产生同一份代码；但是如果类型参数为“值类型”，对每一个不同的“值类型”，CLR将为其产生一份独立的代码。因为实例化一个引用类型的泛型，它在内存中分配的大小是一样的，但是当实例化一个值类型的时候，在内存中分配的大小是不一样的。

C#泛型特点：
1、如果实例化泛型类型的参数相同，那么JIT编辑器会重复使用该类型，因此C#的动态泛型能力避免了C++静态模板可能导致的代码膨胀的问题。
2、C#泛型类型携带有丰富的元数据，因此C#的泛型类型可以应用于强大的反射技术。
3、C#的泛型采用“基类、接口、构造器，值类型/引用类型”的约束方式来实现对类型参数的“显示约束”，提高了类型安全的同时，也丧失了C++模板基于“签名”的隐式约束所具有的高灵活性

C#泛型继承：
C#除了可以单独声明泛型类型（包括类与结构）外，也可以在基类中包含泛型类型的声明。但基类如果是泛型类，它的类型要么以实例化，要么来源于子类（同样是泛型类型）声明的类型参数，看如下类型
class C<U,V>
class D:C<string,int>
class E<U,V>:C<U,V>
class F<U,V>:C<string,int>
class G:C<U,V> //非法
E类型为C类型提供了U、V，也就是上面说的来源于子类
F类型继承于C<string,int>，个人认为可以看成F继承一个非泛型的类
G类型为非法的，因为G类型不是泛型，C是泛型，G无法给C提供泛型的实例化

泛型类型的成员：
泛型类型的成员可以使用泛型类型声明中的类型参数。但类型参数如果没有任何约束，则只能在该类型上使用从System.Object继承的公有成员。如下图：

泛型接口：
泛型接口的类型参数要么已实例化，要么来源于实现类声明的类型参数

泛型委托：
泛型委托支持在委托返回值和参数上应用参数类型，这些参数类型同样可以附带合法的约束

复制代码代码如下:

delegate bool MyDelegate<T>(T value);
class MyClass
{
    static bool F(int i){...}
    static bool G(string s){...}
    static void Main()
    {
        MyDelegate<string> p2 = G;
        MyDelegate<int> p1 = new MyDelegate<int>(F);
    }
}
 

泛型方法：
1、C#泛型机制只支持“在方法声明上包含类型参数”――即泛型方法。
2、C#泛型机制不支持在除方法外的其他成员（包括属性、事件、索引器、构造器、析构器）的声明上包含类型参数，但这些成员本身可以包含在泛型类型中，并使用泛型类型的类型参数。
3、泛型方法既可以包含在泛型类型中，也可以包含在非泛型类型中。

泛型方法声明：如下

public static int FunctionName<T>(T value){...}

泛型方法的重载：
public void Function1<T>(T a);
public void Function1<U>(U a);
这样是不能构成泛型方法的重载。因为编译器无法确定泛型类型T和U是否不同，也就无法确定这两个方法是否不同

public void Function1<T>(int x);
public void Function1(int x);
这样可以构成重载

public void Function1<T>(T t) where T:A;
public void Function1<T>(T t) where T:B;

这样不能构成泛型方法的重载。因为编译器无法确定约束条件中的A和B是否不同，也就无法确定这两个方法是否不同

泛型方法重写：
在重写的过程中，抽象类中的抽象方法的约束是被默认继承的。如下：

复制代码代码如下:

abstract class Base
{
    public abstract T F<T,U>(T t,U u) where U:T;
    public abstract T G<T>(T t) where T:IComparable;
}

class MyClass:Base
{
    public override X F<X,Y>(X x,Y y){...}
    public override T G<T>(T t) where T:IComparable{}
}

对于MyClass中两个重写的方法来说
F方法是合法的，约束被默认继承
G方法是非法的，指定任何约束都是多余的

泛型约束：

1、C#泛型要求对“所有泛型类型或泛型方法的类型参数”的任何假定，都要基于“显式的约束”，以维护C#所要求的类型安全。
2、“显式约束”由where子句表达，可以指定“基类约束”，“接口约束”，“构造器约束”，“值类型/引用类型约束”共四种约束。
3、“显式约束”并非必须，如果没有指定“显式约束”，范型类型参数将只能访问System.Object类型中的公有方法。例如：在开始的例子中，定义的那个obj成员变量。比如我们在开始的那个例子中加入一个Test1类，在它当中定义两个公共方法Func1、Func2，如下图：

下面就开始分析这些约束：

基类约束：

复制代码代码如下:

class A
    {
        public void Func1()
        { }
    }

    class B
    {
        public void Func2()
        { }
    }

    class C<S, T>
        where S : A
        where T : B
    {
        public C(S s,T t)
        {
            //S的变量可以调用Func1方法
            s.Func1();
            //T的变量可以调用Func2方法
            t.Func2();
        }
    }
    

接口约束：

复制代码代码如下:

interface IA<T>
    {
        T Func1();
    }

    interface IB
    {
        void Func2();
    }

    interface IC<T>
    {
        T Func3();
    }

    class MyClass<T, V>
        where T : IA<T>
        where V : IB, IC<V>
    {
        public MyClass(T t,V v)
        {
            //T的对象可以调用Func1
            t.Func1();
            //V的对象可以调用Func2和Func3
            v.Func2();
            v.Func3();
        }
    }
    

构造器约束：

复制代码代码如下:

class A
        {
            public A()
            { }
        }

        class B
        {
            public B(int i)
            { }
        }

        class C<T> where T : new()
        {
            T t;
            public C()
            {
                t = new T();
            }
        }

        class D
        {
            public void Func()
            {
                C<A> c = new C<A>();
                C<B> d = new C<B>();
            }
        }
 

    d对象在编译时报错：The type B must have a public parameterless constructor in order to use it as parameter 'T' in the generic type or method C<T>
    注意：C#现在只支持无参的构造器约束
    此时由于我们为B类型写入了一个有参构造器，使得系统不会再为B自动创建一个无参的构造器，但是如果我们将B类型中加一个无参构造器，那么对象d的实例化就不会报错了。B类型定义如下：

复制代码代码如下:

        class B
        {
            public B()
            { }
            public B(int i)
            { }
        }
 

值类型/引用类型：

复制代码代码如下:

public struct A { }
        public class B { }

        public class C<T> where T : struct
        {

        }

        C<A> c1 = new C<A>();
        C<B> c2 = new C<B>();
 

c2对象在编译时报错：The type 'B' must be a non-nullable value type in order to use it as parameter 'T' in the generic type or methor 'C<T>'

总结：

1、C#的泛型能力由CLR在运行时支持，它既不同于C++在编译时所支持的静态模板，也不同于Java在编译器层面使用“擦拭法”支持的简单的泛型。
2、C#的泛型支持包括类、结构、接口、委托四种泛型类型，以及方法成员。
3、C#的泛型采用“基类，接口，构造器，值类型/引用类型”的约束方式来实现对类型参数的“显式约束”，它不支持C++模板那样的基于签名的隐式约束。

上一篇：C# Linq读取XML文件的实例

下一篇：C#生成XML的三种途径小结