题记
在阅读JDK源码java.util.Collections的时候在UnmodifiableCollection类中看到了这么一段代码:
public void forEach(Consumer<? super E> action) { c.forEach(action); }
而Consumer的源码如下:
@FunctionalInterface public interface Consumer<T> { void accept(T t); default Consumer<T> andThen(Consumer<? super T> after) { Objects.requireNonNull(after); return (T t) -> { accept(t); after.accept(t); }; } }
乍一看让我费解了一下,但是回过神来发现这不就是Java8的新特性Lambda表达式吗。原来对于这些新特性只是了解一下,没注意到在JDK源码中也使用到了,所以抽时间看了一下Java的Lambda表达式。
Lambda演算
Lambda演算在wiki上的非形式化表述如下:
在λ演算中,每个表达式都代表一个函数,这个函数有一个参数,并且返回一个值。不论是参数和返回值,也都是一个单参的函数。可以这么说,λ演算中,只有一种“类型”,那就是这种单参函数。
函数是通过λ表达式匿名地定义的,这个表达式说明了此函数将对其参数进行什么操作。例如,“加2”函数f(x)= x + 2可以用lambda演算表示为λx.x + 2 (或者λy.y + 2,参数的取名无关紧要)而f(3)的值可以写作(λx.x + 2) 3。函数的应用(application)是左结合的:f x y =(f x) y。
考虑这么一个函数:它把一个函数作为参数,这个函数将被作用在3上:λf.f 3。如果把这个(用函数作参数的)函数作用于我们先前的“加2”函数上:(λf.f 3)(λx.x+2),则明显地,下述三个表达式:
(λf.f 3)(λx.x+2) 与 (λx.x + 2) 3 与 3 + 2
是等价的。有两个参数的函数可以通过lambda演算这么表达:一个单一参数的函数的返回值又是一个单一参数的函数(参见Currying)。例如,函数f(x, y) = x - y可以写作λx.λy.x - y。下述三个表达式:
(λx.λy.x - y) 7 2 与 (λy.7 - y) 2 与 7 - 2
也是等价的。然而这种lambda表达式之间的等价性无法找到一个通用的函数来判定。
详细的形式化表述请跳转Lambda演算
Java中的Lambda表达式
在Java中Lambda表达式可以有多个参数,在JSR335-FINAL(Java Specification Requests)中对Java中Lambda表达式的形式定义如下:
LambdaExPRession: LambdaParameters '->' LambdaBody LambdaParameters: Identifier '(' FormalParameterListopt ')' '(' InferredFormalParameterList ')' InferredFormalParameterList: Identifier InferredFormalParameterList ',' Identifier LambdaBody: Expression Block The following definitions from 8.4.1 are repeated here for convenience: FormalParameterList: LastFormalParameter FormalParameters ',' LastFormalParameter FormalParameters: FormalParameter FormalParameters, FormalParameter FormalParameter: VariableModifiersopt Type VariableDeclaratorId LastFormalParameter: VariableModifiersopt Type '...' VariableDeclaratorId FormalParameter
举例如下 Examples of lambda expressions:
() -> {} // No parameters; result is void () -> 42 // No parameters, expression body () -> null // No parameters, expression body () -> { return 42; } // No parameters, block body with return () -> { System.gc(); } // No parameters, void block body () -> { if (true) return 12; else { int result = 15; for (int i = 1; i < 10; i++) result *= i; return result; } } // Complex block body with returns (int x) -> x+1 // Single declared-type parameter (int x) -> { return x+1; } // Single declared-type parameter (x) -> x+1 // Single inferred-type parameter x -> x+1 // Parens optional for single inferred-type case (String s) -> s.length() // Single declared-type parameter (Thread t) -> { t.start(); } // Single declared-type parameter s -> s.length() // Single inferred-type parameter t -> { t.start(); } // Single inferred-type parameter (int x, int y) -> x+y // Multiple declared-type parameters (x,y) -> x+y // Multiple inferred-type parameters (final int x) -> x+1 // Modified declared-type parameter (x, final y) -> x+y // Illegal: can't modify inferred-type parameters (x, int y) -> x+y // Illegal: can't mix inferred and declared types
注意,在形式参数中推导参数和声明参数不能混用。(Inferred-type parameters的类型是编译的时候从上下问中推断出来的,比如说是借口定义时指定的参数)
Java SE 8: Lambda Quick Start
以下例子摘自 Oracle-Java SE 8: Lambda Quick Start
Runnable Lambda
public class LambdaTest { public static void main(String[] args) { LambdaTest LT = new LambdaTest(); LT.runnableTest(); LT.comparatorTest(); } public void runnableTest() { System.out.println("=== RunnableTest ==="); // Anonymous Runnable Runnable r1 = new Runnable() { @Override public void run() { System.out.println("Hello world one!"); } }; // Lambda Runnable Runnable r2 = () -> { System.out.println("Hello world two!"); System.out.println("Hello world three!"); }; // Run em! r1.run(); r2.run(); } }
上面代码用Lambda表达式代替了*New*操作和*run*方法的定义,使得代码更为简洁。
Comparator Lambda
class Person { public String surName; public Person(String surName) { super(); this.surName = surName; } public void printName() { System.out.println(this.surName); } } public void comparatorTest() { List<Person> personList = new ArrayList<Person>(); personList.add(new Person("B")); personList.add(new Person("A")); // // Sort with Inner Class // Collections.sort(personList, new Comparator<Person>() { // public int compare(Person p1, Person p2) { // return p1.surName.compareTo(p2.surName); // } // }); // // System.out.println("=== Sorted Asc SurName ==="); // for (Person p : personList) { // p.printName(); // } // Use Lambda instead // Print Asc System.out.println("=== Sorted Asc SurName ==="); Collections.sort(personList, (p1, p2) -> p1.surName.compareTo(p2.surName)); for (Person p : personList) { p.printName(); } // Print Desc System.out.println("=== Sorted Desc SurName ==="); Collections.sort(personList, (p1, p2) -> p2.surName.compareTo(p1.surName)); for (Person p : personList) { p.printName(); } }
这里则是用Lambda表达式代替了匿名的对象*Comparator*的作用。
Function
原先我以为Lambda表达式的加入只是一个简单的语法糖,但是后面发现还有更多的语法糖。设想一下如果你需要对一个List的数据做判断和筛选,通常我们会按照下面这种一般做法。
public class Person { public String givenName; public String surName; public int age; public Gender gender; public String eMail; public String phone; public String address; //getters and setters //... } public class RoboContactMethods2 { public void callDrivers(List<Person> pl){ for(Person p:pl){ if (isDriver(p)){ roboCall(p); } } } public boolean isDriver(Person p){ return p.getAge() >= 16; } public void roboCall(Person p){ System.out.println("Calling " + p.getGivenName() + " " + p.getSurName() + " age " + p.getAge() + " at " + p.getPhone()); } }
这样如果有多个过滤条件的需求,就需要实现更多的判断函数,那么更文艺一些的做法是这样的(还是用上面的Person对象举例):
public interface MyTest<T> { public boolean test(T t); } public class RoboContactAnon { public void phoneContacts(List<Person> pl, MyTest<Person> aTest){ for(Person p:pl){ if (aTest.test(p)){ roboCall(p); } } } public void roboCall(Person p){ System.out.println("Calling " + p.getGivenName() + " " + p.getSurName() + " age " + p.getAge() + " at " + p.getPhone()); } public static void main (String[] args) { //get PersonList for testing. List<Person> pl = getInitedPersonList(); RoboContactAnon rca = new RoboContactAnon(); rca.phoneContacts(pl, (p) -> p.getAge() > 16); } }
我们这里使用了一个自定义的*MyTest*接口,但是其实我们不需要自己定义这个接口,因为在Java SE 8中,JDK为我们提供了一系列的接口供我们使用,比如我们的*MyTest*接口就可以用系统提供的*Predicte*接口进行替代,它的定义跟MyTest类似:
public interface Predicate<T> { public boolean test(T t); }
除了Predicte,JDK还提供了一系列的接口供我们在不同的场景使用。它们在java.util.function包中。下面是列举的是JDK提供的一部分接口:
- Predicate: A property of the object passed as argument - Consumer: An action to be performed with the object passed as argument - Function: Transform a T to a U - Supplier: Provide an instance of a T (such as a factory) - UnaryOperator: A unary operator from T -> T - BinaryOperator: A binary operator from (T, T) -> T
Collections
除了上面提到的语法糖,和java.util.function包以外,Java SE 8还增加了java.util.stream,这是对Collections对象起到了一定的增强。考虑以下场景“你需要对一个List根据一定的条件对元素进行过滤,然后求过滤后元素某个属性的平均值”。我们的做法一般是这样:
//仍旧以List<Person>举例 double sum = 0; int count = 0; for (Person p : personList) { if (p.getAge() > 0) { sum += p.getAge(); cout++; } } double average = count > 0 ? sum/average : 0;
如果我们使用stream的话,就可以用更文艺一点的写法:
// Get average of ages OptionalDouble averageAge = pl .stream() .filter((p) -> p.getAge() > 16) .mapToDouble(p -> p.getAge()) .average();
可以看到这样写的话代码确实更简洁了,它把List转换成一个Stream,然后对元素进行操作。而且如果我们做的操作对元素的顺序没有要求那么我们可以将stream()方法换成parallelStream()方法,这样可以得到一个可以并行处理的流,当我们对元素进行处理的时候,JVM会把这个流进行划分,对每一个部分并行的进行处理,然后再进行归并,这样可以提高处理的效率,而这些对开发人员是透明的。
划分,映射,归并,这些听起来有没有觉得很熟悉,对,这就是MapReduce,只是跟Hadoop用机器作为处理节点不一样的是这里对于划分的处理是在一个JVM里面进行的。在java.util.stream中给我们提供了一个通用的reduce()方法:
<U> U reduce(U identity, BiFunction<U, ? super T, U> accumulator, BinaryOperator<U> combiner); int sumOfWeights = widgets.stream() .reduce(0, (sum, b) -> sum + b.getWeight()), Integer::sum);
其中identity是一个reduce的初始值,如果没有元素进行reduce的话则返回identitiy值,如果有元素进行reduce则在identity上进行累加。accumulator是一个累加器,负责把部分结果与另一个元素进行累加,combiner则是一个合并器,负责把不同部分的子结果进行合并,取得最终的结果。这里如果所进行的运算对元素的元素没有要求的话我们可以使用parallelStream(),取得一个并行的流,这样才能对流进行划分和并行处理,充分发挥这些新特性的性能。
将一个输入的collection做转换也是可以的比如下面的例子就返回了元素中某个属性的List:
<R> R collect(Supplier<R> supplier, BiConsumer<R, ? super T> accumulator, BiConsumer<R, R> combiner); ArrayList<String> strings = stream.collect(() -> new ArrayList<>(), (c, e) -> c.add(e.toString()), (c1, c2) -> c1.addAll(c2)); List<String> strings = stream.map(Object::toString) .collect(ArrayList::new, ArrayList::add, ArrayList::addAll);
有可能你觉得这不是KV对操作,不像MapReduce,那么你可以将结果映射成一个Map,这就是妥妥的KV对了,这个操作需要使用到groupingBy(Collection collection)方法:
Collector<Employee, ?, Integer> summingSalaries = Collectors.summingInt(Employee::getSalary); Map<Department, Integer> salariesByDept = employees.stream().collect(Collectors.groupingBy(Employee::getDepartment, summingSalaries));
以上只是对于stream的简单举例,详情请阅读[JSR335-FINAL]中关于java.util.stream的部分。
后记
起初我认为这些新特性只是一些语法糖,现在我也还认为这个特性是个语法糖。虽然在开发过程中很少用到这个新特性(甚至都不会用到),但是了解这些新特性总是没有坏除的,恰当的使用这些新特性在某些场景下的确可以取得很好的效果(简洁的代码,优秀的性能)。这篇文章的初衷一是对自己所得的记录,二是做一个分享。写得不好的或者谬误的地方还请大家批评指正,一起交流,共同进步。
参考文献
Lambda演算-wikipedia
JSR335-FINAL(Java Specification Requests)
Oracle-Java SE 8: Lambda Quick Start
My Github
新闻热点
疑难解答