解開lambda最強作用的神祕面紗

摘要: 這篇文章將深入解析Java集合裏面的批量數據操作（bulk operation）
我們期待了很久lambda爲java帶來閉包的概念，但是如果我們不在集合中使用它的話，就損失了很大價值。現有接口遷移成爲lambda風格的問題已經通過default methods解決了，在這篇文章將深入解析Java集合裏面的批量數據操作（bulk operation），解開lambda最強作用的神祕面紗。
1.關於JSR335

JSR是Java Specification Requests的縮寫，意思是Java 規範請求,Java 8 版本的主要改進是 Lambda 項目（JSR 335），其目的是使 Java 更易於爲多核處理器編寫代碼。JSR 335=lambda表達式+接口改進（默認方法）+批量數據操作。加上前面兩篇，我們已是完整的學習了JSR335的相關內容了。
2.外部VS內部迭代

以前Java集合是不能夠表達內部迭代的，而只提供了一種外部迭代的方式，也就是for或者while循環。
List persons = asList(new Person("Joe"), new Person("Jim"), new Person("John"));
for (Person p :  persons) {
   p.setLastName("Doe");
}
上面的例子是我們以前的做法，也就是所謂的外部迭代，循環是固定的順序循環。在現在多核的時代，如果我們想並行循環，不得不修改以上代碼。效率能有多大提升還說定，且會帶來一定的風險（線程安全問題等等）。 
要描述內部迭代，我們需要用到Lambda這樣的類庫,下面利用lambda和Collection.forEach重寫上面的循環 
persons.forEach(p->p.setLastName("Doe"));
現在是由jdk 庫來控制循環了，我們不需要關心last name是怎麼被設置到每一個person對象裏面去的，庫可以根據運行環境來決定怎麼做，並行，亂序或者懶加載方式。這就是內部迭代，客戶端將行爲p.setLastName當做數據傳入api裏面。 
內部迭代其實和集合的批量操作並沒有密切的聯繫，藉助它我們感受到語法表達上的變化。真正有意思的和批量操作相關的是新的流（stream）API。新的java.util.stream包已經添加進JDK 8了。
3.Stream API

流（Stream）僅僅代表着數據流，並沒有數據結構，所以他遍歷完一次之後便再也無法遍歷（這點在編程時候需要注意，不像Collection，遍歷多少次裏面都還有數據），它的來源可以是Collection、array、io等等。
3.1中間與終點方法

流作用是提供了一種操作大數據接口，讓數據操作更容易和更快。它具有過濾、映射以及減少遍歷數等方法，這些方法分兩種：中間方法和終端方法，“流”抽象天生就該是持續的，中間方法永遠返回的是Stream，因此如果我們要獲取最終結果的話，必須使用終點操作才能收集流產生的最終結果。區分這兩個方法是看他的返回值，如果是Stream則是中間方法，否則是終點方法。具體請參照Stream的api。

簡單介紹下幾個中間方法（filter、map）以及終點方法（collect、sum）
3.1.1Filter

在數據流中實現過濾功能是首先我們可以想到的最自然的操作了。Stream接口暴露了一個filter方法，它可以接受表示操作的Predicate實現來使用定義了過濾條件的lambda表達式。
List persons = …
Stream personsOver18 = persons.stream().filter(p -> p.getAge() > 18);//過濾18歲以上的人
3.1.2Map
假使我們現在過濾了一些數據，比如轉換對象的時候。Map操作允許我們執行一個Function的實現（Function<T,R>的泛型T,R分別表示執行輸入和執行結果），它接受入參並返回。首先，讓我們來看看怎樣以匿名內部類的方式來描述它：
Stream adult= persons
              .stream()
              .filter(p -> p.getAge() > 18)
              .map(new Function() {
                  @Override
                  public Adult apply(Person person) {
                     return new Adult(person);//將大於18歲的人轉爲成年人
                  }
              });
現在，把上述例子轉換成使用lambda表達式的寫法：
Stream map = persons.stream()
                    .filter(p -> p.getAge() > 18)
                    .map(person -> new Adult(person));
3.1.3Count

count方法是一個流的終點方法，可使流的結果最終統計，返回int，比如我們計算一下滿足18歲的總人數
int countOfAdult=persons.stream()
                       .filter(p -> p.getAge() > 18)
                       .map(person -> new Adult(person))
                       .count();
3.1.4Collect

collect方法也是一個流的終點方法，可收集最終的結果
List adultList= persons.stream()
                       .filter(p -> p.getAge() > 18)
                       .map(person -> new Adult(person))
                       .collect(Collectors.toList());
或者，如果我們想使用特定的實現類來收集結果：
List adultList = persons
                 .stream()
                 .filter(p -> p.getAge() > 18)
                 .map(person -> new Adult(person))
                 .collect(Collectors.toCollection(ArrayList::new));

篇幅有限，其他的中間方法和終點方法就不一一介紹了，看了上面幾個例子，大家明白這兩種方法的區別即可，後面可根據需求來決定使用。
3.2順序流與並行流

每個Stream都有兩種模式：順序執行和並行執行。
順序流：
List <Person> people = list.getStream.collect(Collectors.toList());
並行流：
List <Person> people = list.getStream.parallel().collect(Collectors.toList());
顧名思義，當使用順序方式去遍歷時，每個item讀完後再讀下一個item。而使用並行去遍歷時，數組會被分成多個段，其中每一個都在不同的線程中處理，然後將結果一起輸出。
3.2.1並行流原理：

List originalList = someData;
split1 = originalList(0, mid);//將數據分小部分
split2 = originalList(mid,end);
new Runnable(split1.process());//小部分執行操作
new Runnable(split2.process());
List revisedList = split1 + split2;//將結果合併
大家對hadoop有稍微瞭解就知道，裏面的 MapReduce  本身就是用於並行處理大數據集的軟件框架，其 處理大數據的核心思想就是大而化小，分配到不同機器去運行map，最終通過reduce將所有機器的結果結合起來得到一個最終結果，與MapReduce不同，Stream則是利用多核技術可將大數據通過多核並行處理，而MapReduce則可以分佈式的。
3.2.2順序與並行性能測試對比

如果是多核機器，理論上並行流則會比順序流快上一倍，下面是測試代碼
long t0 = System.nanoTime();

        //初始化一個範圍100萬整數流,求能被2整除的數字，toArray（）是終點方法

        int a[]=IntStream.range(0, 1_000_000).filter(p -> p % 2==0).toArray();

        long t1 = System.nanoTime();

        //和上面功能一樣，這裏是用並行流來計算

        int b[]=IntStream.range(0, 1_000_000).parallel().filter(p -> p % 2==0).toArray();

        long t2 = System.nanoTime();

        //我本機的結果是serial: 0.06s, parallel 0.02s，證明並行流確實比順序流快

        System.out.printf("serial: %.2fs, parallel %.2fs%n", (t1 - t0) * 1e-9, (t2 - t1) * 1e-9);
3.3關於Folk/Join框架

應用硬件的並行性在java 7就有了，那就是 java.util.concurrent 包的新增功能之一是一個 fork-join 風格的並行分解框架，同樣也很強大高效，有興趣的同學去研究，這裏不詳談了，相比Stream.parallel()這種方式，我更傾向於後者。
4.總結

如果沒有lambda，Stream用起來相當彆扭，他會產生大量的匿名內部類，比如上面的3.1.2map例子，如果沒有default method，集合框架更改勢必會引起大量的改動，所以lambda+default method使得jdk庫更加強大，以及靈活，Stream以及集合框架的改進便是最好的證明。
java 8特性探究系列寫了3篇了，作爲大餐，將java 8的重量級特性lambda與default method寫在前面，下篇上個小菜，葷素搭配，也是語言相關的，JEP104 Java 類型的註解的探究，同時謝謝大家的支持，歡迎提出建議。如果你想了解哪些特性，歡迎給我發留言。
轉載時候請註明出處。 http://my.oschina.net/benhaile 

根據userCode分組，並統計每個userCode的個數
Map map=list.stream().collect(Collectors.groupingBy(User::getUserCode,Collectors.counting()));
根據userCode分組，並統計另一個字段的和
Map<Long,DoubleSummaryStatistics> dou=details.stream()
                .collect(Collectors.groupingBy(User::getUserCode,Collectors.summarizingDouble(v-> v.getAmount().doubleValue())));

//1.獲得最大最小值(persons爲List<Person>)
Function<Person, Integer> getLevel = p->p.age; 
Comparator<Person> comparator = Comparator.comparing(getLevel);
Optional<Person> maxOptional=persons.stream.collect(Collectors.maxBy(comparator));
Optional<Person> minOptional=list.stream().collect(Collectors.minBy(comparator));
if (optional.isPresent()){
   return minOptional.get();
} 

IntSummaryStatistics intSummaryStatistics = persons.stream().mapToInt(person-> person.getAge()).summaryStatistics();  
    System.out.println("最大年齡："+intSummaryStatistics.getMax()); //最大值  
    System.out.println("最小年齡："+intSummaryStatistics.getMin()); //最小值  
    System.out.println("年齡總和："+intSummaryStatistics.getSum()); //總計  
    System.out.println("人數："+intSummaryStatistics.getCount());   //個數  
    System.out.println("平均年齡："+intSummaryStatistics.getAverage());//平均數返回的是double類型  
求和
list.stream().mapToDouble(s->s.getAmount().doubleValue()).sum()
解開lambda最強作用的神祕面紗

再談23種設計模式（3）：行爲型模式（學習筆記）

Power Automate Desktop 安裝完，登錄後老是提示one driver 錯誤

微前端學習筆記(4):從微前端到微模塊之EMP與hel-micro方案探索

微前端學習筆記（1）：微前端總體架構概述，從微服務發微

985 碩士程序員，空窗 4 個月沒有 Offer！

一文搞懂 Spring 循環依賴

賽博鬥地主——使用大語言模型扮演Agent智能體玩牌類遊戲。

VScode右鍵打開(添加到右鍵)

記一次 .NET某工控視覺自動化系統卡死分析

WindowsServer--SQL Server搭建主從同步實現讀寫分離 - 事務性分發

springboot（二）添加logback日誌

解開lambda最強作用的神祕面紗

java 壓縮rar文件

一些React-Native學習資料

redisUtils

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結