Scala（2.12）之collection基本操作

map源码

//第一个参数传入一个函数,第二个参数为隐式参数，返回值和集合的类型一致都是B
def map[B, That](f: A => B)(implicit bf: CanBuildFrom[Repr, B, That]): That = {
//方法内部定义builder方法
    def builder = { // extracted to keep method size under 35 bytes, so that it can be JIT-inlined
    //调用repr方法
      val b = bf(repr)
      b.sizeHint(this)
      b
    }
    //将上述builder方法的返回值赋值给b
    val b = builder
    for (x <- this) b += f(x)
   //调用result方法,返回一个集合
    b.result
  }

总结：

1）map方法将某个函数应用到集合中的每个元素，并产生一个新集合。
2）新产生集合的个数等于原集合的个数，个数大于原元素就会形成集合嵌套
3）元素(eg:String)应用到map方法传递的函数(eg elem=>elem.split(""))后产生的元素大于原元素，此时生成一个集合，最后形成一个集合嵌套
4）进行map的对象是只含一层的集合

flatten：没有源码分析后续补充　　

总结　　

1）使用没用参数；
2）String最终会被扁平化到字符
3）返回的是集合
4）进行flatten的对象是可以嵌套的的集合

flatmap

总结

1）输入什么集合，返回什么集合
2）flatmap方法传递的函数的参数是字符串
3）flatMap返回的个数则是不同与原集合个数
4）flatMap = map + flatten 即先对集合中的每个元素进行map，再对map后的每个元素（map后的每个元素必须还是集合）中的每个元素进行flatten
5）进行map的对象可以是只含一层的集合，但进行flatten操作的对象必需是至少含两层的集合

filter ： filter方法可以对集合中的每一条数据进行筛选过滤　　

总结

1）输入什么类型集合，返回什么类型集合
2）满足条件（true）的数据保留，不满足条件(false)的数据丢弃

groupby

源码分析

def groupBy[K](f: A => K): immutable .Map [K,, Repr] = {
//创建一个可变map对象m->【k:K v:mutable.Bulder[A,Repr]】
//Bulder 元素为A，构建类型为Repr,它可以通过+=来向构造器中添加元素，通过result返回得到一个任意类型的集合

  val m: mutable.Map[K, mutable.Builder[A, Repr]] = mutable.Map.empty[K, Builder[Aj Repr]] 

//遍历集合，向m中添加元素，key为传过来的集合中的元素通过函数f()计算返回的结果，
//如果该key是在m中没有，则创建一个元素类型为A,构建类型为Repr的Builder对象放入value中，
//并让bldr指向该Builder对象，向bldr中添加元素elem(事实上是向m的value中添加elem)
/*

举例： 第一次f()计算结果是1，elem是"a"，由于是第一次，则创建新的Builder给V，
此时m = （1 -> (“a”)）,第二次f()计算结果还是1，elem是"b"，
此时m=（1 ->（“a”,“b”））,第三次f()计算结果变成2了，elem是"c"，
由于key->2第一次出现，则创建新的Builder，此时m=（1 ->（“a”,“b”）,2 -> (“c”)）

*/
for (elem <- this) {
    val key: K = f(elem)
    val bldr： mutable.Builder[A, Repr] = m.getOrElseUpdate(key, newBuilder) bldr += elem
  }
//创建一个构造器b,元素类型是Tupple2(K,Repr),构建类型是Map(K,Repr),遍历m，
//向b中添加k和v,将m的数据导入到构造器b中 调用result输出集合
  val b: mutable.Builder[(K, Repr), Map[K, Repr]] = immutable.Map.newBuilder[K,, Repr] 
for ((k, v) <- m)
    b += ((k, v.result))
  b.result

总结

1) groupBy传入的参数f(A)=>K,  A为调用函数的集合元素类型，K为输出map的key。
2) 输出map的value类型为调用函数的集合的类型

sortby

源码

//sortBy最后也是调用的sorted方法，隐式参数Ordering作用混入了Java的Comparator接口
//提供一个外部比较器

 def sortBy[B](f: A => B)(implicit ord: Ordering[B]): Repr = sorted(ord on f)
//sorted源码
 def sorted[B >: A](implicit ord: Ordering[B]): Repr = {
    val len = this.length
    val arr = new ArraySeq[A](len)
    var i = 0
    for (x <- this.seq) {
      arr(i) = x
      i += 1
    }
//sorted方法真正排序的逻辑是调用的java.util.Arrays.sort
//java中的sort用快速排序和优化的归并排序
//快速排序主要是对那些基本类型数据（int,short,long等）排序， 而归并排序用于对Object类型进行排序。
    java.util.Arrays.sort(arr.array, ord.asInstanceOf[Ordering[Object]])
    val b = newBuilder
    b.sizeHint(len)
    for (x <- arr) b += x
    b.result
  }

总结

java sort总结：
1）首先先判断需要排序的数据量是否大于60。
2）小于60：使用插入排序，插入排序是稳定的
3）大于60的数据量会根据数据类型选择排序方式：
         基本类型：使用快速排序。因为基本类型。1、2都是指向同一个常量池不需要考虑稳定性。
         Object类型：使用归并排序。因为归并排序具有稳定性。
4）注意：不管是快速排序还是归并排序。在二分的时候小于60的数据量依旧会使用插入排序

scala sort总结：
1）升序默认
2）"Hello Scala" compare "Hello React" 第一个单词首字母相同，比较第二个单词首字母
3)  Ordering.Int.reverse;隐式参数Ordering来做倒序排序

mapValues 2.13scala已经弃用

总结

1）处理什么集合，返回什么集合
Let's say we have a Map[A,B]. For clarification: I'm always referring to an immutable Map.
mapValues takes a function B => C, where C is the new type for the values.

本文为原创文章，转载请标明出处

相关阅读:
007 连接
 006 group by having
005 运算null 排序模糊查询聚合函数
 004 列、distinct、between、in、null
003 约束和关系
 002 表的概念操作
 5-04用Sql语句创建表
 5-03使用视图创建表
 5-01表达基本概念
 4-04数据库的备份与还原
原文地址：https://www.cnblogs.com/harden13/p/14810188.html