• 介绍一个不错的轮子:MoreLINQ,原生LINQ增强,尤其适用于数据ETL/数据分析领域。


    对于一名非专业码农来说,使用轮子就是王道,同时作为一名数据分析方向的业务开发者,不得不承认,人家隔壁的python,许多轮子非常管用,特别是操作数据的pandas。

    最近刷到.net有一个MoreLINQ的轮子,对目前LINQ的一些增强,花了几天时间学习了一下,很多惊喜,特别对于一个做数据ETL为多的笔者来说,MoreLINQ太多为此而生的功能。

    独乐乐不如众乐乐,在此简单给大家做过引路者,希望更多人可以用上并喜欢它。

    MoreLINQ简介

    感谢社区的一篇文章,让笔者认识此轮子

    morelinq是对Linq to object的有力补充,国外有本书《Thinking in LINQ》专门花了一章的篇幅介绍了它,它的开发者也是《C# in Depth》作者。

    从github的星星和更新时间来看,算是比较热门的一个轮子,并且持续更新。

    MoreLINQ一些好用的方法功能

    笔者针对数据ETL和数据分析的应用场景中,发现了不少的惊喜功能,特别是类似SQL里的窗口分析函数的功能,尤为喜欢。简单列举下比较深刻的几点。

    • 返回最大值、最小值,分组计数等

    MaxBy、MinBy、CountBy

    • 集合的排列组合

    Permutations(排列), Subset(组合), Cartesian (笛卡尔积)

    • 集合的随机抽样

    RandomSubset (随机抽取子集),Shuffle(全集乱序)

    • 集合的LeftJoin/RightJoin/FullJoin

    • 集合的窗口、平移

    类似SQL的窗口函数效果,Window、WindowLeft、WindowRight、Lag/Lead等函数,会SQL的窗口函数,非常好理解。

    • 集合的分组

    Batch、Segment、

    • 集合转换成表

    ToDataTable

    • 表的行列互转

    Transpose

    • 序列的创建

    Generate、Repeat

    MoreLINQ的学习资源

    • 专门的examples 项目

    在作者的主页里,有另外一个专门的示例仓库,地址为:https://github.com/morelinq/examples ,里面部分扩展方法是有示例代码,非常遗憾,大多数还是等待追加状态。

    没有示例时,只能看描述和轮子的晦涩文档。

    • Mark Heath社区MVP的系列文章

    总共25篇文章及视频,详见以下网址: https://markheath.net/category/MoreLINQ

    https://www.youtube.com/watch?v=LmeTMUptJPo&list=PLzUdt2T2KyAdVmA681z98tpLQSagXBLdP&ab_channel=MarkHeath

    • 笔者手打的练习代码

    笔者通过上述两个资源,自己手打或复杂整理了一些示例代码,用linqpad来一边测试一边学习,算是掌握了一点点。有兴趣的可以下载一起学习。

    使用linqpad来测试代码,真的非常香,作者官方Example和本文的笔者的示例代码和linqpad的和谐版,一并打包给大家下载。

    关注公众号后台回复:morelinq,即可下载。

  • 相关阅读:
    富文本编辑器layedit,调用setContent方法会报错
    sqlserver2008事务日志已满
    解决asp.net上传文件时文件太大导致的错误
    完美版js金钱正则表达式校验
    jQuery实现清空table表格除首行外的所有数据
    textArea中的maxlength是无效的 解决办法
    jquery根据name属性查找
    fileupload页面跳转找不到原页面的解决方法
    xml获取属性值的方法
    读FCL源码系列之List<T>---让你知其所以然---内含疑问求大神指点
  • 原文地址:https://www.cnblogs.com/ExcelCuiHuaJi/p/13712905.html
Copyright © 2020-2023  润新知