欢迎大家关注我们的网站和系列教程:http://panchuang.net/ ,学习更多的机器学习、深度学习的知识!
作者:Walker
No1:NVIDIA’s vid2vid Technique(英伟达提出的一种从视频到视频转换的技术)https://github.com/NVIDIA/vid2vid图像到图像的转换领域早已取得了巨大的突破,然而视频处理领域直到现在也鲜有看到实质性的成果。
NVIDIA在使用深度学习进行图像和视频处理方面一直处于领先的地位,他们开源了一种技术,可以进行视频到视频的转换,并取得了令人兴奋的结果。他们在GitHub上公开了他们的代码,代码是利用PyTorch实现的,我们可以访问网址(https://github.com/NVIDIA/vid2vid)立即体验vid2vid技术。那么,vid2vid技术究竟可以做什么呢?
- 将语义标签转换为逼真的真实世界视频
- 从边缘映射创建多个输出来合成人物
- 从给定的姿势生成人体(不仅仅是结构,而是整个身体!)
如果我们在强化学习领域工作或研究过,就明白复制现有方法是多么困难。Dopemine是一个谷歌开源的TensorFlow框架,希望能够加速该领域的进展并使其更加灵活和可重复。
如果你一直想学习强化学习,但又害怕它有多复杂,那么这个库就是一个千载难逢的学习机会。我们可以从这里访问这个github库(https://github.com/google/dopamine),该代码仅提供15个Python文件,还随附详细文档和免费数据集!
No3:Automating Object Detection(自动化目标检测)https://github.com/yaksoy/SemanticSoftSegmentation
目标检测技术在深度学习中蓬勃发展,但对于新手来说这可能是一项艰巨的挑战。要映射多少像素和帧?如何提高一个基本模型的准确性?甚至从哪里开始学起?而现在你不需要为此烦恼太多了——得益于MIT的算法,它能够以惊人的精度自动的进行目标检测。
他们的方法被称为“语义软分割(SSS)”。从此我们不再需要花费10分钟手动的去编辑,通过SSS方法我们可以在几秒钟内完成!上面的图片很好地说明了该算法的工作原理,以及在我们的机器上实现它时的外观。关于该方法更详细的介绍,我们可以访问以下的github库:https://github.com/yaksoy/SemanticSoftSegmentation
No4:Human Pose Estimation(人体姿态估计)https://github.com/Microsoft/human-pose-estimation.pytorch
人体姿态估计今年引起了研究人员的极大兴趣,麻省理工等出版物发表的研究报告,标志着该领域取得了显著的进展。从帮助老年人获得正确的治疗到商业应用(如:制作人体虚拟舞蹈),姿势估计有望成为商业上的下一个最佳案例。
这个存储库是微软官方正式使用PyTorch实现他们的流行论文——人体姿势估计和跟踪的简单基线(https://arxiv.org/abs/1804.06208)。他们提供了足够好的基线模型和基准,有望激发这一研究领域的新思路。
No5:Chorrrds(一个优秀的音乐数据分析和处理R语言软件包)https://github.com/r-music/chorrrds
这个package适用于所有的R语言用户。通常,我们会从CRAN下载R软件包,很少有人专门去GitHub下载,但这个package是我认为非常有趣的软件包。Chorrrds可帮助我们提取、分析和整理音乐和弦。它甚至预先加载了几个音乐数据集。
实际上,我们可以直接从CRAN安装它,或使用devtools包从GitHub下载。