• jeff dean的主页


    https://ai.google/research/people/jeff/

    上面有他的很多论文和ppt
    很不错

    我于1999年中期加入Google,目前是研究小组的Google高级研究员,负责Google Brain项目。我感兴趣的领域包括大型分布式系统,性能监控,压缩技术,信息检索,机器学习在搜索和其他相关问题中的应用,微处理器体系结构,编译器优化以及新产品的开发,这些新产品以新颖有趣的方式组织了现有信息。方法。在Google期间,我从事以下项目:
    Google广告服务系统初始版本的设计和实现。
    我们五代爬网,索引和查询服务系统的设计和实现,涵盖了搜索文档数量,每秒处理的查询数量以及系统更新频率的两个和三个数量级的增长。我最近在WSDM'09上发表了有关构建大型检索系统(幻灯片)的一些问题的演讲。
    Google的AdSense内容广告产品的初步开发(涉及生产服务系统的设计和实施,以及基于页面内容开发和提高广告选择质量的工作)。
    协议缓冲区的开发,一种以有效但可扩展的格式对结构化数据进行编码的方法,以及一种可生成方便的包装器以使用多种语言处理对象的编译器。Google几乎在所有RPC协议中广泛使用协议缓冲区,并在各种持久性存储系统中存储结构化信息。协议缓冲区实现的一个版本已开源,可从http://code.google.com/p/protobuf/获得。
    Google新闻产品的某些初始生产服务系统可以与克里希纳·巴拉特(Krishna Bharat)合作,将他组装的原型系统移至已部署的系统中。我们的搜索排名算法的某些方面,尤其是改进了处理诸如锚文本之类的页面外信号的处理。
    我们第一代用于管理机器集群的自动化作业调度系统的设计和实现。
    快速开发和试验新排名算法的原型基础架构的设计和实现。
    MapReduce的设计和实现,该系统可简化大规模数据处理应用程序的开发。关于MapReduce的论文出现在OSDI'04中。
    BigTable的设计和实现,BigTable是在许多Google产品之下使用的大型半结构化存储系统。关于BigTable的论文发表在OSDI'06中。
    Google Translate(我们的统计机器翻译系统)的一些生产系统设计。特别是,我设计并实现了一个用于分布式高速访问非常大的语言模型(太大而无法容纳在一台机器上的内存)的系统。
    一些内部工具可简化快速搜索我们内部源代码存储库的过程。这个内部工具产生的许多想法都整合到了我们的Google代码搜索产品中,其中包括使用正则表达式搜索大量源代码的功能。
    用于大规模培训和部署深度学习模型的两代系统的设计和实现:DistBelief和TensorFlow。TensorFlow现在是一个开源项目,托管在GitHub上。

  • 相关阅读:
    Mina之session
    进程管理
    Mina之polling
    用户和组ID
    Mina之service
    同步化、同步及异步操作
    高级进程管理
    一般文件I/O用法建议
    有一个图像搜索引擎
    图像处理和识别和机器学习源码
  • 原文地址:https://www.cnblogs.com/cutepig/p/11667777.html
Copyright © 2020-2023  润新知