最近在社交平台发了几篇Laxcus集群操作系统的文章,留言里有很多网友问Laxcus集群操作系统是什么,做什么用,有没有同类产品,相比同类产品有哪些优缺点,一堆的问题...然后我在留言版里一一做了解释,但是还是有人不理解,仍然有人在问,所以今天拿三张图出来,再展开讲一下。为了不占用各位太多时间,就紧凑地说说,不谈太技术的内容,只做通俗讲解。如果有不明白,再私信留言交流。
先看第一张图,这是Laxcus集群操作系统的产品定位。相比基于手机的安卓/IOS操作系统,基于PC的Windows/Macintosh操作系统,基于服务器的Unix/Linux,Laxcus是一个基于计算机集群的操作系统。对,没有错,各位没有看错,我也没有写错,Laxcus是专门针对计算机集群的操作系统,它运行在很多被网络连接起来的服务器上,以分布和并行的方式管理着这些服务器。计算机集群的规模,小到几台服务器,大到数十万台服务器,Laxcus集群操作系统都可以支持。集群运行过程是弹性的,可以随时增加服务器,也能够撤出来。不论增加或者撤出,只要符合冗余规则,都不影响集群整体运行。
说下计算机集群的管理。Laxcus运行在这么大规模的计算机集群上,那么集群的管理应该是个大问题吧?比如宕机、超载、网络流量阻塞的情况怎么办?不用担心,在操作系统层面,这些问题已经充分考虑到了。Laxcus内置一套资源管理方案,它基于三种机制来管理计算机集群:松耦合架构、自适应策略,DFL3人工智能模型来管理计算机集群的物理资源。包括计算机集群的网络通信、资源分配、任务调度、数据流量控制、应用软件的运行,都在它们的管理范围内。这种管理制度,保证计算机集群总是处在一个最佳的运行环境中。管理过程完全智能化,基本都是集群自主决策自主处理,不需要人工干预。这些情况,用户看不到,管理员也只是通过管理界面接口才能接触。只有在个别情况下,Laxcus集群操作系统无法解决时,才通知管理员以人工方式来解决。比如服务器的内存空间不够了,或者磁盘快用尽的时候。所以,Laxcus是一个自动化和智能化很强的操作系统。
第二张图,这是Laxcus集群操作系统已经集成和支持的功能。第一项是虚拟化。如果用过VMWare、Xen等虚拟软件的网友肯定知道虚拟化是什么意思,但是不了解也没有关系,我通俗地说一下:虚拟化就是把一台服务器切成N台服务器的技术,包括CPU、内存、磁盘、网络带宽,都进行切割。这样从表面上看,就好象一下子拥有了很多服务器一样。虚拟化最大的优势是实现了物理资源的虚拟复用,让很多人可以同时互不影响地使用同一台服务器,对降低使用成本和提高使用效率都是很大提升。因为Laxcus集群操作系统管理着很多的服务器,如果只给一个用户或者几个用户使用,那肯定是巨大的资源浪费,所以Laxcus集群操作系统也设计了虚拟化的功能。不过,与虚拟服务器不一样的是,Laxcus虚拟出来的还是计算机集群,就是把一个物理集群切割成N个逻辑集群。当每个用户登录进来,Laxcus集群操作系统会根据用户需求,分配其中一组虚拟集群给他使用,用户退出登录后,虚拟集群再被Laxcus回收,等待给后续用户使用,实现集群资源的最大化复用。
第二项是大数据。大数据这个词想必大家肯定听得多了,现在社会上很多事情都能和大数据联系起来,比如象大数据杀熟之类的话题。Laxcus提供的是处理大数据的技术和功能,这个Laxcus一直以来最核心的功能。在早期版本里,Laxcus主要是围绕着大数据来设计,现在已经相当完善。相比象Hadoop这样由很多软件模块组合起来的大数据运行框架,Laxcus实现的是一套完整的大数据体系,其中大部分功能都做了内置处理。比如支持OLTP业务的数据库、支持OLAP业务的数据仓库,都内置在Laxcus集群操作系统里面。提供给用户的只是远程操作命令和编程使用的API接口,用户可以透明地操作自己的数据,完全不必了解底层细节。经过许多年实践使用下来,Laxcus大数据无论在系统设计、功能集成、数据规模、场景对接、适用领域、安全控制、应用开发、维护管理、语言语种等方面,都远比Hadoop完整、完善、完备、丰富。因为Laxcus大数据涉及的技术太多,限于篇幅原因,这里就不展开讲,有需要的话,另开一篇介绍。
第三项是人工智能,这是Laxcus集群操作系统提供的一项新功能,它的技术基础,就是上面提到DFL3,DFL是Deep Few Learning 的英文首字母缩写,现在外面有人把它翻译成“微深度学习”,也有叫“小样本深度学习”,我们团队内部更喜欢称它是“小样本深度学习”,目前发展到第三代版本。这套人工智能模型现在已经抽象出来,做成API接口和分布计算指令,提供操作云端业务的用户使用。相比其它人工智能技术,DFL3有一些自己的优势,比如不太依赖标签化的训练数据,对芯片性能要求不高,擅长逻辑计算,超参数自动迭代,结合Laxcus集群架构后运算速度更快。这些特点使它除了能够在云端运行,也适合放在边缘侧处理,最近DFL3的研发部门,正在尝试着把DFL3下沉到边缘侧,做成边缘AI,提供给用户使用。
第四项是分布式应用软件。Laxcus之所以能够被称为操作系统,它的另一个基础核心就是可以运行应用软件(不能运行应用软件敢称是操作系统吗?...)。在Laxcus集群操作系统上,分布式应用软件覆盖客户端、边缘端和云端三个维度。另外,与现在大多数基于客户机/服务器模型的“分布软件”不一样的是,Laxcus集群操作系统上的分布应用软件基于集群架构。这里有根本区别,前者采用点对点的模式,后者除了具备点对点模式,还具备一点对多点和多点对多点模式。技术上,后者比前者复杂,实现效果上,后者比前者能够处理更大规模更加复杂的数据和业务。通常情况下,Laxcus集群操作系统上的分布式应用软件被启动后,会分散到很多服务器上运行,经过数次迭代计算后,把结果呈现给用户。用户可以通过各种界面操作Laxcus分布式应用软件,比如图形界面、字符界面、类似ODBC的驱动程序等,甚至客户端用户通过边缘端再操作云端的分布式应用软件也可以。
第五项是安全。这是另一个庞大的话题,在Laxcus集群操作系统里有一套安全体系专门负责安全方面的工作,之前已经写过几篇文章介绍,有兴趣的可以了解下(文章链接),这里就不再赘言了。总结一句话,Laxcus安全体系从用户键盘开始,到服务器硬盘结束,中间涉及密码学、网络通信、任务调度、资源管控、IO、沙箱、权限,Laxcus集群所有业务的每一步操作,无一例处,都在安全管理范围内。另外,为实现更广泛和更灵活的安全管理能力,Laxcus支持第三方安全管理方案,包括象量子加密这样具备绝对安全能力的技术。
第三张图是Laxcus的应用领域。Laxcus集群操作系统的应用领域包括三个维度:终端、边缘端、云端。终端包括PDA、手机、PC这样的领域,用户通过手机、PC远程登录Laxcus集群,操作云端的数据。在边缘端,Laxcus集群操作系统提供专门的边缘计算解决方案和API接口,这个领域主要针对企业用户,通常边缘计算用来解决需要实时处理又不需要在云端运行的业务。云端是Laxcus的核心和重点,各种大数据业务和分布式应用软件,主要是在云端运行。Laxcus集群操作系统的云端部分,部署环境可以是公有云,也可以是私有云。而且Laxcus很多功能是针对云环境设计的,比如虚拟映射端口,就是针对云端IP地址不足的情况设计的,它能够在不影响云端设施情况下,缓解云服务商IP地址不足的问题,帮助云服务商节约一大笔资金。Laxcus另外一项极具吸引力的功能,就是它目前已经把云端、边缘端、终端联接融合起来,形成三位一体的协同计算能力。这项功能对企业用户非常重要,它极大缩短了企业业务跨域处理时间,提高了计算效率,目前已经在很多行业和企业中应用。
最后说下Laxcus集群操作系统的应用现状。现在使用Laxcus集群操作系统行业,其中一个是高性能计算,尤其是超级计算机这一块。因为Laxcus能够支持所有国产芯片和全栈技术自主,所以一些保密级别较高的企业都在使用,比如象空气流体、地质资源、深海深空探测这样复杂和长耗时的计算。还有就是工业云领域,这块集中了近50%左右的用户。另外就是边缘计算和物联网,比如无人工厂、光伏厂商、智能小区,它们都有大量需要在边缘端处理,然后上传云端的业务。Laxcus三位一体的协同处理能力,帮助用户节省了不少资源和麻烦。
以上就是Laxcus集群操作系统概要和现状图鉴,本人参与了Laxcus后期的研发,目前负责其中一个模块的主管工作,算是对Laxcus集群操作系统了略知一二,不知对各位理解Laxcus集群操作系统有没有帮助?欢迎在下方留言交流。