云计算架构,云计算和大数据哪个好?
大数据和云计算从理论角度来看,二者属于不同层次的事情,云计算研究的是计算问题,大数据研究的是巨量数据处理问题,而巨量数据处理依然属于计算问题的研究范围,因此,从这个角度来看,大数据是云计算的一个子领域,从应用角度来看,大数据是云计算的应用案例之一,云计算是大数据的实现工具之一。
大数据与云计算既有不同又有联系,但在现实中,由于大数据处理时为了获得良好的效率和质量,常常采用云计算技术,因此,大数据与云计算便常常同时出现于人们的眼前,从而造成了人们的困惑。
大数据技术是一种新一代技术和构架,它以成本较低、以快速的采集、处理和分析技术,从各种超大规模的数据中提取价值。大数据技术不断涌现和发展,让我们处理海量数据更加容易、更加便宜和迅速,成为利用数据的好助手,甚至可以改变许多行业的商业模式。
大数据(big data)是这样的数据集合:数据量增长速度极快,用常规的数据工具无法在一定的时间内进行采集、处理、存储和计算的数据集合。云计算是一种基于因特网的超级计算模式,在远程的数据中心里,成千上万台电脑和服务器连接成一片电脑云。因此,云计算甚至可以让你体验每秒10万亿次的运算能力,拥有这么强大的计算能力可以模拟核爆炸、预测气候变化和市场发展趋势。用户通过电脑、笔记本、手机等方式接入数据中心,按自己的需求进行运算。
云计算的就业前途,某种意义上也可以理解为云计算为我们提供的服务,存在一定的必然性,也就是说云计算对于社会、云计算使用者有哪些优势,也同时可以理解为,云计算的优势就是云计算的就业优势。
从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘。但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。
随着云时代的来临,大数据(Big data)也吸引了越来越多的关注。分析师团队认为,大数据(Big data)通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。
大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理(MPP)数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。大数据和云计算是未来发展趋势所需,且功能足够强大,这样的行业你说前景好不好呢?当然是好啊,所以抓紧学习才是正确的开始。
云计算和大数据分析的系统架构方向?
系统架构首先要掌握一些基础的架构设计原则,下面给介绍一下模块化云架构设计思路。作为云服务商,我们经常需要面对客户IT系统上云的需求,中型以上的客户IT系统通常具有一定的复杂性,面对复杂的IT系统,我们怎样帮助客户实现IT系统的云迁移,以及在云端快速搭建客户复杂的IT架构?现在排名靠前的云服务商,云端的服务组件已经达到了上百种,覆盖了计算资源、存储资源、网络服务、数据库服务、安全服务、中间件、运维监控服务等等,基本上主流的IT服务在云端都能够找到。这些云服务是基于云计算的自动化、快速开通和弹性扩容的特性,并给客户提供了自服务的控制台门户,让客户能够自主的在云端配置自己的IT系统。如果我们把复杂的IT系统类比为结构精密复杂的自动机械手表,把云服务类比为手表内部精密的小部件,我们在云端使用云服务构建复杂IT系统,就好比机械手表的装配。机械手表每个小部件的连接设计的都很精巧,并按照精密的工序来装配。机械手表的这种部件化/模块化的装备模式,同样适用于在云端使用云服务模块构建复杂的IT系统。大家知道,云计算主要分为公有云和私有云,我们先说一下私有云。私有云本质上就是客户的IT基础设施虚拟化,其实还是一个ICT项目,依然需要从头开始搞IT系统建设,存在周期长、一次性投资大、运维维护成本高等问题。针对这些问题,各大云服务商、甚至一些第三方厂商,提出了私有云模块化构建思路,类比集装箱,称之为“云箱”。相比传统的ICT项目建设,具有以下特点:多:高密多、多节点快:部署仅需8周时间好:便于扩展省:能耗节约80%全:可定制所谓“云箱”就是由若干相互独立的模块构成,每个模块具备私有云数据中心的一个或多个系统功能,比如供电模块、管理模块、主机模块、对象存储模块、数据模块等等。这些即插即用的功能模块通过简单组装就能构成完整的数据中心。华为/天翼云全栈专属FCS方案也是一种定制化、模块化的私有云建设方案,只是没有空间“箱体”的概念,能够满足客户私有云的各种建设需求。我们重点聚焦在公有云的模块化架构设计。我们需要把云端的服务组件抽象为一个个的图标,便于我们做架构设计,阿里云供了大量丰富的云服务模块图标:
我们结合系统架构的演进来,运用模块化的架构设计思路,尝试用这些图标搭建从简单到复杂的IT系统。
一、架构初级阶段:万能的单机即一台ECS服务器搞定一切。传统官网、论坛等应用,只需要一台ECS。对应的web服务器、数据库、静态文件资源等,部署到一台ECS上即可。一般5万pv到30万pv访问量,结合内核参数调优、web应用性能参数调优、数据库调优,基本上能够稳定的运行。一般个人或者小微企业会采用这种单机方式上云。二、分离架构:Web应用与RDS服务物理分离当访问压力达到50万pv到100万pv的时候,部署在一台服务器上面的web应用及数据库等服务应用,会对服务器的CPU/内存/磁盘/带宽等系统资源进行竞争。显然单机已经出现性能瓶颈。我们将web应用和数据库物理分离单独部署,解决对应性能问题。这里的架构采用ECS+RDS物理分离的方式。在云端,我们可以直接开通ECS和RDS模块,ECS通过TCP协议访问RDS数据库服务,如下图所示:为了保证web应用与数据库服务的安全隔离,可以将web应用和RDS划分在不同的子网,子网之间ACL策略,限定端口访问,此时,我们需要通过VPC模块来划分子网、设置ACL访问策略。3、应用集群架构:负载均衡+Web应用+RDS服务当访问压力达到300万pv到500万pv的时候,虽然通过将web与rds物理分离的方式,有效的降低了请求的压力,但是当更大的PV流量出现的时候,单台服务器可能会出现访问堵塞、延迟、服务器进程增多、cpu100%,甚至出现常见502/503/504的错误码。显然单台web服务器已经满足不了需求,这里需要通过负载均衡技术增加多台web服务器(对应ECS可以选择不同可用区,进一步保障高可用)。因而告别单机的时代,转变分布式集群架构的阶段。在云端,我们可以添加负载均衡器模块,开通多台Web应用服务器来满足更大PV访问量的需求。后续随着PV压力的逐步提高,可以进一步增加以下云服务组件,搭建高可用、高负载的分布式的系统架构:1、增加CDN服务,将静态页面、各类数据、音、视频文件缓存到边缘节点,满足客户就近访问的需求,同时也大大缓解了web应用服务的压力;2、对于大量的动态访问数据库的请求,可以增加缓存服务模块(REDIS),将更多的静态数据缓存在内存里,大大缓解数据库查询的请求;3、如果缓存服务也满足不了数据库查询的请求,可以增加只读数据库服务,实现读写分离。以上是我们采用模块化的架构设计思路,按照系统架构的演进,在云端快速、灵活的构建系统,希望能够给大家启发。关于系统架构的演进后面我们会专题讲解。云计算到底是什么?
云计算的过去
我们知道在过去如果你的业务想在互联网上为用户提供服务,是需要与运营商或有电信运营资格的企业手中租赁机柜和硬件服务器或自己提供服务器托管在数据中心(IDC)中,这种模式带来的弊端显而易见:
首先,是硬件成本高,一台服务器成本高达几万元加上托管费和网络费用等等,一些中小企业承受不起如此昂贵的支出,
其次,是利用率不高,一台服务器如果只运行一个服务,可能资源利用率不到 10%,但是如果把很多服务都跑在同一台服务器上,虽然可以提升服务器的资源利用率,但是一旦服务器出现故障,所有的进程都会挂掉,缺乏高可用能力。
第三,可扩展性低,维护成本过高,传统的 IDC 托管方式,一台服务器要升级硬件是非常的耗费人力和时间的,你可以想象以下一台服务器出现硬件故障或要增加磁盘,运维人员需要从公司跑到机房去升级硬件,这中间需要停机断电升级。后来一些服务器进行升级支持热插拔技术,但是也还是需要有人去机房升级或者有的机房,这种方式的可扩展性和维护成本之高是一些中小企业无法承受的。
因此,在2006年云计算这个概念被首次提出,从概念到产品一直不断的迭代发展到今天,已经差不多10年了。在这10年间,云计算取得了飞速的发展与翻天覆地的变化。如今我们可以看到云计算被视为计算机网络领域的一次革命,因为它的出现,社会的工作方式和商业模式也在发生巨大的改变。与此同时也诞生出一批优秀的先行者和行业领导者,例如谷歌、微软、亚马逊、阿里云等等一批优秀的云计算提供商。当然这背后离不开那些为此而付出的开源软件厂商和优秀的开发者门,例如 OpenStack、docker、kubernetes 等等技术的产生使得云计算日渐成熟。
现如今,我们通过云厂商们提供的平台可以使用非常方便的购买硬件资源进行使用,云计算给我们带来的便利性如下:
按需付费,用户可以根据自己的业务需求购买适合自己当前业务规模的硬件资源进行使用。
弹性伸缩,通过鼠标点点就可以升级和降级硬件资源,灵活性非常强。
可靠性高,由于购买资源的成本大大降低,部署高可用等技术成为了可能,这使得倘若服务器故障也不影响计算与应用的正常运行。
云计算的服务类型也多种多样,通常我们分为Iaas、Pass、SaaS。
基础设施即服务IaaS)
基础设施即服务是主要的服务类别之一,它向云计算提供商的个人或组织提供虚拟化计算资源,如虚拟机、存储、网络和操作系统。
平台即服务(PaaS)
由于 Iaas 的蓬勃发展,为 Pass 服务提供了可能,它能够为开发人员提供通过全球互联网构建应用程序和服务的平台。Paas为开发、测试和管理软件应用程序提供按需开发环境。
软件即服务(SaaS)
软件即服务也是其服务的一类,通过互联网提供按需软件付费应用程序,云计算提供商托管和管理软件应用程序,并允许其用户连接到应用程序并通过全球互联网访问应用程序。
事实上,我们会发现很多云厂商提供的服务类型都是基于 Iaas、PaaS和 SaaS 之和的。
云计算的未来
随着云计算的继续发展,未来在云基础设施、云开发、云应用、云管理四个方面都将会出现更多的服务和产品形态。
首先是基础服务设施的发展,据 IDC于近日发布了《IDC FutureScape: 全球云计算2020 年预测——中国启示》到2021年,中国90%以上的企业将依赖于本地/专属私有云、多个公有云和遗留平台的组合,以满足其基础设施需求。因此分布式云将会成为未来基础设置发展的一个重要方向。
第二是云开发的发展,随着更多的企业上云,依赖云提供的各种API生态将会蓬勃发展,我们可以看到类似阿里云、AWS 这样的基础设置领导者正在不断的完善他们的 API 接口供使用者调用。其实在当下,我们就可以通过这些服务提供商提供的 API 接口来对一些云服务提供生命周期管理。在未来还会有更多的产品和服务将使用公有云和内部API提供的服务构建复合型应用程序;据 IDC 预测,其中将有一半将利用人工智能和机器学。
第三个是云应用的发展,未来人工智能自动化、物联网和智能设备每天将产生庞大的数据,这将导致一些行业应用规模化从而驱动很多业务提供商通过云来为客户提供应用,即会出现各种丰富多样的PaaS 平台,比如医疗、教育、电商等等 PaaS 平台。
第四个是云管理的发展,随着虚拟化技术和容器以及容器编排技术的发展,以 Kubernetes和多云管理流程以及各种自动化运维工具的出现,未来到将会有更多的企业将在容器、开源和云原生应用开发方面依赖于第三方服务提供商的帮助来构建和管理他们的业务。
我们可以看到云计算在这 10 几年时间里从互联网走向非互联网,从传统的服务升级方式走向云原生,从影响企业IT变革走向推动企业全面数字化转型,正深刻地影响着个人、企业乃至整个社会的生产生活方式。
公有云计算架构是什么?
公有云计算架构主要可分为四层,其中有三层是横向的,分别是显示层、中间件层和基础设施层,通过这三层技术能够提供非常丰富的云计算能力和友好的用户界面,还有一层是纵向的,称为管理层,是为了更好地管理和维护横向的三层而存在的。下面介绍每个层次的作用和属于这个层次的主要技术。
显示层主要是用于以友好的方式展现用户所需的内容,并会利用到下面中间件层提供的多种服务,主要有五种技术:HTML、JavaScript、CSS、Flash、Silverlight。
中间件层,这层是承上启下的,它在下面的基础设施层所提供资源的基础上提供了多种服务,比如缓存服务和REST服务等,而且这些服务即可用于支撑显示层,也可以直接让用户调用,并主要有五种技术:REST、多租户、并行处理、应用服务器、分布式缓存。
基础设施层这层作用是为给上面的中间件层或者用户准备其所需的计算和存储等资源,主要有四种技术:虚拟化、分布式存储、关系型数据库、NoSQL。
管理层这层是为横向的三层服务的,并给这三层提供多种管理和维护等方面的技术,主要有下面这六个方面:帐号管理、SLA监控、计费管理、安全管理、负载均衡、运维管理。
云计算服务的优势是统一平台架构?
云计算服务的优势不是是统一平台架构。云计算服务的优势:
1.能快速搭建我们的应用
云计算最大的好处就是能够快速搭建我们的企业应用,比如我们现在要开发一个网站,我们就不必担心是否需要花巨资购买硬件来集群,然后是巨额资金购买所需的系统软件而且这些也需要一些人员来组建和维护的,如果恰巧这是一个比较新且可能会带来盈利的商业点子,那搭建在云上就是一个非常不错的选择,这起码能比其他企业先行一步。
2.提供了更大的灵活性和扩展性
由于“云”的规模可以动态伸缩,这样就可以不用加大投资硬件设备的力度来满足应用和用户规模增长的需要,同时也无形起到了降低成本的作用。如果项目突然废弃,也没有什么大的损失,所以在这方面,云计算是相当灵活和易于扩展的。
3.可以解决一些特殊的场景
很多公司都是在特定的时期盈利较大,比如一些情人节和圣诞节的帮办公司,它们就是在这段时间的营业额比较大,在一年中的其他时候,几乎不能盈利,在这种情况下,如果按照传统的软件部署习惯,势必会造成一定的浪费。正如一个有大量波峰和波谷的企业一样,你可能就被迫要将更多的IT资源分配给峰值时期使用。这种情况下将峰值需求外包可能会节约更多成本。
4.缩短了产品的开发周期
不管你是使用哪个厂商的云计算产品.都有一个显著的特点,那就是能缩短产品的开发周期,一个想法到一个产品的开发周期因为云计算的到来而逐渐缩短,由此你可以看出里面蕴藏的巨大价值。云计算确实已经开始影响到我们做业务的方式。我们开始减少研究的循环周期,这对于我们来说非常重要而且必要。
5.节约了建立基础设施的成本
其实对于每个企业来说基础设施都是一笔开支比较大的费用,而且除了费用之外还需要专门的人力和物力的投入,在这个过程中又要保持快速的软硬件更新速度来适应市场的不断变化,所以云计算的出现无疑是值得考虑的一种解决方案。很多时候,我们也会时常注意到数据中心使用面积不够、应用软件超出基础架构的承受能力、软硬件更新太快等问题,云计算服务能帮助企业将资本转移到运营费用上,尤其是在生死攸关的关键时刻,所以在这方面来说,是值得考虑的。