• 2017QCon分享:从淘宝到云端的高可用架构演进

    比如在设计技术方案的时候,在最后一章单独有一个容灾设计,这个节点里任何服务挂掉的时候,你要保持什么样的方式保持这个服务是可用的。在容灾设计时有几点必须考虑,比如我引了一个新jar包或者调了一个新的RPC的...
    文章 2017-10-25 2947浏览量
  • 为什么需要消息队列,及使用消息队列的好处?

    但是很可惜,十年前开始流行的C10K说法就是在讲:并发量上来之后,会造成chain reaction,大量的并发不会直接挂掉你的mysql节点,但是会拖慢速度,降低吞吐量,一个玩家的请求由于处理时间太长,导致玩家放弃重试,...
    文章 2018-07-05 7622浏览量
  • 3+1保障:高可用系统稳定性是如何炼成的?

    做到每个环节使用相互独立的多台服务器进行分布式处理,要针对不同稳定性要求级别和成本能力做到不同服务器规模分布式,这样就避免单个服务器挂掉引发单点故障后进而导致服务整体挂掉的风险。可能涉及的环节有端动态...
    文章 2021-01-27 8367浏览量
  • 纯干货|从淘宝到云端的高可用架构演进

    比如在设计技术方案的时候,在最后一章单独有一个容灾设计,这个节点里任何服务挂掉的时候,你要保持什么样的方式保持这个服务是可用的。在容灾设计时有几点必须考虑,比如我引了一个新jar包或者调了一个新的RPC的...
    文章 2017-06-19 2151浏览量
  • ETCD系列之一:简介

    挂掉的节点再次当选主节点,它将缺失部分已提交的日志。在这样场景下,按Raft协议,它将自己日志复制给其他节点,会将集群已经提交的日志给覆盖掉。这显然是不可接受的。其他协议解决这个问题的办法是,新当选的主...
    文章 2016-03-27 71401浏览量
  • iOS开发中 关于阿里云服务器的使用与安全策略 韩俊强...

    但是今年以来网站一直挂掉,就算来几个人也走了,狠下心来对腾讯云和阿里云作了个小比较,觉得还是阿里云比较划算,比较稳定。于是,选择购买了一个低配置1G内存,1G CPU,1M带宽,还添加了一个云盘20G(为什么要买...
    文章 2017-02-15 1216浏览量
  • 如何选择合适的数据库,让游戏更高效可用

    双节点还是有很多的不完备,假设网络抖动时主库挂掉,日志就会传不过去,B超过一秒没有返回就会退化,如果不退化B系统不可维护,可用性降低,如果刚好在退化期间A挂掉,还是会丢数据,因此我们采用三节点方案。...
    文章 2017-04-19 5392浏览量
  • ...head><meta http-equiv="Cont

    但是今年以来网站一直挂掉,就算来几个人也走了,狠下心来对腾讯云和阿里云作了个小比较,觉得还是阿里云比较划算,比较稳定。于是,选择购买了一个低配置1G内存,1G CPU,1M带宽,还添加了一个云盘20G(为什么要买...
    文章 1970-01-01 554浏览量
  • 高可用互联网系统稳定性建设实践指南

    这样就避免单个服务器挂掉引发单点故障后进而导致服务整体挂掉的风险。可能涉及的环节有端动态获取资源服务(html&js&小程序包等)、域名解析、多服务商多区域多机房IP入口、静态资源服务、接入路由层、服务...
    文章 2021-09-01 62浏览量
  • 抗住 60 亿次攻击,起底阿里云安全的演进之路|问底...

    例如在传统的IT系统里,系统漏洞补丁生效需要操作系统重启生效,但在云上是不能这么做的,如果物理机系统重启,将导致用户业务全了,无法使用。于是东厂他们和研发团队一起研究出新的虚拟化热补丁技术,无需用户的...
    文章 2019-12-30 2221浏览量
  • K8s 实践|如何解决多租户集群的安全隔离问题?

    该场景下集群的所有用户均来自企业内部,这也是当前很多 K8s 集群客户的使用模式,因为服务使用者身份的可控性,相对来说这种业务形态的安全风险是相对可控的,毕竟老板可以直接裁不怀好意的员工:)根据企业内部...
    文章 2020-01-10 1592浏览量
  • Kubernetes多租户集群实践

    该场景下集群的所有用户均来自企业内部,这也是当前很多k8s集群客户的使用模式,因为服务使用者身份的可控性,相对来说这种业务形态的安全风险是相对可控的,毕竟老板可以直接裁不怀好意的员工:)根据企业内部...
    文章 2020-01-02 2549浏览量
  • 常见消息队列基础知识

    大量的并发不会直接挂掉你的mysql节点&xff0c;但是会拖慢速度&xff0c;降低吞吐量&xff0c;一个玩家的请求由于处理时间太长&xff0c;导致玩家放弃重试&xff0c;但是对于后端来说&xff0c;对该玩家之前的处理过程消耗的资源就...
    文章 2021-09-10 56浏览量
  • Apache三种多路处理模块(prework、worker、event模式...

    原因主要是需要考虑稳定性,如果一个线程异常了,会导致父进程连同其他正常的子线程都了(它们都是同一个进程下的)。为了防止这场异常场景出现,就不能全部使用线程,使用多个进程再加多线程,如果某个线程出现...
    文章 2017-11-08 1023浏览量
  • 一文读懂架构整洁之道(附知识脉络图)

    任何一个软件模块,都应该有且只有一个被修改的原因,“被修改的原因“指系统的用户或所有者,翻译一下就是,任何模块只对一个用户的价值负责。该原则指导我们如何拆分组件。举个例子,CTO 和 COO 都要统计员工的...
    文章 2019-06-11 17362浏览量
  • 架构整洁之道,看这一篇就够了!

    任何一个软件模块,都应该有且只有一个被修改的原因,“被修改的原因“指系统的用户或所有者,翻译一下就是,任何模块只对一个用户的价值负责。该原则指导我们如何拆分组件。举个例子,CTO 和 COO 都要统计员工的...
    文章 2019-05-14 15161浏览量
  • YY直播安全运维从“0”到“1”的实践

    打一次15-20G的 DDOS 攻击需要120块钱,单价两万块钱的普通服务器可以被打挂掉20台。千兆网卡的服务器可以处理的极限也就是30万并发,也就是并发 PPS 30万,160块钱可以打到700万 PPS,这是一个非常惊人的数字我见过...
    文章 2017-03-23 7074浏览量
  • 分布式锁在存储系统中的技术实践

    单机环境下,内核具备“上帝视角”,能够知道进程的存活,当进程挂掉的时候可以将该进程持有的锁资源释放,但发展到分布式环境,这就变成了一个挑战,为了应对各种机器故障、宕机等,就需要给锁提供了一个新的特性:...
    文章 2020-09-01 1094浏览量
  • 如何做到全年配送 0 故障?盒马揭秘 12个关键技术

    简单的一致性问题比如DB和缓存,db更新成功后可多增加几个通道保证db执行成功后发出消息,缓存做好幂等,考虑系统挂了的情况可以依赖db变更的精卫消息或者binlog消息做数据对账。我们遇到的一致性问题比较隐蔽,某个...
    文章 2020-02-18 671浏览量
  • 网易云基于Kubernetes+Docker的容器服务研发实践

    容器的存储也是比较难解决的问题,多数容器都是无状态的,也就是说容器内部不应该保存用户有用的数据,一个容器挂掉后,用镜像能很快启动另一个容器,保证系统的正常运行。从架构上来说这个设计很好,弹性可扩展。但...
    文章 2017-05-16 3438浏览量
  • 重新定义数据库的时刻,阿里云数据库专家带你了解...

    但是,时间上,多个交换机全部挂掉的几率非常小,相反,几台机器出问题的概率非常大,所以应该着重于解决常见问题,之后使得C和A无限逼近。下面介绍客户发生的变化,如下图所示。客户对数据库的需求正不断演变,首先...
    文章 2018-05-23 3161浏览量
  • 老司机的双11手记:这么牛的阿里云数据库,你造怎么用...

    当主机房出现较大的负载压力、断网、断电等极端情况,RDS可将商家的后台系统在30分钟内切换至灾备机房继续运行,以保障总体可靠性,进一步确保平台大型品牌商家双11期间后台系统安全稳定。未来,走出去传承最佳...
    文章 2016-11-19 5206浏览量
  • 如何做好一名稳定性SRE-业务团队系统稳定性的思与行

    这么想,是因为没有看到稳定性的前瞻性和价值,如果你走在系统的后面,你能看到的就只有系统的屁股,也只能做擦屁股的工作,如果你走到了系统的前面,你就能看到系统的方向,做的也就是探索性的工作。所以,要让稳定...
    文章 2020-10-26 4468浏览量
  • 超全总结|阿里如何应对电商故障?...

    系统改造验收:对于分布式系统,至少应该做到运行态中不会因为我依赖的系统出现故障,而引起当前应用出现可用性的问题,比如进程挂掉,频繁FullGC,负载飙高等,何时何地都具备快速止血的能力。限流降级参考:对于弱...
    文章 2017-06-19 3717浏览量
  • 【双11背后的技术】AliCloudDB——双11商家后台数据库...

    当主机房出现较大的负载压力、断网、断电等极端情况,RDS可将商家的后台系统在30分钟内切换至灾备机房继续运行,以保障总体可靠性,进一步确保平台大型品牌商家双11期间后台系统安全稳定。7.未来,走出去传承最佳...
    文章 2017-01-12 3606浏览量
  • 高可用的本质

    假设单点的可靠性假设是99.99%,它要提升到99.999%是非常困难的,但是如果无单点而是依赖2个(1个挂掉没有关系,只要不同时挂就行),那整体可靠性就是99.999999%会有质的提升。单点故障会导致无法快速止血,拉长...
    文章 2021-02-22 976浏览量
  • Greenplum在企业生产中的最佳实践(上)

    这样的话,假如说当第一个机柜的一台服务器挂掉之后,在这边会有两台服务器完成原来有一台机器的工作,对整个集群的性能下降不会造成很大的影响,同时也兼顾了高可用性。目前在一些大的银行里面,尤其是当集群规模...
    文章 2017-07-29 4690浏览量
  • 微服务转型,雪崩效应是绕不过的一道坎

    如果某个业务系统挂掉了,如何按需做自动伸缩分布式方案方案也需要考虑。问题定位:单体应用的日志集中在一起,出现问题定位很方便,而分布式环境的问题定界定位,日志分析都较为困难。雪崩问题:分布式系统都存在...
    文章 2017-09-04 2204浏览量
  • 浅谈系统实现层面稳定性保障

    因此,对于业务开发的来说,稳定性保障更应该着眼于系统设计实现环节的控制,如下橙色部分:而正是需求不受控、架构局限、代码扩展性不足、监控日志不统一、下游依赖不统一之类问题导致了每到大促前夕的紧张慌乱,...
    文章 2021-09-23 36浏览量
  • 浅谈系统实现层面稳定性保障

    因此,对于业务开发的来说,稳定性保障更应该着眼于系统设计实现环节的控制,如下橙色部分:而正是需求不受控、架构局限、代码扩展性不足、监控日志不统一、下游依赖不统一之类问题导致了每到大促前夕的紧张慌乱,...
    文章 2021-09-23 18浏览量
1 2 3 4 6 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化
http://www.vxiaotou.com