放大啦资源网

简介

CAP原则又称CAP定理，指的是在一个分散式系统中， Consistency（一致性）、 Availability（可用性）、Partition tolerance（分区容错性），三者不可得兼。

一致性（C）：在分散式系统中的所有数据备份，在同一时刻是否同样的值。（等同于所有节点访问同一份最新的数据副本）

可用性（A）：在集群中一部分节点故障后，集群整体是否还能回响客户端的读写请求。（对数据更新具备高可用性）

分区容忍性（P）：以实际效果而言，分区相当于对通信的时限要求。系统如果不能在时限内达成数据一致性，就意味着发生了分区的情况，必须就当前操作在C和A之间做出选择。

CAP原则的精髓就是要幺AP，要幺CP，要幺AC，但是不存在CAP。如果在某个分散式系统中数据无副本，那幺系统必然满足强一致性条件，因为只有独一数据，不会出现数据不一致的情况，此时C和P两要素具备，但是如果系统发生了网路分区状况或者宕机，必然导致某些数据不可以访问，此时可用性条件就不能被满足，即在此情况下获得了CP系统，但是CAP不可同时满足。必然导致某些数据不可以访问，此时可用性条件就不能被满足，即在此情况下获得了CP系统，但是CAP不可同时满足。

因此在进行分散式架构设计时，必须做出取捨。当前一般是通过分散式快取中各节点的最终一致性来提高系统的性能，通过使用多节点之间的数据异步複製技术来实现集群化的数据一致性。通常使用类似 memcached 之类的 NOSQL 作为实现手段。虽然 memcached 也可以是分散式集群环境的，但是对于一份数据来说，它总是存储在某一台 memcached 伺服器上。如果发生网路故障或是伺服器当机，则存储在这台伺服器上的所有数据都将不可访问。由于数据是存储在记忆体中的，重启伺服器，将导致数据全部丢失。当然也可以自己实现一套机制，用来在分散式 memcached 之间进行数据的同步和持久化，但是实现难度是非常大的。

可用的抉择

CAP理论就是说在分散式存储系统中，最多只能实现上面的两点。而由于网路硬体肯定会出现延迟丢包等问题，所以分区容错性是我们必须需要实现的。所以我们只能在一致性和可用性之间进行权衡，没有NoSQL系统能同时保证这三点。对于web2.0网站来说，关係资料库的很多主要特性却往往无用武之地。

资料库事务一致性需求
很多web实时系统并不要求严格的资料库事务，对读一致性的要求很低，有些场合对写一致性要求并不高。允许实现最终一致性。
资料库的写实时性和读实时性需求
对关係资料库来说，插入一条数据之后立刻查询，是肯定可以读出来这条数据的，但是对于很多web套用来说，并不要求这幺高的实时性，比方说发一条讯息之后，过几秒乃至十几秒之后，我的订阅者才看到这条动态是完全可以接受的。
对複杂的SQL查询，特别是多表关联查询的需求
任何大数据量的web系统，都非常忌讳多个大表的关联查询，以及複杂的数据分析类型的报表查询，特别是SNS类型的网站，从需求以及产品设计角度，就避免了这种情况的产生。往往更多的只是单表的主键查询，以及单表的简单条件分页查询，SQL的功能被极大的弱化了。

放大啦资源网

CAP原则

CAP原则

基本介绍

简介

可用的抉择

与NoSQL的关係

与BASE的关係

分散式系统

猜你喜欢

最新文章

随机文章

热门文章

标签

关于本站

联系我

特别鸣谢