不是一天建成的,豆瓣的技术架构也是随着用户规模的增长一直在持续变化中。洪强宁,2002年毕业于清华大学,现任北京豆瓣互动科技有限公司首席架构师。洪强宁和他带领的技术团队致力于用技术改善人们的文化和生活品质,在网站架构、性能、可伸缩性上进行深入研究。豆瓣网曾获软件中国2006年度最佳技术应用网站。
校内网CTO黄晶讲述网站架构变迁
每个网站的发展都会按照一个大致相同的路线去完成,当然这里说的是每个相对成功的网站。
第一阶段:
这一阶段没有太大的访问量,甚至只有一台服务器就搞定了所有的访问。DB和前端的代码全都在一起,压力不高。忆者注:我觉得在alexa没进五万的时候,只要不是特殊的应用,基本都在此列吧。
第二阶段:
网站初具规模,DB压力大增,单独的一台DB已经满足不了现在的访问量,开始考虑读写分离的Master-slave库,使用三个及以上的服务器。忆者注:这时网站的alexa基本上会在1-3万的位置,每天的ip在5-10w的样子,当然,DB我们都认为是MySql。
第三阶段:
访问量继续增加,增加到了DB的压力在Master的机器上非常的明显了,Master开始出现吃不消的情况,出现写耗尽。主从也已经不能满足要求,需要进一步解决负载问题,此时要引入Mysql Proxy程序,进行中间层代理,实现负载均衡,易于扩展。忆者注:这时网站已经不可限量了,先恭喜下你的网站能用到这段。
第四阶段:
网站继续发展,进而出现了数据量的成倍增长,原来的N台DB都出现了一个问题,数据量巨大,无法完成正常速度的读写。此时,需要对网站按功能进行垂直划分,比如用户注册登录是一部分、UGC又是另一部分。与此同时,对数据本身进行水平划分,也就是Hash散表或者是散库。
第五阶段:
真的没了。再往下玩就灭了。
其实再进一步第五第六阶段,就是无法预想的未来了,也许有什么突飞猛进的科学技术发明也说不好。
(转载于:http://www.cnblogs.com/Mainz/archive/2009/06/28/1512796.html)
请下载电子版的PPT:猛点我下载
分享到:
相关推荐
豆瓣网技术架构变迁:本文详细描述了,豆瓣网在经历用户增多的情况下架构变迁!
豆瓣网技术架构
洪强宁谈豆瓣网技术架构,整理出的word文档
豆瓣网技术架构及其演变过程 值得大家学习的
文档主要讲述了豆瓣网系统架构的演进过程,对于想了解互联网公司技术架构演进的过程有所帮助,推荐阅读
5月30日CTO俱乐部在北京举办的第99期主题活动的主讲嘉宾:洪强宁(豆瓣 首席架构师) 介绍豆瓣的技术架构和豆瓣自行开发的主要组件(如KV存储组件BeansDB,应用开发平台DAE,Python的Spark实现Dpark等)。...
豆瓣网数据存储方案-刘洪清 3800万用户, 540个城市 15万小组, 4451音乐人, 1246主办方 文本 430万条目(书,影,音), 300万评论 1000万小组话题, 1600万张照片, 70万首单 曲 每天70万条广播, 上传近10万张图片
精仿豆瓣网整站源码精仿豆瓣网整站源码精仿豆瓣网整站源码
豆瓣网技术架构, 讲述了豆瓣网的结构发展
各大公司架构,豆瓣网,facebook,淘宝,等等作为框架设计的依据。
豆瓣数据架构实践-员旭鹏豆瓣数据架构实践-员旭鹏豆瓣数据架构实践-员旭鹏豆瓣数据架构实践-员旭鹏
豆瓣架构师的讲稿,大体看了下,很好,里面有不少python的技巧,推荐下载看看。
2:豆瓣网技术架构的发展历程.pdf 3:软件架构师应该知道的97件事.docx 4:系统架构设计师教程_第5章_软件架构设计.pdf 5:系统架构师的心得.doc 6:信息系统架构分析与中间件.pdf 7:异步数据同步组件.pdf
豆瓣网PHP5版整站源码
仿地宝网分类信息,分类信息源码程序破解完整无错版,班班分类系统 JAVA上百实例源码以及开源项目 两例Eclipse不能启动Tomcat服务的处理过程 豆瓣学习 返回请求码的使用 覆写程序崩溃 ...学习豆瓣网的技术架构发展历程
基于html+css+javascript实现的豆瓣官网首页,适合前端新手练习