网站运营
位置:首页>> 网站运营>> Yupoo! 的网站技术架构分析

Yupoo! 的网站技术架构分析

作者:Fenng 来源:Movoin Studio 发布时间:2008-07-11 20:47:00 

标签:Yupoo,图片,服务器,网站

又有机会爆料国内 Web 2.0 网站的架构了。这次是 Yupoo! 。非正式的采访了一下 Yupoo!(又拍网) 的创建人之一的 阿华(沈志华)同学,了解了一些小道消息。

作为国内最大的图片服务提供商之一,Yupoo! 的 Alexa 排名大约在 5300 左右。同时收集到的一些数据如下:

  • 带宽:4000M/S (参考)

  • 服务器数量:60 台左右

  • Web服务器:Lighttpd, Apache, nginx

  • 应用服务器:Tomcat

  • 其他:Python, Java, MogileFS 、ImageMagick 等


首先看一下网站的架构图:

该架构图给出了很好的概览(点击可以查看在 Yupoo! 上的大图和原图,请注意该图版权信息)。

关于 Squid 与 Tomcat

Squid 与 Tomcat 似乎在 Web 2.0 站点的架构中较少看到。我首先是对 Squid 有点疑问,对此阿华的解释是”目前暂时还没找到效率比 Squid 高的缓存系统,原来命中率的确很差,后来在 Squid 前又装了层 Lighttpd, 基于 url 做 hash, 同一个图片始终会到同一台 squid 去,所以命中率彻底提高了”

对于应用服务器层的 Tomcat,现在 Yupoo! 技术人员也在逐渐用其他轻量级的东西替代,而 YPWS/YPFS 现在已经用 Python 进行开发了。

名次解释

YPWS–Yupoo Web Server YPWS 是用 Python开发的一个小型 Web 服务器,提供基本的 Web 服务外,可以增加针对用户、图片、外链网站显示的逻辑判断,可以安装于任何有空闲资源的服务器中,遇到性能瓶颈时方便横向扩展。

YPFS–Yupoo File System 与 YPWS 类似,YPFS 也是基于这个 Web 服务器上开发的图片上传服务器。

【Updated: 有网友留言质疑 Python 的效率,Yupoo 老大刘平阳在 del.icio.us 上写到 “YPWS用Python自己写的,每台机器每秒可以处理294个请求, 现在压力几乎都在10%以下”】

图片处理层

接下来的 Image Process Server 负责处理用户上传的图片。使用的软件包也是 ImageMagick,在上次存储升级的同时,对于锐化的比率也调整过了(我个人感觉,效果的确好了很多)。”Magickd“ 是图像处理的一个远程接口服务,可以安装在任何有空闲 CPU资源的机器上,类似 Memcached的服务方式。

我们知道 Flickr 的缩略图功能原来是用 ImageMagick 软件包的,后来被雅虎收购后出于版权原因而不用了(?);EXIF 与 IPTC Flicke 是用 Perl 抽取的,我是非常建议 Yupoo! 针对 EXIF 做些文章,这也是潜在产生受益的一个重点。

图片存储层

原来 Yupoo! 的存储采用了磁盘阵列柜,基于 NFS 方式的,随着数据量的增大,”Yupoo! 开发部从07年6月份就开始着手研究一套大容量的、能满足 Yupoo! 今后发展需要的、安全可靠的存储系统“,看来 Yupoo! 系统比较有信心,也是满怀期待的,毕竟这要支撑以 TB 计算的海量图片的存储和管理。我们知道,一张图片除了原图外,还有不同尺寸的,这些图片统一存储在 MogileFS 中。

对于其他部分,常见的 Web 2.0 网站必须软件都能看到,如 MySQL、Memcached 、Lighttpd 等。Yupoo! 一方面采用不少相对比较成熟的开源软件,一方面也在自行开发定制适合自己的架构组件。这也是一个 Web 2.0 公司所必需要走的一个途径。

非常感谢一下 Yupoo! 阿华对于技术信息的分享,技术是共通的。下一个能爆料是哪家?

作者: Fenng | 可以转载, 转载时务必以超链接形式标明文章原始出处和作者信息及版权声明
网址: http://www.dbanotes.net/arch/yupoo_arch.html

0
投稿

猜你喜欢

  • 一、规划说明:主机A: 双网卡192.168.1.7 --> mydomain.org主域名服务器192.168.10.7 -->
  • 【导读】 在Linux上安装一个虚拟根环境化的Apache目录树是相当的简单的。这个例子使用的是Red Hat 6.*和Apache 1.3
  • 2007 年 10 月期间我们在全国6个城市举办了 AdSense 产品介绍会,期间有很多的发布商朋友提出了很多很好的意见和建议。这里我们就
  • 有一些问题常令用户困惑:在产品的功能上,各个厂商的描述十分雷同,一些“后起之秀”与知名品牌极其相似。面对这种情况,该如何鉴别?描述得十分类似
  • 在刚刚过去的“酷我”粉丝打榜第三季——酷我音乐盒2009版上
  • 首先查看apache是否加载了mod_deflate.so模块,如果没有需要安装加载。找到并下载和当前apache版本相同的源码文件,解压缩
  • 1 概述企业知名度增加,网站访问量逐渐上升,是每一个网管所盼望的。但同时应用服务器的数据流量和访问量将成倍增加,服务器将不堪重负。这时,可采
  • 链接这里有一个怎么选择的问题。首面选择链接要选择(pr值)权重高的网站做你的反向链接。尤其是刚建立的小站。如果有一个pr值高的站带着你。你几
  • IIS PHP MySQL Zend Optimizer GD库 phpMyAdmin安装配置[完整修正实用版]一、软件预备:以下均为截止2
  • 分词是很多做SEO的人常听到的概念,为了让大家在这个方面不会有疑惑,现在要来讲一下分词以及索引库。这也是更深入的了解搜索引擎的开始。搜索引擎
  • 据《纽约时报》5月5日报道,在微软上周末忽然宣布放弃收购雅虎后,外界对收购失败原因议论纷纷。相关各方对这次交易失败各有理由,雅虎联合创始人、
  • 安装Server CoreServer Core的安装本身很简单,你只要插入光盘,点击"Setup",跟随屏幕向导就能完
  •  由于Godaddy改版,网上的过户教程并不适用了,于是决定把过程记录下来,希望对朋友们有所帮助。感觉很多人还不是很熟悉,现在就把
  • 万众期盼已久的WCG中国成都世界电子竞技总决赛将于今日开幕,来自全国成千上万的电竞迷们,今日已经将新会展附近的酒店全部挤满。昨日,记者来到了
  • 全球最大的域名注册商Godaddy,继推出优惠码199DOMAIN, 299DOMAIN, 399DOMAIN注册.COM域名后,近日God
  • 首先自我介绍一下,我是华农人论坛站长,避免AD嫌疑,地址就不放上来了,是做高校论坛的,其间,做得不错,上来发表一点心得(两个月来,建站的一些
  • 很多站长都挂上了联盟的广告来赢利,而联盟大多都以百度、GG为主,站长们在通过了审核之后,放好广告,并想尽办法的去优化,以求获得更好的点击率,
  • 草根网站比门户网站更有前途,此话并非空穴来风,在网络发展不停的泡沫和务实中挣扎中,无数的web2.0 等概念性的网站,越来越经受不起现实的压
  • 相信很多用phpcms v9的站长都不是程序员,而我也是一个网页设计师,所以对制作模板还是可以对付的。但是一设计到自己写程序,就一个头两个大
  • 百度公司董事长兼CEO李彦宏(腾讯科技配图)腾讯科技讯(无忌)北京时间8月5日消息,据国外媒体报道,百度首席执行官李彦宏周四在接受彭博电视台
手机版 网站运营 asp之家 www.aspxhome.com