原来觉得自己已经做过几个日pv上大几百万的网站,对通用的网站架构起始已经有一些了解,昨天在家的时候,仔细的想想,自己做的还只是一个大型网站的基础部分,或者只是他的一些组件,有很多的东西和需要注意的细节起始还没有考虑到,可能一个基础的网站我能搭出来了,但是更加细节的可能还不行
先说说会的:
1. 基础服务搭建:环境一般都是最麻烦的,nginx+php-fpm+redis+mysql+img-magic,这些组件的环境,以及快速链接各种服务器
2.php框架,MVC框架,常用的lib,连redis/mysql/mcpack,url改写规则
3.KV系统,高性能的C系统,以及转发switch用来做负载均衡
4.抓取系统,结构化抓取,网页渲染抓取
5.图片处理:常用的图片处理,和图片网站
6.通用的日志处理和数据可视化
7.基础的策略,切词、plsa、wordsim、分类、聚类、预测,基本上都能做出来,选特征可能会比较麻烦,但是简单能看到效果的还是很快能搞出来
感觉功能都是够用了,我能想到的大部分的网站,基础框架貌似都可以了,量要是多了,估计就需要各种优化了,不过这个作为一个开篇吧,以后想到什么再开始慢慢的讲;
最后补一个图片,锋哥的,以后慢慢的学习,慢慢的补上来;
