我要做一个微博搜索引擎,希望各位可以给予架构思路,你的一个停留,可以改变世界

谢谢你点进来,

也许你觉得我有点异想天开,但有什么事情不是从想开始的呢?

我开始说我的问题 :
开发语言用PHP+MYSQL 因为这2个 我略懂 略懂
服务器WIN 2003 【配置可升级】

原理如下:
用户访问网站,搜索某个关键词,系统会api请求微博网站的服务器获得数据,然后对该数据进行优化排序,然后展现给用户

由于我通过api一次最多可以获取500个记录,那么,每个用户搜索一次,我就把500个记录存入数据库,然后优化排序展现给他,随着用户的搜索习惯,数据库会越来越大,这也正是我想要的

后续数据量增加 用户搜索量增加,如何架构整个系统呢

如果整个系统加入Sphinx 那么是否会提升他的效率呢

最后另外问下,一个表如果有50W个记录,是否会显著影响性能呢,因为我的数据表结构一样,存一个表可能有点变态了

7 个回答

非技术宅,从使用上问楼主2个问题。
1.如果微博屏蔽你程序的爬虫,你如何抓取数据?
2.现在微博本身可以搜索,而国内微博稍好的也就是2家,新浪和腾讯。站内搜索的功能应该会更强大吧。

网络茶馆www.shiyayong.cn关注php网站开发及网站推广,支持

微波搜索好像有的啊,就是一下搜几个微波的,不过又传闻,各微波都不想让外边的搜到

个人不太懂技术,闲扯两句,正向楼上所说的,你这个基于微博,微博屏蔽了怎么办?微博本身就是个媒体,也相当于一个搜索引擎,而且有自己的搜索系统,这个不就和微博之间竞争了吗?作为媒体,可能有一天呗新媒体所取代,到时搜索引擎又怎么办?关注看看http://www.zhixuan12580.com/ ,看有没有更好的方法。

我是来纯支持的。话说新浪自己的已经挺好用的了

这个的话太复杂就不行了。用小偷还行。调用API,像浪姨他家的微博开放平台。调用接口老是抽风的。而且还有调用次数限制。

受万能胖@chens之邀,特来助阵,俺外行插不上话,见谅!

你的回答