06月 23, 2007

百度CTO刘建国离职很久了,今天重新读了一遍《21世纪》对他的采访稿,虽然百度包括当初的刘建国对SEO很反感,甚至认为SEO就是作弊。但这份采访稿的某些地方,刘当初说的一些话还是值得考究的。特别是其扁google,炫耀百度时所表现的一些得意忘形的话语。

我一直认为,不管你是平民还是圣人,人性所赋予的骨子里的一些劣根是相同的。人在得意忘形时说的话,很容易暴露一些本不想说的,核心机密的痕迹……做了点笔记,以备日后思量:

1. 网页内容,比如中文处理就很重要,要理解中文的语法和特定文字意义,因为中文与英文还是不一样的,只有判断文字是什么意思,才能给用户提供搜索结果。

2. 我们中文的理解做得比他们好,比如像分词、切词,中文是一个一个字,放一块儿,那些字和词是不一样的。我做得比Google好。他们没有专门研究中文。中文分词,语法是主谓宾,如何用,老外不理解。

3.应用软件不是一套。我们直接用自己的东西。比如说词典、分词、词汇。这不是释义的词典,可能有很多资源。比如我们用人民日报的语料库,我们购买这样的资料。更多的平台是我们自己的搜索引擎。我们有日志,总结新的词汇。我们对10亿计的网页也能分析。这是Google中文做不到的。至少没有聚焦。

另外从中文用户体验来说,我们也做得比他们好,比如用户体验是什么、习惯是什么。比如相关搜索,在中文里面,用户心里想的一个事情,比如“软件”这个词,用户心里想的是软件下载,但搜索的是“软件”这个词,他输入“软件”,与搜索不符。百度会提示得更加精细化,到底是软件下载还是加密,全自动服务,这样用户会觉得很好。类似的工作我们下了很多功夫。其他像拼音检索,错别字纠正,我们也能正确提示。现在有些搜索正在抄我们。我认为不能崇洋。

Del.icio.us Google书签 Digg Live Bookmark Technorati Furl Yahoo书签 Facebook 百度搜藏 新浪ViVi 365Key网摘 天极网摘 和讯网摘 博拉网 POCO网摘 添加到饭否 QQ书签 Digbuzz我挖网

没有评论 »

还没有评论。

评论 RSS Feed。 TrackBack URI

发表评论