文|《创业家》记者 胡宇萌
八卦迷们注意了:现在八卦娱乐有了专业化工具!你知道王菲最近又传出了哪些消息吗?你知道现在和“天后”最密切的人和事吗?你想知道别人现在最关心她的哪些话题吗?一年前呢?两年前? 登录搜搜词(http://www.sosoci.com),搜索“王菲”答案就全出来了。搜搜词是词网科技旗下的一个产品,当然,它的用途可不仅局限于娱乐八卦,作为中国惟一的六度空间词际关系网站,人家的口号是“词与词的SNS,让搜索更简单”。 如何让搜索更简单?这是词网科技创始人张跃一直在思考的问题。 张跃创业之前在微软亚洲研究院从事自然语言方面的研究工作。作为技术专家的他深知,Google、百度二者的数据收集是基于统计算法,需要一段时间让人们推介并收集,这就带来了信息更新的滞后。而以自然语言为基础的语义搜索能根据大家说话的习惯找到词与词、词与句、词与文之间的关联,会使搜索更为精细。而且因为语言使用习惯是不断变化的,所以搜索的结果也会据此作出相应的变化。“这一定是搜索引擎的未来!”2005年,张跃向微软递交辞呈,随即创办词网科技,走上创业之路。 词网科技运营的第一款产品就是句酷(http://www.jukuu.com/),张跃把它形容为“一个专门搜索例句的Google”。句酷和其他在线翻译网站不同的地方在于,它全部以句子为依托,而不强调语法和单词。同时借助语义搜索技术,后台会根据语言习惯变化,实时抓取语言的动态变化。句酷有1000万例句的数据库,这使它成为全球最大的双语例句网站。 前文提到的搜搜词是词网科技的另一个产品。与传统的搜索引擎相比,搜搜词显得更加“聪明”。比如,用户想要找到“谁收购了IBM”,一般的搜索引擎只识别“收购”与“IBM”两个关键词,搜索结果显示的是大量IBM收购的公司。如果输入更复杂的问题,如“IBM在1996年收购了谁?”,基于关键词的搜索便会束手无策。而基于自然语言的搜搜词,却能准确理解,用户要查找的是收购IBM的公司,最后显示的搜索结果主要是“联想”和“AT&T”。 从2005年创业到2008年,虽然词网科技的产品和技术在不断成熟,但是让张跃烦恼的是公司一直没有盈利。张跃甚至不得不拿出自己的积蓄给员工发工资。 2008年初,张跃的公司开始承接垂直搜索业务,先后为北京移动、CSDN等网站做站内搜索。虽然知道这个领域竞争激烈而且未来发展空间有限,但是在那个时候公司的商业模式还不甚清晰。恰好此时,语义搜索行业出现了一条爆炸性新闻。美国自然语言技术专家 Barney Pell 创办的Powerset公司被微软以1亿美元的价格收购。词网科技和Powerset同属语义搜索领域,Powerset的捷报无疑为张跃和其团队打了一针兴奋剂,行业内也开始关注起这个领域,词网科技成为首先进入他们视线的公司。 搜搜词被新浪娱乐频道看中,新浪想把人际搜索技术应用于娱乐八卦来增加用户黏度。句酷也已经中标北京第二外国语学院翻译教学与研究信息数据基地建设的项目,张跃和他的团队正在根据教学和学习需求进一步设计开发软件。项目一旦成功,词网便是国内第一个做翻译教学平台的公司,张跃和他的团队短期内也不用为生存发愁。 (详见《创业家》杂志第7期)