玩聚网之我见 玩聚北京官网

随着互联网技术的不断改进,尤其是web2.0技术的广泛应用,网络的各种特性层出不穷:用户创造内容,长尾效应,网络外部性,长尾效应,网络交互性等现象越来越成为网站开发者关注和利用的对象。针对这些特性,互联网网站功能的开发变得不可避免,于是功能变得越来越强大,各种新兴网站在中国也变得越来越受关注,专门的博客,播客,网络社区等网站迅速涌现。在这多点开花的时刻,一种新的应用,被称之为伪web2.0技术,正在悄然升起,这就是语义聚合,而玩聚网(www.ju690.com)的智能语义聚合应用框架(IntelligentSemanticAggregationFramework,ISAF)就是这种技术应用的一个典型代表,ISAF意在实现一种理论和算法,可以像人类一样理解文本碎片,从而发现新知识。

要追溯这种技术的应用起源,我们要从美国的相关网站说起。2005年9月,TechMeme网站(TechMeme.com)在美国成立,TechMeme针对互联网上良莠不齐的海量信息,成功地对其热点进行了快速有效的挖掘,在一定程度上解决了用户信息焦虑的问题,很快受到了人们的肯定。TechMeme通过专业博客推荐,在第一时间获得报道和评论热点。由于美国博客习惯于加链接指向新闻或博文,所以,TechMeme可以假定被引用次数最多的文章就是热点,通过检测博文、新闻之间的链接,根据引用的频率来探测到大家在讨论什么热点。这需要众多高质量的,具有权威性的新闻源作支撑。于是,TechMeme建立了一个A-List,将众多知名博客和著名新闻源包涵其中。紧随其后,出现了Megite(www.megite.com),相对于TechMeme仅以部分内容为对象,这个网站涵盖了更加广泛的内容,并可以根据用户的需要定制热点内容。而且,Megite没有采用A-List,而是把整个互联网纳入监测范围。正是在这个时候,郑昀,玩聚网的创始者,产生了制作这种基于语义挖掘技术的网站的想法。他考虑到中国当前不乏好的博客作者,但却都不习惯于在其博客内容中加互相指向的链接,无法按照TechMeme的方式找到热点,便决定采取Megite的方式,不限定挖掘的范围,在全网络内做语义挖掘。

2007年1月,玩聚网的基于智能语义聚合应用框架的第一个垂直应用"玩聚新闻"上线,它追踪中文博客、论坛和新闻,根据文本相似性自动发现热点话题,把相关的文章、评论、图片、视频链接起来,组织成一个个精彩的热点故事。但由于智能语义聚合应用框架自身功能的局限,要想做到像人类一样思考和组织内容,并不是一件简单的事情。事实上我们浏览玩聚新闻模块上的内容,会发现,海量的信息很多仅仅是基于关键字相关性进行的简单拼凑,有些内容相关性很差;文章与新闻质量依然是良莠不齐,内容没有进行严谨的分类,给人一种零星纷乱的感觉,网站用户,尤其是对年轻网民,很容易产生焦虑,甚至失去自我。

2007年11月,以股票内容聚合为对象的玩聚网的宝聚模块上线,它通过语义聚合,以各个股票论坛、机构网站和财经博客为信息源,通过机器自动理解网民和专家对股票的看法,然后进行分类汇总,意在依靠对大量数据甄选来保证数据和信息可靠性以及对网民的价值,不断扩大影响力。

但事实证明,这个模块没有符合他最初利用互联网挣钱的愿望。具体原因笔者认为如下:

1.网络股票内容鱼龙混杂,以语义聚合技术为支撑,不能提炼出精瘦的具有价值的内容,致使用户在搜索自己需要的内容是,产生焦虑以致最终失去耐心;

2.对全网内容语义聚合结果,对于股民来说,不具权威性,不能满足他们对可信度的要求,虽然有专家内容,但网民可以通过其他更正规的渠道获取,且又可能进行一定的交互性交流,而宝聚模块上,至少从目前看来,没有此个性化服务;

3.市场上充斥着大量的专业网上炒股软件,信息可信度高,内容齐全,功能强大,而且已经汇聚大量网民,形成了巨大的粘性,凝聚力与网络群众价值,如果宝聚不能提供独具特色的服务,将难以有所作为。

按照郑昀说法:“我们想提供给用户一个对于各种股票进行预测的系统,利用互联网上对于各种股票的消息来预测。结果的确可以帮助用户对某只股票进行分析,但其预测性却并没有那么强。宝聚并没有给网站带来收入和影响力。”当然,我们要看到,宝聚只是处于初步开发阶段,功能和结构都尚未成熟,仍在不断改进。

宝聚模块一定层面的失败,同时也带来了一定的经验与教训,郑昀的玩聚网一直处于探索性构建与开发过程中,一个个新的模块相继而生,在这个过程中,玩聚网至今仍然没有赚到钱,但是其影响力却已经渐渐形成。如到今天为止,正如郑昀所说“靠网站赚钱是不现实的。”从当前流量来看,从谷歌赚取广告收就可以保持收支平衡,但郑昀的玩聚网坚持不挂挂广告。他想以技术为生,“在有了影响力之后,语义挖掘需求的网站和公司一定会出现的。通过这种线下的技术支持来补贴线上,成为目前比较可行的路子。”

纵观当前中国网络媒体,没有任何一家能够在浩瀚如海的网络资源中迅速搜集到最新最热的热点问题,这里无疑潜藏着巨大的市场机遇;而当今,国内的互联网博客大量涌现,其中不乏优秀博客作者,他们不但形成巨大的新闻源,而且不断推荐别人的文章,传播新闻源。笔者认为,郑昀正是看到这个巨大的市场机遇以及群众资源基础,才有了接下来的构建思想。

2008年5月,玩聚SD(SocialDialogue,社会对话)模块上线,相比于宝聚模块,语义挖掘技术应用到了博客上;而且SD重拾TechMeme的思路,放弃全网聚合热点的最初构思,将信息目标源锁定在每一领域的优秀博客身上,用以保证阅读价值和权威性。玩聚SD把全网络的关于同一篇文章有价值的回复或者对话聚集在一起,充分利用全网资源,构建一个大型对话平台,但这样一个平台同样没有带来收益与太好的网络效应,笔者认为有三个原因,总结如下:

1.互联网的信息庞大杂乱,利用语义聚合,把很大的精力浪费在了寻找信息而不是吸收和理解信息上,再加上理解信息在技术上的难以实现性,内容重复、文章质量不高这些问题时隐时现,给用户造成不好的感觉;

2.既然是社会对话,对交互性要求很高,网民看到感兴趣的对话内容,不免有发表意见的冲动;目前的玩聚网由于主要把精力放在智能语义聚合的技术实现与完善上,没有开发相应的交互功能,没有用户创造内容,作为游客的网民,缺乏对网站的粘性,网站模块在创建伊始很快抓取大量用户的心;

3.ISAF在自身技术上,有待于进一步完善。由于功能的局限,以全网为对象挖掘社会对话,会造成一定的类似于逆向选择的效应,以次充好;把目标定位在少数优秀的博客以及权威的新闻源上,容易使网站一直以来都是呈现一些熟悉的面孔,内容相对单一,难以充分利用长尾效应的互联网特性。

2008年12月21日,玩聚SR(SocialRecommendation,社会化推荐)模块上线,社会化推荐模块抓住网民的心理与需求,假设网民通过SR发现自我感兴趣的内容后,会积极的写出评论,而玩聚网暂时没有提供这样一种进行交互性的平台,按照郑昀的说法,“其实没有自己平台产生的内容数据也不算太大问题,至少在网站成长期。主要的问题是,如何让使用玩聚网的用户转为注册用户。我们的考虑是,你如果单纯提供一个注册用户功能,但又无法提供给注册用户更有价值更独特的功能,那么就白花时间开发了,也浪费用户的感情,以后的产品如何让用户产生注册的动力呢。”本文认为,提供这种交互平台,关键要看怎么运作,如果能够很好利用,反而会成为一种吸引网民的原动力,而并非障碍;如果这种交互性是网民的一种重要需求,缺乏这种功能又何尝不是一种障碍。但是,戏剧性的事情发生了, 郑昀认为,一篇文章在这些平台中被推荐得越多,就证明关心的人越多。玩聚SR把正个社会化网络作为平台,把用户基于本站内容,在其他网络上的媒体与平台上发表的评论,再抓取回来,显示在自己的网站上,更加彰显这些内容对用户的价值。我们可以把这种机制理解为全网范围的交互。

所以说,玩聚SR是一个追踪各种社会化媒体,实时发现IT社群在分享和推荐什么的工具。再一次采访中,郑昀曾告诉记者:“如果说社会化媒体继续良好发展的话,基于社会化媒体上面的数据聚合和智能过滤,我觉得应该是一个大的方向,就是针对这些数据进行检测,进行合并、过滤,这个机会可能非常大。”“人们在各种社会化媒体上推荐或分享的好东西,推荐得越多,相对价值越大。我们只需要把这些推荐聚合起来,就变成了一个像Digg一样的系统,它能带给我们质量最高、最稳定的新鲜又好看的文章和资讯。我们称之为“社会化推荐”,这里的“社会化”指,推荐来源是各种社会化媒体服务,推荐者是社会化网络中的人。”SR模块我通过手动选择一些知名社会化媒体用户作为起源,以各种技术算法为支撑,基于网络六度空间理论,链接起整个网络中足够多的社会化媒体用户。再进行实时扫描汇总,动态抓取热点内容引,最后通过语义技术,进化到协同过滤和语义过滤的自动化推荐系统。按照郑昀的说法“我们最初并没有想到SR会受到大家的肯定。这实际上是一款技术需求最低的产品,只花了几天就做好了。”也许这对他来说使一次意外之喜,但笔者认为,其成功包涵了诸多因素,本文简要介绍几点自我看法:

1.把目标定位于用户的行为与需求,以用户为中心,再选择合适的技术去实现,得到了用户的认可;

2.坚持自己的特色,明确体现自己的目的,用给用户带来不同感受的差异化方式满足用户需要;

3.合理利用先进的技术集合众多信息,不断完善和修正,改造和提高。

玩聚网之我见 玩聚北京官网

到目前为止,玩聚网仍处于不断开发完善之中,总的来说,主要包含五大模块:1.宝聚模块(相对独立);2.社会对话模块;3.社会化推荐模块;4.ExploreRetweets模块(系统维护中,尚不明了);5.BigEvent(聚事件模块)。

根据郑昀的介绍:玩聚SR=(RssMeme+TweetMeme+Popacular+…)+语义计算;玩聚网的Web部分都是Django框架搭的,便于快速构建;后台则跑了很多很多的服务,如爬虫,如语义计算,如统计,如数据挖掘,等等,都是用Python写的独立服务;自然语言处理部分,如分类、相似性计算、标签提取、重复检测等,都是C++写的。郑昀和他的技术团队一直致力于各样的数据和方法的研究之中,如何利用有效的方法把它们进行有效整合,完美呈现在用户眼前。对于好的文章的甄选,玩聚网探索的大致有两种测量维度(以下是一次访谈郑昀的说法):1.找到用户或站方信赖的信源;2.找到用户或站方信赖的人。具体的测量方法,有三种途径:

一,监测信赖的信源。如果足够多的资讯都在说同一件事,那么这件事可能是值得看的热点;如果足够多的资讯都在重复传播同一篇文章,那么这篇文章可能值得阅读。

二,监测信赖的人。如果足够多的人都推荐、分享和转发了同一个资讯,那么这个资讯就可能是优质的、值得被你信赖的。

三,把上面两点混合起来用。

对于郑昀和他的团队来说,玩聚网到现在为止,一直靠着投资商的资金支撑,盈利一直是一个需要直面而解决的难题,郑昀曾告诉记者,“一位投资人告诉我,我看不懂你们的东西,更看不出怎么赚钱。”基于语义聚合进行语义挖掘,在中国来说还是一个新鲜事物,需要根据中国现状,不断探究适合自己的盈利模式,不能照搬外国模式。对于一般用户而言,按照玩聚网的意向,未来必然要走出简单聚合的概念,推出用户体系,实现网站交互性,满足用户个性化需要和个人内容定制;对于公司而言基于互联网的海量内容,利用语义聚合等技术,对各种信息与资源能够统计出相对客观的评价与评分,而对于不同类型的信息评价,必定会有不同类型的公司的需求,这些公司要么是不具备这些先进互联网分析技术,要么是自己分析成本太高,或者无暇从主业上分心。所以,玩聚网在中国很可能走个性化推送和口碑营销之路。

宝聚网目前在互联网上的用户界面,本人认为还是太过粗糙,本人在朋友之间做了个初步调查,主要反映有两点:

1.板块界限不是很明确,各个板块都没有太大的差别!

2.网站定位不明确不知道吸引的是什么群体!

玩聚网的资金,人才,信息都有了,所有参与者都付出了和正在付出努力和心血;但对于网站建设的五个基本要素是:目的,资源,技术,对象,效果,这几个方面的处理上做的还不够,是时候改善一下了。

  

爱华网本文地址 » http://www.413yy.cn/a/25101013/171607.html

更多阅读

转载 学医心得张涵之我见 转载 教研员培训心得

原文地址:学医心得张涵之我见作者:上善若水学医心得张涵之我见http://pyzhanghan1.blog.163.com2009-08-1721:40:06|分类:中医类|标签:|字号大中小订阅学医心得张涵我在随恩师学习的过程中,有一些心得和体会,因为资质愚钝,当然属于一些

转载 物有本末:“系统”理解之我见(钱神电信)

原文地址:物有本末:“系统”理解之我见(钱神电信)作者:同心圆镜物有本末:“系统”理解之我见作者:无住  出处:钱神电信按(道一):  基本系统:“德为先,智为重,道为用”。系统法则:“知止而后有定,定而后能静,静而后能安,安而后能虑,虑而后能得

从李天一到李冠丰命运之我见 李冠丰案女主角杨佳

从李天一到李冠丰的命运之我见 近日各大媒体纷纷报道了著名歌唱家李双江之子李冠丰等五男在二月十七日涉嫌轮奸一女的犯罪事件,人们在关注此事的时候,很多人都在埋怨李双江老师的教子之道,其实从根源上来看,这不仅仅是李双江老师一人

“朦胧诗”之我见 朦胧诗的特点

“朦胧诗”之我见——倦客1986年所作论文注——近期,朋友文茹先生诗兴大发,佳作迭出,对曾经因诗而喜欢文字的倦客来说,阅朋友佳作美文,不禁心急手痒,蠢蠢欲动,总想网上涂鸦,以和朋友浅吟低唱,谁知电脑码字,脑袋一片空白,江郎才尽,老年痴呆,即

声明:《玩聚网之我见 玩聚北京官网》为网友岁月成沧海分享!如侵犯到您的合法权益请联系我们删除