21
Aug

Google 评价 blog 的指标

From: http://www.guwendong.cn/post/2008/google_blog_rank.html

读了一下 Google 关于 Blog Ranking 的 Patent,总结如下。

正面的指标:

  1. [0038] 订阅数
    统计 blog 在各种 reader 中被订阅的数量。被订阅的越多,ranking 越高。但同时会使用一些方法处理“subscriptions spam”,诸如验证订制人和 IP 的唯一性。
  2. [0039] 搜索点击数
    统计 blog 作为搜索结果时被点击的次数。点击次数越多,ranking 越高。
  3. [0040] 在其他 blogger 的 blogroll 里的出现次数
    blogger 通常会使用 blogroll 来整理指到其他 blogger 的链接集合。统计所有 blogroll 中,指向某个 blog 的链接越多,ranking 越高。
  4. [0041] 来自高质量的 blogroll 的链接数
    高质量的 blogroll 的链接大多都指向著名的或值得信任的 blog。
  5. [0042] 来自高质量的 blog 的 blogroll 的链接数
    这里的假定是著名的或值得信任的 blogger 不会放指向 spam blog 的链接。
  6. [0043] 有Tag
    blog 作者如果分析了 blog 内容,归类并打上了 tag,起码可以说明作者的态度比较认真。
  7. [0044] 来自邮件和聊天记录的链接数
    如果在 Email 正文里或者聊天记录里出现了指向 blog 的链接,会加分。GEmail 和 Gtalk 被用在了这里。
  8. [0045] PageRank
    PageRank 越高对应的 blog 也就越重要。考虑到blog的更新比较频繁,最新的 blog post 可能还没有PR。这时可以用对应的 blog 的 PR 来代替。

其中 [0040-0042],其实是类似于传统网页间 PageRank 计算的一套模式,只不过这里把它限制在了 blog 之间。

负面的指标:

  1. [0047] 更新频率异常
    更新过于频繁或者非常有规律,会被认为是在 spam,ranking 会降低。这里提醒喜欢在每天的固定时间更新 blog 的朋友注意一下了。
  2. [0048] feed 内容和 blog 内容的不一致
    spammer 有可能会为了提升自己的 ranking 而把有价值的内容放到 feed 里面,同时在 blog 内容里面放一些指向不相关内容的广告链接。为了惩罚这种情况,对于 feed 内容和 blog 内容不一致的情况,要降低 ranking。
  3. [0049] 出现重复内容
    有些 spammer 为了让某些内容能够多次长时间的出现在 feed 里面,会重复发布同样的内容。这样的情况会被惩罚。
  4. [0050] 垃圾词过多
    通过词频统计(bi-gram 或者 tri-gram 等),如果 blog 内容里垃圾词的比较过高,会降低 ranking。
  5. [0051] 多数 blog 长度相近
    这个主要是针对使用机器自动生成 blog 的情况。
  6. [0052] 链接异常
    当 blog 里的链接多为指向单一网页,或者单一的外站,会被认为是在 spam,ranking 会降低。
  7. [0053] 广告太多
    如果一个 blog 页面内含有过多的广告,会降低 ranking。
  8. [0054] 广告太多
    一般 blog 页面会包括三方面的内容:最近发表的 blog,blogroll 和 metadata。如果广告出现在正文里,会降低 ranking。不知道 adsense 的广告有没有特殊待遇?

,

城市风景小区目前物业名为安徽合居美尚物业,该物业是刚于本月才成立的物业公司,只有暂定为三级的资质,无论从管理水平,管理资质上都不能达到一级服务标准,物业收费却按一级收费收费,有违《合肥市住宅小区物业综合服务收费指导价标准》的相关规定,但是在众多业主再三要求以及多次提意见之下,仍然没有得到任何答复和解决。

让我们来看看这个物业的所作所为吧
无组织无纪律,解决不了任何问题,遇到投诉一概推托,遇到问题一概无能为力,袖手旁观甚至说风凉话,晚上物业无人值班,出现任何问题没人可联系,更不可能帮忙解决;反而人多势众,一副欺软怕硬的样子,仿佛欺负业主才是正道;物业形同虚设,尤其是保安无所事事,近日来我们小区接连发生2起入户盗窃事件,被盗住户已有6家(5号楼4家,6号楼2家,第一时间,高新区公安局均有记录)。而且盗窃案件是在8.8号连盗四家5天之后又盗2家!!我们的物业“无所畏惧”毫无作为,简直拿业主的生命财产安全不当回事!!

相关恶劣表现不胜枚举!!请问,这样的物业,你们能够忍受吗?请问KFS, 这样的物业你们是怎么熟视无睹的?那么我们这些业主呢?是该行动起来还是继续沉默下去呢?

让大家都来了解一下,城市风景给了我们怎样的房子,又给了我们怎么样的物业?让一切惨不忍睹的行径曝光在众目睽睽之下,让更多的人来了解这个小区!!

最近在把在 tomcat 5.5 上开发的项目 deploy 到 JBoss 4.2 上时,在操作一段时间就会出现 java.lang.OutOfMemoryError: PermGen space,开始以为是代码中存在死循环的地方造成这样的问题,但是后来发现,出问题的地方都是随机的,并不是某一处造成这样的问题出现,怀疑是内存泄露,通过增大 heap 内存的方法来尝试,依然不行,但是同样的问题却并没有在 tomcat 中出现过,难道是 JBoss 的问题?

在网上做了一番搜索得到一些相关的内容。

PermGen space的全称是Permanent Generation space,是指内存的永久保存区域OutOfMemoryError: PermGen space从表面上看就是内存益出,解决方法也一定是加大内存。说说为什么会内存益出:这一部分用于存放Class和Meta的信息,Class在被 Load的时候被放入PermGen space区域,它和和存放Instance的Heap区域不同,GC(Garbage Collection)不会在主程序运行期对PermGen space进行清理,所以如果你的APP会LOAD很多CLASS的话,就很可能出现PermGen space错误。这种错误常见在web服务器对JSP进行pre compile的时候。

改正方法,在 run.bat 中加入:-Xms256m -Xmx512m -XX:MaxNewSize=256m -XX:MaxPermSize=256m

因为项目中引用了很多的 jar 包,而这些 jar 包中的 class 信息会被 JBoss 的 class loader 加载到 PermGen space 区域,在 JVM 默认的情况下,该部分空间的大小只有 4M,在 jar 包非常多的情况下,显然是不够用的,所以通过 -XX:MaxPermSize=256m 指定最大值后即可解决问题。

另外,如果 heap 内存不足出现 java.lang.OutOfMemoryError: Java heap space 时,可以通过 -Xmx512m 指定最大 heap 内存来解决这样的问题。

在 Linux 环境的 JBoss 下,修改 run.sh 在文件开始的地方加入:
JAVA_OPTS=’-Xms512m -Xmx1024m -XX:MaxNewSize=256m -XX:MaxPermSize=256m’

在 Linux 环境的 Tomcat 下,修改 catalina.sh 在文件开始的地方加入:
JAVA_OPTS=’-Xms512m -Xmx1024m -XX:MaxNewSize=256m -XX:MaxPermSize=256m’

, , , ,

8
Aug

国内热门的开放平台

1、 搜狐博客€€开放平台

以博客作为个人应用平台,由开发者及搜狐爱好者开发相关博客应用小程序;由搜狐推出相关文档说明及参数。
网址:http://ow.blog.sohu.com/

2、 谷歌OpenSocial

通用 API 意味着,您仅需较少的学习,便可为多个网站进行构建。目前,OpenSocial 由网络社区的广大成员联合开发。最终目标是,对于所有社交网站都能够执行 API 并托管第三方社交应用程序。许多网站在执行 OpenSocial,包括 Engage.com、Friendster、hi5、Hyves、imeem、LinkedIn、MySpace、Ning、Oracle、 orkut、Plaxo、Salesforce.com、Six Apart、Tianji、Viadeo 和 XING、天涯。
网址:http://code.google.com/apis/opensocial/

3、 淘宝开放平台

淘宝开放平台项目(TOP: taobao open platform)是淘宝(中国)软件公司面向3rd app开发者,提供API接口和相关开发环境的平台。包括:
€€ API接口规范和定义及其规范
€€ API sandbox 在线开发测试环境

网址:http://www.taobao.com/theme/tao_source/

4、 天涯开放平台

由Google Opensocial提供技术服务的天涯开放平台,主要整合商家;如:7天酒店。
网址:http://my.tianya.cn

5、 校内网开放平台

校内网将于7月8日正式启动校内开放平台插件功能大赛。现邀请三方公司及个人开发爱好者一起加入校内开放平台插件开发,共同探索平台开放之路。

网址:http://www.xiaonei.com/developerIndex.jsp

6、聚友(Myspace)开放平台

MySpace聚友开发者平台(MySpace Developer Platform 简称MDP)是一个面向开发者的开放平台,开发者可以在上面开发并且发布符合OpenSocial规范的应用程序,比如Widget、Gadget。
网址:http://developer.myspace.cn/community/

7、51.com开放平台

51开放平台API是采用REST基础的接口规范。所有的51开放平台API都是通过HTTP的GET或者POST请求来实现调用的。有了这些API,你就可以通过你的应用程序获得51.com社交网络的用户资料、好友关系、照片等几乎所有可开放的数据。
网址:http://sandbox.developers.51.com/index.php

8、康盛uchome “我的空间”

UCenter Home使用网站的开放平台应用开发标准(API),Manyou将有机会帮助您与数万网站之间建立合作的纽带,为这些网站上的网民提供个性化的互联网应用。

网址:http://uchome.developer.manyou.com/uchome/

9、雅虎开发者社区

NCP是中国雅虎针对站长天下等产品推出的开放式的web应用/模块开发平台。
开发者可以在该平台开发基于Web的模块,即NCP扩展应用。
网址:http://dev.cn.yahoo.com/

10、豆瓣API

豆瓣API是豆瓣为第三方开发人员提供的编程接口。利用豆瓣API,你可以在你的网站或程序中使用豆瓣的数据和功能。

11、新浪魔方

新浪魔方通过组件化的功能组合,灵活方便地满足不同用户的个性需求
网址:http://mofun.sina.com.cn/

12、Facebook开放平台(英文)

Facebook应该说是开放平台的先行者了,Facebook的成功就是因为开放平台及API应用。对于已经在中国推出中文的Facebook。我们应该不能把它忘记。
网址:http://developers.facebook.com/

最后,我希望一些公司能根据实际情况推出相关服务;切不要跟风,以免浪费财力与人力。最终却获得不了太多有价值的信息。一项新技术的发展,需要更多的参与者,而不是服务的提供者。以免出现,供大于求的局面;反尔会把这些新的应用推向无价值的边缘。

8
Aug

初探淘宝开放平台(TOP)

  淘宝网,国内最大个人网上交易社区正式推出了开放平台(Taobao Open Platform,TOP),用户可通过淘宝开放的API,创建各种不同的电子商务应用。

  淘宝开放平台项目是淘宝软件公司面向3rd App开发者,提供API接口和相关开发环境的开放平台。软件开发者可通过淘宝API来获取淘宝用户信息 (卖方和卖方用户信息,私有信息需要授权)、淘宝商品信息 (全淘宝超过1亿个商品的名称、类目、型号、介绍等信息)、淘宝商品类目信息(全淘宝商品索引及分类明细)、淘宝店铺信息(全淘宝店铺信息)、淘宝交易明细信息(在取得用户授权的情况下,查询每笔交易的详细情况)、淘宝商品管理(淘宝商品的上传、编辑、修改等接口)等信息,并建立相应的电子商务应用。同时,作为淘宝开放平台TOP项目的唯一合作平台——阿里软件平台在其中也扮演着重要的角色,它将为开发者提供整套的淘宝API的附加服务:测试环境、技术咨询、产品上架、版本管理、收费策略、市场销售、产品评估等等。

 

  很多人会联想到之前 Facebook, Google 等互联网巨鳄推出的 OpenAPI,这些主要都是社交类的 API,提供 SNS 相关的服务,从而扩大自己的用户群。但是很多人都认为,淘宝这样的大型个人交易类的网站,用户数据是非常私密的资料,那么淘宝为何要提供开放 API 呢。

  大家不妨将视野放宽,扩大到淘宝以外,聚焦到阿里巴巴旗下的另一个子公司——阿里软件,就能看到淘宝开放平台的目的所在,和 Facebook 不同,Taobao Open API 的目标不仅仅是扩大自己的用户规模,重要的是,阿里巴巴要用这个平台为自己赚钱。或许看到这里,大家都很纳闷,既然是开放平台,都是开放的,如何去赚钱,盈利呢?这个重任被压在了阿里软件身上,这个摇钱树就是近几年一个很热的名词 SaaS。一年前,我们看不出来阿里软件有什么不同的地方,提供了诸如阿里旺旺等工具,而且都是免费的。从今年年初开始,大家就开始感觉到阿里软件的变化,它提供的软件不再是纯粹自己开发的了,更多的是将一些重要的数据接口提供给第三方开发者,第三方开发者利用 Taobao Open API 完成自己产品的开发整合工作后,将自己的软件发布到阿里软件平台上,有客户购买了第三方的服务后,阿里软件就顺理成章的从中抽取佣金。这是一个新颖的模式,也秉承了阿里巴巴一贯的风格,首先让别人赚钱,再自己赚钱。阿里巴巴希望通过淘宝这样一个巨大的商业用户平台,发展出一个 SaaS 的中小软件产业圈。

  淘宝是免费的,淘宝开放平台也是免费的,但是淘宝却慢慢的开始赚钱,并不是提供免费的东西就不能赚钱,人多了,总是有办法赚钱的。

, ,