~ 约稿 庄表伟 榨取社区直觉
原文: 如何定量的评价一个技术社区的优劣? - 思考IT - 知乎专栏
这回又是朋友约稿,出了个天大的题目,我当时脑子一热,也就答应下来了. 现在想想,谈何容易啊?
这是我设想的,一个社区的良性循环模型:一个氛围良好的社区,能够不断创造优质的内容;而优质的内容通过各种渠道,吸引新人加入;而一个能够不断接纳新人,并且将其融入的社区,则能够始终保持高质量的成长.
这个循环,对于各类社区(并非局限于技术社区),应该都是适用的.
从这三个维度,我们可以找到三组指标来进行衡量:
- 社区氛围:
- 社区黏性指标: 会员每周平均在线时间,平均每次在线停留时间,可以作为两个比较重要的指标.
- 社区互动性指标:首先需要定义何为互动,我发表内容,你评论,则你与我互动. 我回复评论,则我与你也互动起来了. 就好比一块石头投入池塘,会引发多少涟漪,这是一个社区活力的体现. 转换成定量的指标,我们可以设置两个:
- 人均每日互动次数;
- 一周内单篇内容引发互动总数; 来作衡量.
- 创造内容:
- 引用性指标:一个网站的内容,被多少站外地址引用,这本来就是一个常用的质量指标,Google的Page Rank,也是这样的指标.
- 传播性指标:在SNS网络兴起以后,一篇内容被分享出去多少次,变得非常重要. 我们可以简单的用站外流量,进行衡量.
- 招揽新人:
- 转换率指标:一个从站外点击过来的用户,会有多少转换为社区的注册用户,这就是转化率.
- 留存率指标:对于社区而言,新人注册之后,七日留存率;30日留存率;都是重要的参考指标.
以上讨论的三组指标,都可以是适用于任何内容型社区,而对于技术社区而言,应该需要更多的专项指标:
技术日新月异,新的名词层出不穷,一个技术社区的开放程度与丰富程度,可以从社区内讨论的技术新旧程度,以及讨论技术的广度,深度来判断. (深度的确太难量化了)
Webopedia: Online Computer Dictionary for Computer and Internet Terms and Definitions
这是一个很有意思的网站,他会不断的收集最新出现的计算机与网络新词汇. 也许我们可以做一个词汇扫描,看看这里新出现的词汇,在多久以后,会出现在技术社区的讨论区里.
技术牛人,是一个技术社区的宝贵财富. 但是这又是最难被量化的部分. 如果某个技术社区,每个会员都被要求填写自己的Github帐号(甚至只能用Github帐号登录),那么,我们可以用这个技术社区的全体会员的所有Github Repos,所获得的Stars数量与Forks数量,来做一个粗略的估计.
当然,特定的技术社区,还可以有更加准确的统计:例如一个Linux内核社区,可以直接统计他们对于Linux内核每年贡献的补丁数量,诸如此类.
以上就是我的一点抛砖引玉.
是也乎
参考: 婉兮清扬 » CY13-Q4 OpenStack, OpenNebula,Eucalyptus,CloudStack社区活跃度比较
清野 蒋 面对类似的命题,则是谨慎的选择了两个指标进行深入追踪:
- 列表/论坛 的活跃度
- 代码仓库的活跃度
这就可以看出老庄的设想,其实不是技术社区的定量分析,而是媒体社区的定量分析.
- “社区黏性指标” 设想的几个,其实只是对 广告商有意义,对于技术社区而言,可能是反效果
- 因为 “平均停留时间” 越长可能意味着成员,无法快速找到需要的帮助/文档
- “引用性指标” 使用搜索引擎的 PR 值,这也明显是广告商才有用的指标
- 因为技术社区最核心的内容,不是文字,而是代码/模块/库/安装文件
- 如果不统计这种核心作品的”引用”,而一视同仁的对所有页面的 PR 进行衡量,有失重点
- “转换率指标”,”留存率指标” 更加有指向性了
- 一个简单的模块还好,如果是一个相对复杂点儿的框架,就不是7天内可以上手进而能够反馈贡献的了
- 所以,这种注册率,其实对于一个开源社区而言,可能是种伤害
另外: "技术牛人"
是种逆天的存在,
如同 幽游白书
中所分析,一个技术社区,可能整个社区的创新能力有
90% 以上聚集在创始人身上.
所以, 基本无法进行理性的量化衡量,
但是, 可以作为单独条目,进行PK 的…
但是,这的确给出了一个异常冷静的起点, 只要稍微调整一下就是一个可用版本了;
大妈目测,综合以上两家思路,对一个社区的量化评定,的确三个相互依赖的指标就足够了:
- 活跃人口
- 本季度 交流渠道每日邮件/贴子通量
- 本季度 邮件/帖子的平均回复次数
- 本季度 社区活跃成员人口
- 仓库活跃度
- 本季度 仓库提交次数
- 本季度 代码贡献人数
- 本季度 贡献来源域名数量
- 传播指数
- 本季度 仓库fork 数量
- 本季度 下载/部署数量
- 本季度 搜索关键词指数
当然,具体的怎么收集,自动化统计以上三个方向的数据, 并最终能综合出一个技术社区通用的衡量指数来, 这真心要有专门的团队持续折腾了…
PS:
若无意外,题图都是从原文提取或是通过 Google 图片搜索出来的, 版权属左, 不负责任 ;-)