用大数据告诉你身边的IT故事

jopen 8年前

        最近我们 Team 利用 Dream 分布式计算平台,做了这样一件事情,将 Github 的大量数据通过爬虫抓取下来,通过分析后,我们抽取最近一年中部分的开发者和项目信息,得到了如下有趣的信息,故分享之,数据原汁原味,无人工干涉。

        第一份数据:全球 IT 人才分布

用大数据告诉你身边的IT故事

        图 1 全球 IT 人才分布图

        其中颜色越深,表示聚集的 IT 人才越多。其实从这一份数据来看,我们都能理解美国、中国、印度、俄罗斯是软件大国,但是我们也发现,南非和巴西表现也不错。

        第二份数据:全球软件城市排行榜

        这些城市按照名次依次是:San Francisco、London、Berlin、Paris、New York、Stockholms、Beijing、Bangalore

用大数据告诉你身边的IT故事

        通过对前 8 名的统计得出,硅谷地区依然是世界的 IT 中心,我们不要感觉欧洲 IT 产业不怎么好,从数据来看,他们的能力依然是非常出色的,北京与世界的差距依然存在,印度的硅谷与北京的差距并不明显。

        第三份数据:中国软件城市排行榜

        按照名次,他们依次是:Beijing、Shanghai、Hangzhou、Guangzhou、Shenzhen、Chengdu、Nanjing、Dalian、Xiamen、Qingdao。

用大数据告诉你身边的IT故事

        这份数据再次证明了,北京上海是中国无法震撼的 IT 城市,即使是杭州,也有相当大的差距。南京市政府一直努力的中国软件名城,需要很大的努力。

        第四份数据:全球软件企业排行榜

        我们分析出来了其中 7 家企业,分别是: Google、推ter、Microsoft、Yandex、Red Hat、Globo.com、ThoughtWorks。

用大数据告诉你身边的IT故事

        从这个图来说:谷歌是开源社区的贡献主力,但是名单上也有微软公司,这也再次证明,微软是同样一家致力于开源世界的企业,当然这里肯定发现不了 Oracle。所有企业都发现了两个问题:1.投资开源社区可以提升企业综合影响力。2.要达到相同的影响力,投资额度小于广告。

        第五份数据:中国软件企业排行榜

        你期待这里出现什么样的公司?我不敢瞎编,用数据说话,他们是:TaoBao、Baidu、Tencent、Douban Inc、Alibaba、netease。

用大数据告诉你身边的IT故事

        这些公司都是国内目前比较活跃的软件公司,但是 360 奇虎公司是个意外。我们很少关注的网易,最近一年也为开源社区做了不少贡献。

        第六份数据:全球 IT 高校排行榜

        这份数据我真的不想拿出来,因为没有中国的高校,我试图让名次更多一点,但是依然没有发现。全球 IT 高校排行榜名单:Carnegie Mellon University、University of Washington、Stanford University、University of Michigan、Cornell University、Columbia University、University of Cambridge、University of Toronto、University of Waterloo。

用大数据告诉你身边的IT故事

        数据再次验证了卡内基梅隆是全球 IT 精英的殿堂。教育是非常重要的一部分,中国要成为软件大国,还需要在教育上努力下功夫。

        第七份数据:中国 IT 高校排行榜

        虽然在上一份数据中,我们没有发现中国高校,但是我们还是拿出了中国软件高校排行榜:Tsinghua University、Zhejiang University、Peking University、Sun Yat-Sen University、Nanjing University、Shenzhen University。

用大数据告诉你身边的IT故事

        清华大学一直是中国 IT 教育领域最好的高校,很多关于计算机的图书都是清华大学出版的,当然中山大学却有点让人意外。

        总结:事实告诉我们,所有的什么软件大国,所有的软实力,都不能只是口号,我们需要实际行动,中国要成为软件大国,甚至是强国,还有很长的路要走。为什么?开源是在酝酿新技术,是新技术发展的摇篮!