首页 > 新闻资讯

Python完胜R语言,成为数据科学、机器学习平台中最热门的语言

发布时间:2018年03月16日 发布单位:臻创

近日,kdnuggets 做了一个关于数据科学、机器学习语言使用情况的问卷调查——关于2016年和2017年,数据科学和机器学习工作中,受访者的编程语言选择。

通过分析了 954 个回答,得出结论——虽然 Python 尚未完全“吞噬” R,但 Python 已经超越 R 语言,成为分析、数据科学和机器学习平台中使用频率最高的语言。

2016-2017年,使用Python、R语言、Python和R语言、其他语言的占比

在 2016 年的时候,Python 排行第二(主要使用 Python 的人占 34%,而主要使用 R 的人占 42%),到了 2017 年,Python 占的比例上升为 41%,而 R 则变成 36%。也就是说到了 2017 年 Python 已经以 5% 的占比优势超过了 R。

与此同时,同时使用 Python 和 R 的人也从 2016 年的 8.5% 上升到 12%。使用其他语言的人从 16% 下降到 11%。

接下来,我们来看看各个语言之间的转换情况,如下图所示:

2016-2017年,数据科学以及机器学习平台中各种语言的转换情况

这张图看起来很复杂,但是仍能看出 Python 在忠诚度和转换率的两个方面,都是优于其他语言的。 

忠诚度:Python 用户的忠诚度明显高于其他语言

2016 年使用 Python 的开发者中,到 2017 年仍有 91% 的人选择继续使用它,而选择继续使用 R 语言的人只有 74%,使用其他语言的则为 60%。

转换率:Python 用户的流失低于其他语言

从 2016 年到 2017 年,只有 5% 的 Python 用户转向 R 语言,而 R 语言用户转向 Python 的则是10%,相当于前者的两倍。另外,2016 年同时使用两种语言的人中,只有 49% 的人还在继续使用这两种语言,38% 的人转向 Python,11% 的人转向 R 语言。

接下来我们看一下 2014-2017 年这几种语言的使用趋势。这里采用如下计算方法:

Python * =(Python 的占比) + 50%(同时使用 Python 和 R 的份额) 

R * =(R 的占比)+ 50%(同时使用 Python 和 R 的份额)

从上图数据可以看出,R 的使用份额持续下降(从 2015 年的约 50%到 2017 年的 36%) ,而Python 份额正在快速增长 - 从 2014 年的 23% 上升到 2017 年的 47%。其他平台的份额也在逐渐下降。 

最后,我们来看看各地区的语言使用情况:

美国/加拿大,40%

欧洲,35%

亚洲12.5%

拉美,6.2%

非洲/中东,3.6%

澳大利亚/新西兰,3.1%

为了简化图表,我们将亚洲,澳大利亚/新西兰,拉丁美洲,非洲/中东地区分成 4 个地区,并且按照上述算法折算出各个语言的比例。 得出的结果如下图:

可以得出不同地区的语言变化情况如下:Python 份额增加了 8-10%;R则下跌了约 2-4%;其他平台下降 5-7%。

因此,由以上数据可以得出,Python 未来的发展潜力无限,前景可谓是一片光明,不过暂时也无需担心 Python 会完全取代 R 或者其他语言,因为这些语言也具有一部分忠实的用户基础。

文章来源:程序猿 猿妹 编译

原文:http://www.kdnuggets.com/2017/08/python-overtakes-r-leader-analytics-data-science.html


底线下有更多精彩内容
×

联系我们

姓名
电子邮箱
手机号码
短信验证码
备注信息