懂哪種程式語言收入最高?

時間 :10:15 取得文章短網址

文章分類 : News, Research, SMB

本文翻譯自 bpodgursky 的文章 《 Average Income per Programming Language 》,透過數據分析討論 GitHub 上使用各種程式語言的工程師平均收入概況。當然,本文只能作為一種參考,作者詳細說明了統計方面的種種限制以及可能出現的偏誤。

內文如下

幾個星期前,我在博客中描述我如何使用 Git 的 metadata 和 RapLeaf 的 API 來建立 GitHub 上各種組織的人口統計概況(博客文章點這裡,每個組織的數據點這裡)。

我也曾嘗試用不同方法截取數據,得出針對每種程式語言(而非組織)的人口統計概況。有關使用不同程式語言開發者的刻板印象比比皆是,我很好奇它們如何與現實掛鉤。從每個程式語言使用族群的基本訊息如年齡、收入、性別開始分析,根據我手上既有的資料,要做到這一點並不困難:

  1. 我採用 GitHub 對每個 repostory 程式語言組成情況的估算。例如,GitHub 估計某個項目使用了 75% 的 Java 語言;
  2. 我從中得知每個項目中使用比例超過 50% 的是甚麼程式語言,某個項目中使用此一主要語言的開發人員是誰,並把他們的收入加總;
  3. 我進而篩選出收入數據點(data point)大於 100 的程式語言。

以下便是收入情況的統計,根據家庭平均收入由低到高排列:

同樣的數據以圖表的形式呈現如下:

大部分的排行結果大致符合我的預期:

  1. Haskell 是種非常偏學術的語言,因此在收入方面並不可觀;
  2. PHP 是種較容易掌握的語言,方便非專業的或是初級工程師使用,也因此收入相對不高;
  3. Java 和 ActionScript 已收入來看則被認為是高級的語言,多用於企業軟件的開發,因此收入頗豐。

另一方面,我不太了解圖表兩端的某些語言,例如 XSLT、Puppet 跟 CoffeeScript,也不清楚造成它們排名高低的原因。

不過在我們下出過多結論前,必須明白這些數據的限制:

  • 這些項目是開源的,無法適用於閉源(closed-source)程式開發人員的報酬;
  • Rapleaf 數據不涉及總收入訊息,樣本可能因此有所偏差;
  • 我忽略了年齡、性別等因素對造成數據分配偏態的可能性;
  • 我沒有分析所有的 GitHub repostory,作為樣本的用家數據可能不具代表性。

這樣說吧,即使在絕對數字上有所偏差,這仍然是比較不同程式語言間相對收入差別的一個開始。

你可能會對以下文章有興趣:

Leave a Reply

Your email address will not be published.