Python-Studie: Die meisten Entwickler nutzen Python zur Datenanalyse

Data Science ist laut einer Studie der Schwerpunkt beim Python-Einsatz – Selbstverständnis und Einsatzgebiete der meisten Entwickler sind jedoch vielfältiger.

Lesezeit: 3 Min.
In Pocket speichern
vorlesen Druckansicht Kommentare lesen 95 Beiträge
Von

Im Herbst 2019 hatten die Python Software Foundation (PSF) und der Hersteller von Entwickler-Tools JetBrains gemeinsam die bislang dritte, jährlich ausgerichtete Python Developers Survey durchgeführt. Ein Kernergebnis der Umfrage ist, dass die meisten Befragten Python für die Datenanalyse einsetzen.

59 Prozent gaben die Datenanalyse als einen Haupteinsatzbereich für Python an, 53 Prozent als Nebenschauplatz. Diese Angabe ist gegenüber dem Vorjahr offenbar konstant. Befragte konnten sich hierzu mit Mehrfachnennungen äußern. Weitere Schwerpunkte im Einsatz von Python liegen in der Webentwicklung (51 %), Machine Learning (40 %) und DevOps (39 %). Insgesamt gab der Großteil der Befragten an, einen Hintergrund in Webentwicklung, Datenanalyse oder Machine Learning zu haben. Auch Software Prototyping und Testing, besonders das Konzipieren automatisierter Tests, und DevOps-Aktivitäten wiesen die Teilnehmer als Betätigungsfelder aus.

Bereiche, in denen Umfrageteilnehmer Python einsetzen (Mehrfachnennungen möglich)

(Bild: JetBrains)

Bei der Frage nach dem Haupteinsatzgebiet (mit nur einer Antwortmöglichkeit) gaben die Befragten am häufigsten an, Python für Webentwicklung (28 %), Datenanalyse (18 %) und Machine Learning (13 %) einzusetzen. DevOps und das Schreiben von Skripts für Automatisierungsprozesse konnten besonders viele Entwickler als ihren zweiten Fokus für sich vermelden (17 %).

Wofür Entwickler Python am häufigsten einsetzen (nur eine Antwort war möglich)

(Bild: JetBrains)

Trotz des auffallend hohen Einsatzes von Python zur Datenanalyse in den Antworten würde nur ein Drittel der Befragten sich selbst als "Data Scientist" bezeichnen.

Python auf der enterPy online

Die erste von heise Developer, iX und dpunkt.verlag organisierte virtuelle Konferenz enterPy online am 26. Mai vermittelt einen kompakten Überblick zum Einsatz von Python in Businessanwendungen in den Bereichen Web-Entwicklung, Data Science und DevOps.

Von Befragten angegebene Versionen: Mehrheit verwendet Python 3.7

(Bild: JetBrains)

Die überwiegende Mehrheit der Befragten (90 %) verwendet inzwischen Python 3, der Anteil an Python 2 ist in den Vorjahresumfragen offenbar stetig zurückgegangen. Jedoch setzten Ende 2019 noch immer zehn Prozent der Teilnehmer (in absoluten Zahlen: über 2400 Entwickler) Python 2 ein. Seit April 2020 wird diese Version allerdings nicht mehr unterstützt. Linux ist das verbreitetste Betriebssystem unter den Befragten (68 %), gefolgt von Windows (48 %) und macOS (29 %) – Mehrfachnennungen waren möglich.

Anwendungsszenarien von Python 2 und 3 im Vergleich

(Bild: JetBrains)

Die meisten Teilnehmer gaben an, Python als Hauptprogrammiersprache zu nutzen (84 %), was der Verteilung im Vorjahr entspricht, allerdings nutzt die Mehrheit (89 %) neben Python offenbar noch weitere Programmiersprachen. Mehrfachnennungen waren möglich. Die Angaben variierten mit dem beruflichen Hintergrund: Bei Webentwicklern sind Skriptsprachen wie JavaScript, TypeScript, HTML/CSS und PHP verbreiteter, wohingegen Datenanalysten C/C++, Java und R häufiger angaben.

Mehrheit der Befragten, die mit Datananalyse und ML zu tun haben, betrachtet sich nicht als "Data Scientists"

(Bild: JetBrains)

Die insgesamt am häufigsten verwendeten Programmiersprache sind laut Umfrage mit über 40 Prozent JavaScript sowie Bash/Shell und HTML/CSS, die je 40 Prozent der Befragten als Hauptsprache und rund 30 Prozent als Nebensprache angaben. Ebenfalls hoch liegt offenbar der Anteil derer, die neben Python C/C++ einsetzen: als Hauptsprache 28 Prozent, als Zweitsprache 38 Prozent. Für Java liegt der Anteil bei 19 Prozent (Hauptsprache) und 32 Prozent (Nebensprache). Im Mittelfeld lagen C# und PHP, die zehn Prozent der Befragten jeweils als Hauptsprache angaben, 19 Prozent gaben C# als Nebensprache an, 15 Prozent PHP. Zwischen 5 und 10 Prozent der Befragten verwenden laut eigener Angaben eine oder mehrere der Sprachen Go, TypeScript, R und Rust.

Spektrum an Programmiersprachen, die Python-Entwickler außerdem einsetzen

(Bild: JetBrains)

Der Anteil derer, die Python als einzige Programmiersprache aktiv verwenden, ist laut den Ergebnissen der Umfrage von 6 Prozent (2018) auf 11 Prozent (2019) gestiegen. Auffällig ist, dass der Anteil anderer Sprachen neben Python im Vergleich zum Vorjahr teils leicht rückläufig ist. So hatte zum Beispiel 2018 die Hälfte der Befragten angegeben, JavaScript als Erst- oder Zweitsprache zu verwenden (2019 lag der Anteil um 7 Prozent niedriger), der Anteil an HTML sank um 9 Prozent, der an Bash um 6 Prozent, SQL um 5 Prozent. Der Anteil anderer Sprachen schwankte wenig oder blieb annähernd gleich. Bei Rust stieg der Anteil derer, die es als Zweitsprache angaben, von 5 auf 6 Prozent, TypeScript und Go kletterten als Zweitsprache je von 11 auf 12 Prozent, während Kotlin weiterhin von 5 Prozent der Teilnehmer als Zweitsprache neben Python angegeben wird.

Die gemeinnützige Stiftung hatte die Daten ausschließlich über ihre offiziellen Kanäle erhoben. Auf 13 Fragebogenseiten konnten Teilnehmer in 42 Fragen zu Python, ihrem Hintergrund sowie dem Einsatz der Programmiersprache in ihrem Unternehmen und den Rahmenbedingungen Stellung nehmen.

Insgesamt haben sich etwa 24.000 Entwickler aus mehr als 150 Ländern auf python.org, über Mailinglisten, LinkedIn, im Blog und auf dem Twitterkanal der Python Foundation an der Umfrage beteiligt. Produkt-, dienstleistungs- und anbietergebundene Kanäle haben die Herausgeber der Studie ausgespart, um ein möglichst repräsentatives Bild aus dem Inneren der Python-Community zu gewinnen. JetBrains' Interesse an der Beteiligung der Studie ist wohl darin zu sehen, dass das Unternehmen eine Entwicklungsumgebung für Python-Entwickler offeriert.

Die Antworten wurden bei der Übertragung anonymisiert, der Fragebogen (PDF) und die Rohdaten (als CSV-Datei) stehen auf dem Google Drive der Python Foundation zum Download bereit. Die vollständigen Ergebnisse lassen sich bei JetBrains im Detail einsehen. (sih)