X

Microsoft will mit Pendleton-Tool Arbeit an großen Datensets erleichtern

Wer schon einmal mit großen Datensets mit vielen tausend Spalten und Zeilen gearbeitet hat, weiß wie aufwendig das ist. Mit einem Tool namens Pendleton will Microsoft Daten-Wissenschaftlern diese Arbeit deutlich erleichtern. Wie ein über Twitter geleaktes Handbuch vermuten lässt, nutzt Microsoft Pendleton bereits intern unter Windows und macOS.
08.09.2017  10:18 Uhr
In dem bereits im October 2016 erstellten Handbuch ist von einem Projekt mit Codenamen Pendleton die Rede. Dieses scheint sich an Microsoft-Forscher zu richten, die mit Pendleton große Datensetz bearbeiten können. Wie aus dem Dokument hervorgeht, gibt es in Pen­dle­ton Erklärvideos zum Einsatz des Datenwerkzeugs, welches sowohl unter Windows, als auch macOS genutzt werden kann.


Einbindung multipler Datenquellen

In Pendleton lassen sich verschiedene Datenquellen einbinden, die dann in einer Ta­bel­len­an­sicht erscheinen. Mit dem Werkzeug kann man dann laut der Anleitung Datentypen mit verschiedenen Werkzeugen die Daten umwandeln und formatieren. Ãœber so genannten Inspektoren ist darüber hinaus eine Visualisierung der Daten über Histogramme und andere Ansichten möglich, die dabei helfen soll ein besseres Verständnis für die Datenbasis und eventuell sinnvolle Umwandlungen zu bekommen. Von den Anwendern umgewandelte Daten können als einfacher Text-Output im CSV-Format gespeichert werden.

Verarbeitung großer Datenmengen

Pendleton kann Daten von SQL Server, Azure Blobs und so genannten Data Lakes einlesen. Anders als etwa in Excel können damit offenbar auch Datenpools mit mehreren Millionen Ein­trä­gen bearbeitet werden. Excel ist da deutlich limitierter. Zwar unterstützt Microsofts Ta­bel­len­kal­ku­la­tion inzwischen eine Ar­beits­blattg­rö­ÃŸe von 1.048.576 Zeilen und 16.384 Spalten. Mit derart großen Tabellen ist ein halbwegs vernünftiges Arbeiten aber so gut wie un­denk­bar, weil dann selbst einfache Aktionen leicht mehrere Minuten dauern können.

Daten-Forscher nutzen deshalb zur Umwandlung und Korrektur ihrer Datenquellen Skripte oder spezielle Softwareprogramme wie etwa die Datenanalysesoftware Stata, mit der statistische und stochastische Auswertungen möglich sind. Ob Microsoft das Tool irgendwann veröffentlichen will, ist nicht bekannt. Die Microsoft-Kennerin Mary Jo Foley von ZDNet geht aber jedenfalls davon aus.
☀ Tag- / 🌙 Nacht-Modus
Desktop-Version anzeigen
Impressum
Datenschutz
Cookies
© 2024 WinFuture