+

+1

Eine Zustimmung zu etwas.

6

68-95-99.7 Regel

Drückt die Tatsache aus, dass 68% der Werte innerhalb einer Standardabweichung vom Mittelwert liegen, 95% innerhalb von zwei und 99,7% innerhalb von drei. Umgekehrt liegen etwa 0,3% der Werte in den meisten Fällen mehr als drei Standardabweichungen über oder unterhalb des Mittelwerts.

A

Abandonware

Software die nicht länger weiterentwickelt wird.

abfangen (eines Fehlers)

Möglichkeit einen Fehler oder andere unerwartete Ereignisse abzufangen und Informationen darüber zu verarbeiten. In R sollen Fehler möglichst über vordefinierte Bedingungen abgefangen werden, während in anderen Sprachen, z.B. in Python Fehler und Fehlermeldungen bewusst eingesetzt werden um Probleme einfacher zu lösen. Häufig werden neben der Art des Fehlers auch weitere Daten erhoben um mögliche Ursachen zu finden.

Abhängige Variable

Eine Variable, dessen Werte von denen einer anderen Variablen abhängig sind, welche als unabhängige Variable bezeichnet wird.

Absolute Zeilennummer

Der sequentielle Index einer Zeile in einer Tabelle, unabhängig davon, welche Abschnitte der Tabelle angezeigt werden.

Absoluter Fehler

Der absolute Wert der Differenz zwischen dem beobachteten und dem korrekten Wert. Der absolute Fehler ist normalerweise weniger nützlich als der relative Fehler.

absoluter Pfad

Der absolute Pfad zeigt auf die gleiche Position im filesystem, unabhängig davon, wo er ausgewertet wird. Der absolute Pfad entspricht in der Geographie der Angabe von Längen- und Breitengrad.

Abstrakte Methode

In der objektorientierten Programmierung eine Methode, die zwar definiert, aber nicht implementiert ist. Programmierer definieren eine abstrakte Methode in einer übergeordneten Klasse, um Operationen zu spezifizieren, die die untergeordneten Klassen bereitstellen müssen.

abwärtskompatibel

Bezeichnet die Eigenschaft eines Systems (z.B. Hardware oder Software), das dessen Funktionsfähigkeit auch in Zusammenarbeit mit älteren oder obsoleten Versionen eines Systems garantiert. Beispielsweise ist eine Funktion in Python 3 abwärtskompatibel, wenn diese auch in Python 2 ausgeführt werden kann.

Aggreation

Mehrere Werte zu einem zusammenfassen, z.B. durch Aufsummieren einer Reihe von Zahlen oder Verkettung einer Reihe von Zeichenketten.

Aggregatfunktion

Eine Funktion, welche mehrere Werte in einem Ergebnis zusammenfasst, beispielsweise in einer Summe oder dem Maximalwert.

Agile Softwareentwicklung

Eine Methodik der Softwareentwicklung in der die Arbeit in viele kleine Schritte aufgeteilt wird und mit ständigem Feedback innerhalb selbstorganisierter Teams ein Program entwickelt wird. Im Gegensatz dazu stehen klassische Ansätze die häufig aufwändiger Planung bedürfen. Explorative Programmierung ist oft agil.

Algorithmus

Ein Algorithmus beschreibt eine Handlungsvorschrift, ein Verfahren oder einen Regelsatz zum Lösen eines Problems. In der Informatik ist ein Algorithmus eine eindeutige, ausführbare Folge von Anweisungen endlicher Länge zur Lösung eines Problems, welche immer das gleiche Ergebnis liefern.

Aliasing

Aliasing bezeichnet die Überlappung mehrerer Deskriptoren, also z.B. Speicheradressen (Zeiger) oder Referenzen, die den selben Ort für ein Objekt, beispielsweise eine Datenstruktur, beschreiben.

Anonyme Funktion

Eine Funktion ohne Namen. In der Regel sind anonyme Funktionen sehr kurz und werden nur dort definiert wo sie verwendet werden, z.B. als Rückruffunktion. In Python wird diese Art der Funktionen als Lambda-Funktionen bezeichnet und mit dem reservierten Ausdruck lambda definiert.

Argument

Nicht zu verwechseln mit dem Parameter. Parameter und Argumente sind verwandt aber nicht identisch. Ein Argument ist der tatsächliche Wert eines Parameters der beim Funktionsaufruf übergeben wird.

ASCII

Eine standardisierte Methode um Zeichen und Ziffern, vornehmlich der Westeuropäischen Sprachen, in 7 oder 8 Bits darzustellen. Heute weitgehend durch Unicode abgelöst.

Assertion

Eine Boolscher Ausdruck welcher zu einem bestimmten Punkt während der Programlaufzeit wahr sein muss um fortzuschreiten. In verschiedenen Sprachen (z.B. assert in Python) sind diese Sicherstellungen fest integriert, oder werden als Funktionen bereitgestellt (z.B. stopifnot in R). Sie werden häufig zum testen von code verwendet, können aber auch in fertigen Quellcode einfließen um eine korrekte Ausführung zu gewährleisten. In vielen Sprachen sollten Assertionen jedoch nicht zur Datenvalidierung verwendet werden, da der Compiler je nach Optimierungsgrad diese entfernen kann. Assertionen können ein Sicherheitsrisiko darstellen. In R können Assertionen nicht deaktiviert werden, daher werden externe Pakete wie beispielsweise assertr zur Datenvalidierung verwendet ohne ein Sicherheitsrisiko darzustellen.

Assoziatives Array

Siehe Wörterbuch.

asynchron

Nicht gleichzeitige Ausführung. In der Programmierung ist eine asynchrone Operation unabhängig von anderen Operationen, oder wird zu einem bestimmten Zeitpunkt gestartet oder beendet.

Attribut

Ein Name-Wert Paar welches einem Objekt zugewiesen ist und in der Regel Metadaten über das Objekt, wie beispielsweise seine Größe, speichert.

Auszeichnungssprache

Ein Regelwerk zur Annotation von Text, um zu definieren, was er bedeutet oder wie er dargestellt werden soll. Die Textauszeichnung wird in der Regel nicht dargestellt, sondern kontrolliert wie der zu Grunde liegende Text interpretiert oder angezeigt wird. Markdown und HTML sind weit verbreitete Auszeichnungssprachen für Internetseiten.

Autokorrelation

Der Grad der Ähnlichkeit zwischen Beobachtungen in derselben Reihe, die durch ein Zeitintervall (“Lag”) voneinander getrennt sind. Autokorrelationsanalyse kann verwendet werden, um einen Einblick in Zeitreihen zu gewinnen, indem sie u. a. wiederkehrende Muster aufdeckt, die teilweise durch zufälliges Rauschen verdeckt werden können. Der Grad der Ähnlichkeit zwischen Beobachtungen in derselben Reihe, die durch ein Zeitintervall (“Lag”) voneinander getrennt sind. Autokorrelationsanalyse kann verwendet werden, um einen Einblick in Zeitreihen zu gewinnen, indem sie u. a. wiederkehrende Muster aufdeckt, die teilweise durch zufälliges Rauschen verdeckt werden können.

Autovervollständigung

Eine Funktionalität welche es dem Nutzer erlaubt in einer Eingabemaske, z.B. in einer Konsole oder Text-Editor, schnell Wörter oder Ausdrücke zu vervollständigen. Normalweise ist diese Funktion der Tabulatortaste (TAB) zugewiesen.

B

Betriebssystem

Ein Programm, das eine Standard-Oberfläche zu der Hardware, auf der es läuft, zur Verfügung stellt. Theoretisch sollte ein Programm, dass nur mit dem Betriebssystem interagiert, auf jedem Computer laufen, der dieses Betriebssystem nutzt

Bibliothek

Ein wiederverwendbares Softwarepaket, oft auch [Modul] (#module) genannt.

Big Data

Alle Datenmengen, die bis vor Kurzem vor zu umfangreich für die Analyse mit nur einem Computer waren.

Binärsystem

Ein System welches nur aus zwei Zuständen besteht. In der Informationstechnik oft in den Zuständen 0 oder 1 dargestellt. In der Boolschen Logik auch als falsch (0) oder wahr (1). Computer verwenden als kleinste Speichereinheit ein Bit welches entweder eine 0 oder 1 enthalten kann.

Bit

Ein Bit ist eine Informationseinheit, die nur zwei Alternativen darstellen kann. Beispiele hierfür sind Ja/ Nein, Wahr / Falsch. In der Computerwelt als 0 und 1 dargestellt.

Blockkommentar

Ein Kommentar welcher mehrere Zeilen umfasst. Blockkommentare haben spezifische Start- und Endsymbole, z.B. /* und */ in C und verwandten Sprachen. Manche Sprachen kennen keine Blockkommentare und so werden diese mit einem Einzelkommentarsymbol in jeder Zeile, z.B. #, gekennzeichnet.

Boilerplate

Standardisierte Texte welche sehr häufig Anwendung finden, beispielsweise für Verträge, Lizenzen, usw. Desweiteren werden damit Codesegmente oder Textbausteine bezeichnet, welche an mehreren Stellen wiederholt werden müssen um ein funktionierendes Programm zu erhalten. Boilerplate Code enthält allerdings wichtige Informationen um beispielsweise Variablen in der objektorientierten Programmierung zu kapseln. Manche Programmiersprachen sind sehr wortreich und erfordern viel Code um einfache Funktionalitäten zu erhalten, z.B. Java, sodass dieser Code häufig automatisch oder mittels Autovervollständigung erstellt wird.

Boolean

Eine Art der Variable oder eines Datentyps welche entweder den logischen Wert wahr oder falsch haben kann. Benannt nach George Boole, einem Mathematiker aus dem 19. Jahrhundert. Binärsysteme, wie alle Computer, beruhen auf der Verarbeitung von logischen Wahr-Falsch-Zuständen, 1 oder 0.
Ein Entwurfsmuster für Webseiten welches zusätzliche Navigationslinks, normalerweise im oberen Bereich, platziert. Brotkrümelnavigationslinks zeigen dem Nutzer wo er sich gerade relativ zum Rest der Webseite befindet. Der Begriff ist in Anlehnung an das Märchen Hänsel und Gretel entstanden, in welchem die Kinder eine Spur aus Brotkrümeln hinterlassen um den Weg zurück zu finden.

Browser-Cache

Ein Puffer-Speicherort auf dem Rechner des Benutzers, an dem der Webbrowser bereits abgerufene Ressourcen wie z.B. Texte und Bilder als Kopie aufbewahrt. Dadurch können Zeit und Netzwerkverkehr reduziert werden, wenn die Ressourcen erneut angefragt werden. Es kann durch die Verwendung des Browser-Caches jedoch auch passieren, dass veraltete Informationen angezeigt werden, wenn sich die Ressourcen in der Zwischenzeit geändert haben.

Bug

Ein Bug ist ein Fehler oder Fehlfunktion einer Software.

Byte

Ein Byte ist eine digitale Einheit, die aus acht Binärziffern oder Bits besteht.

C

Cache

Cache ist ein Pufferspeicher, der (wiederholte) Datenzugriffe und -berechnungen zu vermeiden hilft. Im Cache abgelegte Daten können schneller abgerufen werden. Ein Hardware-Cache wird beispielsweise in Computerprozessoren verwendet und ein Beispiel für einen Software-Cache ist der Browser-Cache.

camel case (dt. Kamel-Schreibung)

Schreibstil der die Benennung von Variablen und Objekten vorgibt. Bei “camel case” werden keine Leerzeichen, Unterstriche (_), Punkte (.) oder Bindestriche (-) verwandt und jedes Wort großgeschrieben. Beispiele sind: BerechneSumme oder findeMuster.

CC-0

Eine Creative-Commons Lizenz welche den Verzicht auf sämtliche Schutzrechte erklärt und das Werk in die Gemeinfreiheit überführt.

CC-BY

Eine Creative-Commons Lizenz welche eine Namensnennung der Urheber verlangt aber sonst keine weiteren Restriktionen auferlegt.

Creative Commons Lizenz

Eine Sammlung von Lizenzen welche verschiedene, einfache Lizenzvereinbarungen für beliebige Werke bereitstellt. Jede Lizenz kann zusätzlichen Bedingungen unterliegen: -BY (Namensnennung): Nutzer müssen den Autor des Werks nennen. -SA (Gleiche Bedingungen): Nutzer dürfen das Werk nur unter den gleichen Bedingungen weiter verbreiten. -NC (Nicht-Kommerziell): Ohne vorherige Zustimmung darf das Werk nur nicht kommerziell verwendet werden. -ND (Keine Bearbeitung): Ohne vorherige Zustimmung darf das Werk nicht verändert werden. Diese Bedingungen werden mit dem Prefix “CC” verknüpft um kombinierte Lizenzen zu kreieren. So bedeutet CC-BY-NC das die Nutzer den Namen des Autors nennen müssen und das Werk nur mit Zustimmung kommerziell nutzen dürfen. Der Begriff CC0 beschreibt ein Werk “ohne Einschränkungen”, d.h. das Werk ist gemeinfrei.

D

Dateisystem

Der Teil des Betriebssystems, der verwaltet wie Dateien gespeichert und abgerufen werden. Der Begriff wird auch als Referenz für alle Dateien und Verzeichnisse verwendet, oder für die spezifische Art, wie Dateien gespeichert werden (z.B. “das Unix-Dateisystem”).

Deep Learning

Eine Familie von Algorithmen für künstliche neuronale Netzwerke, die mehrere Schichten verwenden, um schrittweise Eigenschaften auf immer höheren Ebenen zu extrahieren.

F

Fehlerbericht

Ein Fehlerbericht ist eine Sammlung von Dateien / Einträgen oder damit zusammenhängenden Informationen, die einen unbeabsichtigten Fehler beschreiben. Der Fehlerbericht wird für die Identifikation und Behebung seines des Softwarefehlers / Codefehlers gebraucht.

Fehlerrückführung

Ein Algoritmus der die Gewichtung in einem neuralen Netzwerk iterativ anpasst. Die Rückwärtspropagierung ist ein Spezialfall eines allgemeinen Gradientenverfahrens in der Optimierung, basierend auf dem mittleren quadratischen Fehler.

Funktion

Eine Funktion ist ein in sich abgeschlossener Teil eines Programmcodes, der eine Abfolge von Anweisungen umfasst und mehrere optionale oder notwendige Eingansparameter akzeptieren kann. Funktionen haben einen eindeutigen Namen, der es erlaubt die Funktion durch einen Funktionsaufruf mehrfach in einem Programm zu verwenden. Eine Funktion kann mehrere optionale oder notwendige Eingangsparameter akzeptieren. Eine Funktion kann Werte zurückgeben, deren Datentypen in einer Funktionsdokumentation niedergeschrieben sein sollten.

G

Genauigkeit

Ein statistisches Maß zur Beschreibung eines Klassifizierungsmodells, das den Anteil der korrekten Vorhersagen unter allen Vorhersagen angibt. Es wird als Genauigkeit = (TP+TN)/(TP+TN+FP+FN) berechnet.

H

Hypertext-Auszeichnungssprache

Die Standard-Auszeichnungssprache für Webseiten. HTML wird im Speicher durch das Dokumenten-Objekt-Modell repräsentiert.

K

Kausalität

Eine Beziehung zwischen zwei Ereignissen oder Zuständen, wobei klar ist, dass es einen ursächlichen oder anlässlichen Zusammenhang zwischen den beiden gibt.

Kommentar

Anmerkungen in einem Programmcode oder Skript, die nicht vom Computer interpretiert oder ausgeführt werden. Kommentare dienen der Leserlichkeit und Dokumentation für Nutzer des Skripts. In vielen Programmiersprache werden Kommentare mit ‘#’ am Zeilenanfang eingeleitet.

L

LaTeX

Ein Textsatzsystem zum Erstellen von Dokumenten, das eine spezielle Auszeichnungssprache nutzt, um die Dokument-Struktur (z.B. Titel) zu definieren, Text zu setzen, mathematische Gleichungen einzufügen und Zitate und Querverweise zu verwalten. LaTeX wird häufig in der akademischen Welt verwendet, besonders für wissenschaftliche Veröffentlichungen und Abschlussarbeiten in Mathematik, Physik, Maschinenbau und Informatik.

literarisches Programmieren

Ein Programmierparadigma, dass Dokumentation und Programmkode in einer gemeinsamen Datei handelt.

Lizenz

Ein Rechtsdokument, das beschreibt, wie etwas verwendet werden kann und von wem.

M

Markdown

Eine Auszeichnungssprache mit einfacher Syntax, die als Ersatz für HTML vorgesehen ist. Markdown wird oft für README (lies mich) Dateien verwendet und ist die Basis von R Markdown.

Mittelwert

Der Durchschnitt eines Datensatzes, genauer auch bezeichnet als arithmetischer Mittelwert, um ihn zu unterscheiden vom geometrischen und harmonischen Mittelwert.

Modus

Auch Modalwert genannt. Gibt den Wert oder die Werte an, die am häufigsten in einem Datensatz vorkommen.

O

Ordner

Anderer Begriff für Verzeichnis.

P

Parameter

Die Parameter sind die Namen der Eingangswerte einer Funktion, welche beim Aufruf übergeben werden. Parameter und Argumente sind verwandt aber nicht identisch. Ein Parameter ist eine Variable und ein Argument ist dem der Variable zugewiesene Wert.

Prozessor

Die zentrale Recheneinheit eines jeden digitalen Computers. Der Prozessor ist eine elektronische Schaltung, die anhand von übergebenen Befehlen andere Maschinen oder elektrische Schaltungen steuert und Rechenoperationen ausführt. Wird auch als Hauptprozessor, Zentrale Recheneinheit, Zentraleinheit oder Zentrale Verarbeitungseinheit (kurz ZVE, englisch central processing unit, kurz CPU) bezeichnet.

R

Rückruffunktion

Rückruffunktionen sind Funktionen, welche anderen Funktionen als Parameter übergeben werden um sie zu einem späteren Zeitpunkt auszuführen. Bei der Parallelisierung werden häufig durch den Befehl map Rückruffunktionen synchron/gleichzeitig für mehrere Elemente in einer Kollektion ausgeführt, während bei Klient/Server Verbindungen auf Anrufe asynchron eine Antwort geliefert wird.

S

Schnittstelle zur Programmierung von Anwendungen

Eine Sammlung von Funktionen und Prozeduren die von einer Softwarebibliothek bereitgestellt werden, sodass eine andere Software damit interagieren kann. Eine API ist nicht der Code, die Datenbasis oder ein Server sie ist lediglich der Anküpfungspunkt.

Standardabweichung

Wie weit Werte in einem Datensatz vom Mittelwert abweichen. Die Standardabweichung wird berechnet als Quadratwurzel der Varianz.

T

Tatsächliches Ergebnis

Der Wert, der durch Ausführen von Code in einem Test erzeugt wird. Wenn dieser Wert mit dem erwarteten Ergebnis übereinstimmt, ist der Test bestanden; wenn die beiden Werte unterschiedlich sind, schlägt der Test fehl.

U

Unabhängige Variable

Der Faktor, der vorsätzlich verändert oder kontrolliert wird, um die Auswirkung auf die abhängige Variable zu beobachten.

Unicode

Ein Standard, der einen numerischen Zeichensatz für viele tausend Zeichen und Symbole definiert. Unicode definiert nicht, wie diese Zahlen gespeichert werden; das geschieht durch Standards wie UTF-8.

V

Varianz

Wie weit Werte in einem Datensatz vom Mittelwert entfernt sind. Die Varianz wird berechnet als die Differenz eines Wertes und des Mittelwerts im Quadrat. Stattdessen wird oft auch die Standardabweichung verwendet, da sie dieselbe Einheit wie die Daten hat, während die Varianz in der Einheit zum Quadrat ausgedrückt wird.

Verzerrung

Auch systematische Abweichung genannt. Ein Messwert wird dann als verzerrt beschrieben, wenn er systematisch von dem wahren Wert einer Messgröße abweicht.

W

whitespace

Auch als “Leerraum” bekannt, eine Bezeichnung für Zeichen ohne sichtbares Symbol. Typischerweise beinhaltet dies Leerzeichen, Tabulatorzeichen und Zeilenumbrüche.

Wildcard

Ein Zeichenausdruck, der mit Text übereinstimmen kann, wie z.B. das * in *.csv (das passt auf jeden Dateinamen, der mit .csv) endet.

X

XML

Eine Reihe von Regeln zur Definition von HTML-ähnlichen Tags und deren Verwendung zur Formatierung von Dokumenten (typischerweise Daten). XML war in den frühen 2000er Jahren populär, aber seine Komplexität veranlasste viele Programmierer, stattdessen JSON zu verwenden.

Y

YAML

Abkürzung für “YAML Ain’t Markup Language”, eine Methode zur Darstellung verschachtelter Daten mit Einrückung statt der Klammern und Kommas von JSON. YAML wird oft in Konfigurationsdateien und zur Definition von Parametern in verschiedenen Varianten von Markdown-Dokumenten verwendet.