+

+1

Om ten gunste van iets te stem.

6

68-95-99.7 reël

Beskryf die beginsel dat 68% van alle waardes binne een standaardafwyking van die gemiddelde val, 95% val binne twee en 99.7% val binne drie standaardafwykings. Omgekeerd, in die meeste gevalle val 0.3% van die waardes meer as drie standaardafwykings bo of onder die gemiddelde.

A

aaneenskakel

Die aaneenskakeling van kolomme, rye of karakterstringe deur die samevoeging van data.

absolute fout

Die absolute fout is die absolute waarde van die verskil tussen die waargenome- en die korrekte waarde. Die absolute fout is gewoonlik van minder waarde as die relatiewe fout.

absolute resultaat (van 'n toets)

Die waarde wat deur ‘n toets gegenereer is. Indien dié waarde gelyk is aan die verwagte resultaat, is die toets suksesvol; as die twee waardes verskil het die toets gefaal.

absolute roete

‘n Roete wat dieselfde posisie in die lêerstelsel aandui ongeag die posisie vanwaar dit geëvalueer word. Die absolute roete is die ekwivalent van lengtegraad en breedtegraad in geografie.

absolute rynommer

Die opeenvolgende indeks van ‘n ry in ‘n tabel, ongeag die gedeelte van die tabel wat vertoon word.

abstrakte metode

‘n Metode, in objekgeoriënteerde programmering, wat gedefiniëer maar nie geïmplementeer is nie. Programmeerders sal ‘n abstrakte metode in ‘n voorsaatklas definiëer wat in nasaatklasse geïmplementeer moet word.

abstrakte sintaksisontledingsboom

‘n Diepgeneste datastruktuur, of boom, wat die struktuur van ‘n program verteenwoordig. Byvoorbeeld, as die abstrakte sintaksontledingsboom ‘n nodus het wat ‘n doen terwyl-lus verteenwoordig wat met een naasaatontledingsboom die lustoestand verteenwoordig en ‘n ander nasaatontledingsboom wat die lusraam verteenwoordig.

afgooiware

Sagteware wat nie meer onderhou word nie.

aggregaatfunksie

‘n Funksie wat ‘n groep waardes saamvoeg, bv. sum (summering) en max (maksimale waarde)

akkuraatheid

Dit is ‘n statistiese maatstaf van ‘n klassifikasiemodel wat die proporsie van korrekte voorspellings gee onder die totale aantal gevalle. Dit word bereken as Akkuraatheid = (TP+TN)/(TP+TN+FP+FN).

algoritme

‘n Algoritme is ‘n stel instruksies wat gevolg moet word om ‘n spesifieke taak uit te voer.

algoritmiese vooroordeel

Herhaalbare resultate in ‘n algoritme wat vooroordeel or geskeefde behandeling toon. Byvoorbeeld, sosiale media algoritmes wat bevooroordeelde of gestigmateerde inhoud van seker groepe prioritiseer.

aliasering

Om twee of meer verwysing na dieselfde ding te hê, soos byvoorbeeld meer as een verwysing na ‘n datastruktuur in geheue of na ‘n lêer op ‘n skyf.

anker

In ‘n gewone (reguliere) uitdrukking, is ‘n anker ‘n simbool wat ‘n posisie aandui, bv. ^ dui die begin van ‘n lyn aan en $ dui die einde van ‘n lyn aan. ‘n Uidrukking soos bv. ^Die anker die soektog na die woord Die aan die begin van die lyn.

anonieme funksie

‘n Funksie waaraan daar nie ‘n naam toegeken is nie. Anonieme funksies is gewoonlik baie kort en word gewoonlik gedefinieer waar hulle gebruik word bv. in die geval van ‘n terugskakelfunksie.

anti-koppeling

‘n Koppeling wat rye in tabel A bevat wie se sleutels nie die sleutels van tabel B bevat nie.

argument

Die term moet nie verwar word met parameter nie en is ook nie ‘n sinoniem daarvoor nie. ‘n Argument is die spesifieke waarde wat aan ‘n funksie verskaf word in ‘n lys van waardes wat deur kommas geskei word Die term moet nie verwar word met parameter nie en is ook nie ‘n sinoniem daarvoor nie. ‘n Argument is die spesifieke waarde wat aan ‘n funksie verskaf word in ‘n lys van waardes wat deur kommas geskei word. Parameters is die veranderlikes en argumente is die waardes wat aan die veranderlikes toegeken is.

ASCII

‘n Standaard manier om karakters wat algemeen in Wes-Europese tale gebruik word, voor te stel as 7- of 8-bis heelgetalle. ASCII word vervang deur Unicode.

asinchronies

Asinchronies is die teenoorgestelde van sinchronies wat beteken dat twee of meer aktiwiteite tergelykertyd plaasvind. In programering is ‘n asinchorniese bewerking ‘n bewerking wat onafhanklik van ‘n ander een plaasvind.

assosiatiewe skikking

Sien woordeboek.

Autokorrelasie

Die graad van ooreenkoms tussen waarnemings in dieselfde reeks maar geskei deur ‘n tydinterval (bekend as die “lag”). Autokorrelasie-analise kan gebruik word om insig te verkry in tydreeksdata deur herhalende patrone op te spoor wat moontlik deels versteek is deur lukrake ruis, onder andere gebruike.

B

Bayes se rëel

Sien Bayes se stelling.

Bayes se stelling

‘n Vergelyking om die waarskynlikheid te bepaal dat iets waar is indien iets verwant ook waar is. As P(X) die waarskynlikheid is dat X waar is en P(X|Y) is die waarskynlikheid dat X waar is indien die gegewe Y waar is, dan is P(X|Y) = P(Y|X) * P(X) / P(Y).

Bayesian-netwerk

‘n Grafiek wat die verhoudings tussen lukrake veranderlikes vir ‘n gegewe probleem verteenwoordig.

bediener

‘n Program soos ‘n databasisbeheerder of webbediener wat op versoek data aan ‘n kliënt verskaf.

bekostigbaarheid

‘n Eienskap van iets wat aandui hoe dit gebruik kan word, bevoorbeeld ‘n lêerhanteerder of ‘n knoppie.

bevel

‘n Instruksie wat ‘n rekenaarprogram opdrag gee om ‘n spesifieke taak uit te voer.

bewering

‘n Boole-uitdrukking wat waar moet wees op ‘n spesifiek plek in ‘n program. ‘n Bewering kan ingebou wees in ‘n programmeertaal (bv. Python het ‘n ingeboude beweerstelling - assert) of dit kan voorsien word as ‘n funksie (bv. R gebruik stopifnot). Bewerings word dikwels gebruik gedurende die toetsfase van sagtewareontwikkeling maar dit word ook gebruk in produksieskode om te bevestig dat die kode reg werk. In sommige tale moet die gebruik van bewerings as ‘n datageldigheidstoets vermy word aangesien sommige kompileerders en interpreteerders die bewering stilweg weggooi onder optimeringsvoorwaardes. Die gebruik van bewerings vir bevestiging van datageldigheid kan dus sekuriteitsrisikos veroorsaak. R het nie ‘n beweringstelling wat gedeaktiveer kan word nie en dus sal die gebruik van ‘n pakket soos ‘assertr’ vir datageldigheid nie sekuriteitsgapings skep nie.

binêr

‘n Stelsel wat een van twee moontlike toestande kan hê. In berekening word dit dikwels voorgestel as in die toestand 0 of 1. In Boole-logika word dit verteenwoordig as vals (0) of waar (1). Rekenaars is gebou op stelsels wat 0’s en 1’s as bis stoor.

binêre groot voorwerp

Data wat in ‘n databasis gestoor word sonder om op enige manier geïnterpreteer te word, soos ‘n klanklêer. Die term word ook nou gebruik om te verwys na data wat oor ‘n netwerk oorgedra word of in ‘n weergawebeheerstelsel-repository as ongeïnterpreteerde bis gestoor word.

binêre uitdrukking

‘n Uitdrukking wat twee parameters het en twee argumente neem, soos bv. 1 + 2.

binnekoppeling

‘n Koppeling wat die kombinasie van rye uit twee tabelle A en B oplewer, waarvan die ID-sleutels in beide tabelle bestaan.

bis

‘n Eenheid van inligting wat alternatiewe voorstel, ja/nee, waar/vals. Dit kan voorgestel work as 0 of 1.

bug

‘n Ontbrekende of ongewenste kenmerk van ‘n stuk sagteware; die digitale ekwivalent van ‘n onkruid.

byvoeg modus

Om data aan die einde van ‘n lêer te voeg in plaas daarvan om die inhoud van dielêer te oorskryf. Oorskryf is die verstek, wat beteken dat meesteprogrammeertale verwag dat programme eksplisiet moet aandui dat daar bygevoeg inplaas van oorskryf moet word.

C

chi-kwadraattoets

‘n Statistiese metode om te bepaal of twee veranderlikes in ‘n kruistabellering gekorreleerd is. ‘n Chi-kwadraatverdeling wissel vanaf ‘n normale verspreiding gebaseer op die vryheidsgrade wat gebruik word om dit te bereken.

D

data pakket

‘n Sagtewarepakket wat meestal net data bevat. Word gebruik om dit eenvoudiger te maak om data te versprei vir makliker gebruik.

data-ontgining

Die gebruik van ‘n rekendaar om te soek na patrone in groot datastelle. Die term data wetenskap word tans meer gebruik.

datawetenskap

Die kombinasie van statistiek en programmering wat gebruik word om kennis vanuit data te ontgin.

datawetenskaplike

Iemand wat programmeringsvaardighede gebruik om statistiese probleme op te los.

E

eienskap

‘n Naam-waarde paar wat verband hou met ‘n voorwerp en gebruik word om metadata omtrent die voorwerp te stoor, bv. die afmetings van ‘n skikking.

Elektronisese pos

Elektroniese pos is ‘n metode vir die aflewering van boodskappe tussen mense oor ‘n rekenaarnetwerk. Boodskappe word via ‘n SMTP bediener gestuur en verkry deur gebruik te maak van óf ‘n IMAP óf ‘n POP bediener.

Emacs (teksredigeerder)

‘n teksredigeerder wat gewild is onder Unix-programmeerders.

evaluering

Die proses om ‘n uitdrukking soos 1+2*3/4 te neem en dit om te skakel in ‘n enkele, onherleidbare waarde.

F

fout (in 'n toets)

Aangewys wanneer iets verkeerd gaan in ‘n eenheidstoets self eerder as in die stelsel wat getoets word. In hierdie geval weet ons niks van die korrekheid van die stelsel nie.

foutbehandeling

Wat ‘n program doen om foute op te spoor en reg te stel. Voorbeelde sluit in die afdruk van ‘n boodskap en die gebruik van ‘n standaardkonfigurasie as die gebruiker-gespesifiseerde konfigurasie nie gevind kan word nie.

G

gemiddeld

Die gemiddelde waarde van ‘n datastel, beter bekend as die rekenkundige gemiddeld om dit van die meetkundige en die harmoniese gemiddelde te onderskei.

groepeer

Om data in groepe te verdeel volgens ‘n stel kriteria terwyl die rekords in ‘n enkele struktuur gelaat word.

Groot Data

Enige data wat tot onlangs toe nog te veel was om met net een rekenaar te analiseer.

H

histogram

‘n Grafiese voorstelling van die verspreiding van ‘n data, gewoonlik ‘n vertikale staafgrafiek.

I

ID-sleutel

  1. ‘n Veld of kombinasie van velde waarvan die waarde(s) ‘n rekord in ‘n tabel of datastel uniek identifiseer. ID-sleutels word dikwels gebruik om spesifieke rekords te kies, asook in koppelings. 2. ‘n Deel van ‘n ID-sleutel/waardepaar, wat as ‘n unieke identifiseerder gebruik word in ‘n datastruktuur soos ‘n woordeboek.

ikoon

In rekenaarkunde is ‘n ikoon ‘n grafiese simbool wat op ‘n rekenaarskerm vertoon word om die gebruiker te help om ‘n rekenaarstelsel te navigeer.

J

Java

Java is ‘n hoëvlak, kruisplatvorm, objekgeoriënteerde en algemene-gebruik programmeertaal. Programme wat in Java geskryf is sal op enige platform werk, wat die Java sagtewareplatform implementeer, sonder dat dit hersaamgestel hoef te word. Die kenmerk het gelei tot die slagspreuk “skryf eenkeer, hardloop enige plek”. Die Javasintaks is soortgelyk aan die van C en C++.

K

Kameelgeval

Die styl van kodeskryf wat behels dat veranderlikes en objekte benoem word sonder spasies, onderstreep (_) punte (.), of strepies (-) karakters, met elke woord wat gekapitaliseer word. Voorbeelde hiervan sluit in BerekenSom en VindPatroon.

kies

Om volledige kolomme of rye in ‘n tabel volgens naam of plek te kies (selekteer).

kodering

Die proses waardeur ‘n reeks karakters, soos letters, syfers, interpunktiewe tekens en sekere simbole, in ‘n gespesialiseerde formaat geplaas word vir doeltreffende oordrag of berging

kognitiewe lading

Die hoeveelheid werkgeheue wat nodig is om ‘n stel gelyktydige take te verrig.

kommentaar

Teks geskryf in ‘n rekenaarprogram of skrif wat nie behandel word as kode wat uitgevoer moet word nie. Die kommentaar beskryf eerder wat die kode doen. Kommentaar is gewoonlik kort notas, wat dikwels begin met ‘n # (in baie programmeertale).

koppeling

Een van verskeie bewerkings wat waardes uit twee tabelle aan mekaar koppel.

korrelasie

Hoe sterk twee veranderlikes met mekaar ooreenstem. Korrelasie word gewoonlik gemeet aan die berekening van ‘n korrelasiekoëffisiënt, maar impliseer nie oorsaaklikheid.

korrelasiekoëffisiënt

‘n Maatstaf van hoe sterk gekorreleer twee veranderlikes is. As die korrelasiekoëffisiënt tussen X en Y gelyk is aan 1.0, dui dit aan dat X die perfekte voorspelling van Y is. As die korrelasiekoëffisiënt 0,0 is, dui dit aan dat X nie verwant is aan Y nie. As dit -1,0 is, dan voorspel X vir Y, maar verandering in X veroorsaak ‘n teenoorgestelde verandering in Y.

kovariansie

Hoe goed twee veranderlikes met mekaar ooreenstem. Die korrelasiekoëffisiënt is ‘n genormaliseerde maatstaf vir kovariansie.

kruiskoppeling

‘n Koppeling wat alle moontlike kombinasies van rye uit twee tabelle A en B oplewer.

L

leë vektor

‘n Vektor wat geen elemente bevat nie. Leë vektore het ‘n tipe soos logies of karakter, en is nie dieselfde as nul nie.

lenige ontwikkeling

‘n Sagteware-ontwikkelingsmetode wat die klem lê op vele klein stappies en deurlopende terugvoering in plaas van vooraf beplanning en langtermyn skeduluering. Verkennende programmering is dikwel lenig.

lineêre regressie

‘n Metode om die beste pas tussen twee datastelle te vind deur die vierkante van die afstande tussen die punte en ‘n regressielyn te minimaliseer.

logistiese regressie

‘n Metode om ‘n model aan te pas tot data wat van logistieke (S-vormige) kurwes gebruik maak.

M

maksimumaanneemlikheidsberaming

Om die parameters vir ‘n waarskynlikheids verdeling te verkry, te maksimeer.

mediaan

‘n Waarde wat die boonste en onderste helfte van ‘n gesorteerde datastel skei. Die mediaan gee dikwels ‘n beter idee van wat tipies is vir die datastel as die mediaan, wat beïnvloed kan word deur ‘n klein aantal ekstreme uitskieters.

model

‘n Spesifikasie van’n wiskundige verband tussen verskillende veranderlikes.

module

‘n Herbruikbare sagtewarepakket, ook dikwels ‘n biblioteek genoem.

modus

Die waarde wat die meeste in ‘n datastel voorkom.

mylpaal

‘n Teiken wat ‘n projek probeer bereik, dikwels voorgestel as ‘n stel kwessies wat almal teen ‘n sekere tyd opgelos moet wees.

N

NA

‘n Spesiale waarde wat gebruik word om data wat nie beskikbaar is nie, voor te stel.

node, nodus

‘n Element in ‘n grafiese voorstelling, soos ‘n grafiek of ‘n netwerk, wat deur ander ‘n node/nodus met ‘n skakel verbind is. Nodes/Nodusse het spesifieke data, soos byvoorbeeld name of gewigte, gekoppel.

nul

‘n Spesiale waarde wat gebruik word om ‘n vermiste voorwerp voor te stel. Nul is nie dieselfde as NA nie, en dit is ook nie dieselfde as ‘n leë vektor nie.

O

omgewing

‘n Struktuur wat ‘n stel van veranderlike name en die waardes waarna na verwys, stoor.

oop wetenskap

‘n Generiese term om wetenskaplike sagteware, data en publikasies toegangklik te maak.

outomatiese veranderlike

‘n Veranderlike waaraan daar outomaties ‘n waarde toegeken word in boureël. Byvoorbeeld, “Make” ken outomaties die naam van ‘n reël se teiken aan die outomatiese veranderlike, ‘$@’ toe. Outomatiese veranderlikes word dikwels gebruik tydens die skryf van patroonreëls.

outomatiese voltooing

‘n Funksie wat ‘n gebruiker toelaat om ‘n woord of ‘n kode vinnig te voltooi deur die TAB sleutel te druk om ‘n lys van moontlike woorde of kodes te vertoon waaruit die gebruiker kan kies.

P

pseudo- lukrake nommer

‘n Waarde wat op so ‘n wyse gegenereer is dat dit lyk op die ware lukraakheid van die heelal, tot so ‘n mate dat dit waarnemers fop.

pseudolukrakenommergenereerder

‘n Funksie wat pseudo- lukrake nommers kan genereer.

R

R basis

Die basiese funksies van die R programmeertaal. Die basispakette kan in src/librarygevind word en kan nie onafhanklik van R opgedateer word nie. Die weergawenommers van die pakette volg die R weergawenummering. Basispakette word geinstalleer en gelaai as deel van R terwyl prioriteitpakette saam met R geinstalleer word maar moet gelaai word voor hulle gebruik kan word.

rekenkundige gemiddelde

Sien gemiddelde.

S

saadjie

‘n Waarde wat gebruik word om ‘n pseudolukrakenommergenereerder te begin.

samevoeging

Om ‘n groep waardes in een te kombineer bv. om ‘n versameling getalle op te som of om ‘n versameling alfabetiese stringe aaneen te skakel.

Sentrale verwerkingseenheid

Dit is die primêre hardeware van enige rekenaar. Dit vorm die essensiële elektroniese stroombaan wat instruksies van die sagteware of ander hardeware interpreteer en uitvoer. Ook genoem ‘n sentrale verwerker, hoofverwerker, of mikroverwerker.

T

terugwaarts versoenbaar

‘n Eienskap van ‘n stelsel, hardeware of sagteware wat dit moontlik maak om met ‘n ouer weergawe van die stelsel, of met die toevoer ontwerp vir ‘n ouer stelsel te werk. Byvoorbeeld, ‘n funksie wat in Python 3 geskryf is maar sal werk in Python weergawe 2 is terugwaarts versoenbaar.”

terugwaartse voortplanting

‘n Algoritme wat die gewigte wat in ‘n neurale netwerk gebruik word iteratief aanpas. Terugwaartse voortplanting word dikwels gebruik om gradiënte afdaling te implementeer.

Toepassing Programmeerderkoppelvlak

n Versameling funksies en prosedures wat deur ‘n sagtewareprogrammateek of webdiens voorsien word vir gebruik deur ander toepassings om met die programmateek of webdiens te kommunikeer. Die API is nie die kode, die databasis of die bediener nie, dit is die koppelvlak.

toestand

‘n Fout of ander onverwagte gebeurtenis wat die normale vloei van beheer ontwrig.

U

uitskietter

Uiterste waardes wat moontlik meet- of opnamefoute kan wees, of wat werklik seldsame gebeurtenisse kan wees. Uitstekers word soms geïgnoreer wanneer statistiek gedoen word, of afsonderlik hanteer of gevisualiseer.

V

vertrouensinterval

‘n Variasiewydte rondom ‘n beraming wat’n foutgrens aandui, gekombineerd met die waarskynlikheid dat die werklike getal binne die skatting val.

volle koppeling

‘n Koppeling wat alle rye en alle kolomme uit twee tabelle A en B oplewer. Waar die ID-sleutels van A en B by mekaar pas, word die waardes gekombineer; waar dit nie die geval is nie, word ontbrekende waardes uit enige van die twee tabelle gevul met nul, NA, of enige ander aanduier van ‘n ontbrekende waarde.

vooroordeel

‘n Statistiek is bevooroordeeld as dit sistematies of konsekwent verskil van die parameter wat dit veronderstel is om te skat.

Y

YAML

Kort vir “YAML Ain’t Markup Language”, ‘n manier om geneste data te gebruik deur middel van indentasies in plaas van hakkies en kommas of JSON. YAML word dikwels in konfigurasielêers gebruik en om parameters vir verskeie geure te definieer van Markdown dokumente.