Glossário

Português

abandonware
Software que não é mais mantido.
Afrikaans, Deutsch, Bangla, English, Español, Français, Italiano, Setswana, አማርኛ, اَلْعَرَبِيَّةُ, Bahasa Indonesia
agregação
Combinar vários valores em um, por exemplo, somando um conjunto numérico ou concatenando um conjunto de caracteres.
Afrikaans, English, Español, Français, Setswana, اَلْعَرَبِيَّةُ, Kiswahili
agrupamento
O processo de dividir os dados em grupos quando os grupos em si não são conhecidos antecipadamente.
centróide, classification, supervised_learning, unsupervised_learning
English, አማርኛ, 日本語, Kiswahili
argumento
Um valor passado para uma função. Algumas pessoas autoras usam este termo como sinônimo de parâmetro(#parameter) e outras não fazem isso; é tudo bastante confuso.
Afrikaans, Deutsch, English, Español, Français, አማርኛ, اَلْعَرَبِيَّةُ, Kiswahili
auto-completar
Uma funcionalidade que permite a pessoa usuária terminar uma palavra ou código rapidamente ao pressinar a tecla TAB para listar possíveis palavras ou códigos que podem ser escolhidos.
Afrikaans, Deutsch, English, Español, Français, አማርኛ, Kiswahili

B

biblioteca
Um pacote de programas reutilizáveis, também frequentemente referido como um módulo.
Deutsch, English, Español, Français, አማርኛ
binário
Um sistema que pode ter dois estados possíveis. Em computação, frequentemente sendo no estado 0 ou 1. Representado na lógica Booleana como falso (0) ou verdadeiro (1). Computadores são construídos sobre sistemas que armazenam 0s e 1s como bits.
Deutsch, English, Español, አማርኛ
bit
Uma unidade de informação representando alternativas, sim/não, verdadeiro/falso. Em computação, um estado de 0 ou 1.
binário, Booleano
Afrikaans, Deutsch, English, Español, Français, Nederlands, Setswana, አማርኛ, Kiswahili, Bahasa Indonesia
bloco de comentário
Um comentário que abrange múltiplas linhas. Blocos de comentários podem ser indicados com símbolos especiais, como /* e */ em C e linguagens herdeiras dessa sintaxe, ou cada linha pode ser prefixada com uma indicação como #.
Deutsch, English, አማርኛ, Kiswahili
Booleano
Relacionado a uma variável ou tipo de dado que pode ter um valor lógico de verdadeiro ou falso. Nomeado em referêcia à George Boole, um matemático do século XIX. Sistemas binários, como todos os computadores, são construídos com base em sistemas de avaliação entre estados de verdadeiro e falso, 0 ou 1.
truthy, falsy, binário
Deutsch, English, Español, አማርኛ, اَلْعَرَبِيَّةُ, Kiswahili, Bahasa Indonesia

C

caminho absoluto
Um caminho que leva ao mesmo local no sistema de arquivos independente do contexto em que é avaliado. Um caminho absoluto pode ser comparado com a latitude e longitude em geografia.
caminho relativo
Afrikaans, Deutsch, English, Español, Français, Italiano, አማርኛ, اَلْعَرَبِيَّةُ, Bahasa Indonesia
caminho relativo
Um caminho cujo destino é interpretado de maneira relativa a outro local, como o diretório de trabalho. Um caminho relativo é o equivalente a indicar um destino com termos como “siga em frente” e “vire a esquerda”.
caminho absoluto
English, Français
CC-0
Uma licença Creative Commons que não impõe qualquer tipo de restrição, consequentemente colocando o trabalho em domínio público.
Deutsch, English, Español, አማርኛ
CC-BY
Uma licença Creative Commons com Atribuição, que requer que seja dado crédito às pessoas autoras do trabalho, mas que não impõe outras restrições.
Deutsch, English, አማርኛ
centróide
O centro ou âncora de um grupo criado por um algoritmo de agrupamento.
English, አማርኛ
cientista de dados
Alguém que usa habilidades de programação para resolver problemas estatísticos.
Afrikaans, Ελληνικά, English, Español, አማርኛ, Kiswahili
ciência de dados
A combinação de estatística, programação e trabalho duro usados para extrair conhecimento a partir de dados.
Afrikaans, Ελληνικά, English, Español, አማርኛ, Kiswahili
classe base
Em programação orientada a objetos, a classe a partir da qual outra classe (chamada classe derivada) é produzida.
English, Español
classe derivada
Em programação orientada a objetos, a classe derivada de uma outra classe (chamada de classe base).
English, Español, አማርኛ
coeficiente de correlação
Uma medida do quão bem duas variáveis estão correlacionadas. Se o coeficiente de correlação entre X e Y for 1.0, conhecer X permite uma previsão perfeita de Y. Se o coeficiente de correlação for 0.0, conhecer X não diz nada a respeito de Y, e se for -1.0, então X prevê Y, mas mudanças no valor de X gera uma mudança oposta em Y.
Afrikaans, English, Français, አማርኛ
comentário de linha
Um comentário em um programa que abrange parte de uma única linha, em contraste a um bloco de comentário que pode abranger mútiplas linhas.
English, አማርኛ
comentário
Texto escrito em um script que não é tratado como código a ser executado, e sim como texto que descreve o que o código está fazendo. Normalmente é formado por notas curtas, frequentemente começando com um # (em várias linguagens de programação).
Deutsch, English, Français, አማርኛ, Kiswahili
compatibilidade reversa
Software que pode ser usado da mesma maneira que versão anteriores de si mesmo sem problemas. Também é chamado de retrocompatibilidade.
Afrikaans, Deutsch, English, Español, Français, አማርኛ
correlação
O quão bem duas variáveis concordam uma com a outra. A correlação é normalmente medida pelo cálculo de um coeficiente de correlação, e não significa que precise existir causalidade.
Afrikaans, English, Français, አማርኛ, اَلْعَرَبِيَّةُ
covariância
O quão bem duas variáveis concordam uma com a outra. O coeficiente de correlação é uma medida normalizada da covariância.
Afrikaans, English, Français, አማርኛ
curinga
Um curinga, ou caracter curinga, é um caracter que corresponde a qualquer texto, como o * em *.csv (que corresponde a qualquer arquivo cujo nome termina em *.csv).
Deutsch, English, Nederlands

D

decrementar
Uma operação unária que diminui o valor de uma variável, geralmente em um.
incrementar
English, Español, Kiswahili
desenvolvimento ágil
Um método de desenvolvimento de software que enfatiza vários passos pequenos e feedback contínuo ao invés de planejamento de longo prazo. Programação exploratória costuma ser ágil.
Afrikaans, Deutsch, English, Español, Setswana, Kiswahili
desvio padrão
O quanto os valores de um conjunto de dados diferem da média. É calculado como a raiz quadrada da variância.
regra 68-95-99,7
Deutsch, English, Español, Italiano
diretório de trabalho
O local, pasta ou diretório, em que o programa está operando. Qualquer ação do programa acontece relativa a esse diretório.
English, Français, አማርኛ
distribuição binomial
Uma distribuição de probabilidade que emerge quando há um número fixo de tentativas, cada uma das quais podendo produzir um de dois resultados e quando a probabilidade destes resultados não muda. Na medida em que o número de tentativas aumenta, a distribuição binomial se aproxima da distribuição normal.
discrete_random_variable, histogram
English, አማርኛ

E

erro absoluto
O valor absoluto da diferença entre um valor observado e o valor correto. O erro absoluto é normalmente menos útil do que o erro relativo.
Afrikaans, Deutsch, English, Español, Français, Italiano, አማርኛ, اَلْعَرَبِيَّةُ, Kiswahili, Bahasa Indonesia
erro relativo
O valor absoluto da diferença entre um valor observado e o valor correto, dividido pelo vaor correto. Por exemplo, se o valor observado é 9 e o correto é 10, o erro relativo é 0.1. Erro relativo é normalmente mais útil do que o erro absoluto.
English, Español, Français, Italiano
espaço em branco
O espaço, nova linha, quebra de linha, ou tabulação horizontal ou vertical que ocupe um espaço mas não crie uma marca visível. O nome vem de sua aparência em um papel impresso da era das das máquinas de escrever.
Deutsch, English
expressão binária
Uma expressão com dois argumentos ou parâmetros, como 1 + 2, por exemplo.
nullary_expression, ternary_expression, unary_expression
Afrikaans, English, Nederlands, Setswana, አማርኛ

F

função de agregação
Uma função que combina muitos valores em um só, como sum ou max.
Afrikaans, Deutsch, English, Español, Français, Setswana, اَلْعَرَبِيَّةُ, Bahasa Indonesia
função genérica
Um conjunto de funções com propósito similar, cada uma operando em uma classe diferente de dados.
English, Español, Français, አማርኛ

G

Git branch
Uma fotografia de uma versão de um repositório Git. Múltiplos branches podem capturar múltiplas versões de um mesmo repositório.
feature_branch, fork, master_branch
English, Français, አማርኛ
Git
Uma ferramenta de controle de versão para registrar e gerenciar mudanças em um projeto.
English, Français, አማርኛ, 日本語
GitHub
Uma plataforma baseada em nuvem construída em torno do Git que permite salvar versões do seu projeto online e colaborar com outras pessoas usuárias do Git.
English, Français, አማርኛ

H

hipótese nula
A afirmação de que quaisquer padrões observados nos dados foram gerados inteiramente ao acaso. Outras afirmações (por exemplo, “X causa Y”) devem ser mais prováveis de acontecer do que a hipótese nula para que possam ser sustentadas.
p_value
English

I

incrementar
Uma operação unária que aumenta o valor de uma variável, geralmente em um.
decrementar
English, Español
interface gráfica de usuário (GUI)
Uma interface de usuário cujo uso depende de janelas, menus, ponteiros e outros elementos gráficos, em oposição a uma interface de linha de comando ou interface comandada por voz.
English

L

Licença Creative Commons
Um conjunto de licenças que podem ser aplicadas à trabalhos publicados. Cada licença é formada pela concatenação de um ou mais dos termos a seguir: -BY (Atribuição): pessoas usuárias devem citar a fonte original; -SA (CompartilhaIgual): pessoas usuárias devem compartilhar o seu próprio trabalho utilizando uma licença similar; -NC (NãoComercial): o trabalho não pode ser usado para fins comerciais sem a permissão das pessoas criadoras; -ND (SemDerivações): nenhum trabalho derivado (como traduções, por exemplo) pode ser criado sem a permissão das pessoas criadoras. Assim, CC-BY-NC quer dizer “pessoas usuárias devem atribuir autoria e não podem o conteúdo de forma comercial sem permissão”. O termo CC-0 (zero, não a letra ‘O’) é às vezes usado com o sentido de “sem restrições”, isto é, que o trabalho é de domínio público.
Deutsch, English, አማርኛ

M

média aritmética
Veja média.
Afrikaans, English, Español, Italiano, አማርኛ, Kiswahili
média
O valor médio de um conjunto de dados, mais apropriadamente conhecido como média aritmética para que seja distinguido da média geométrica e da harmônica.
median, mode
Afrikaans, Deutsch, English, Italiano, አማርኛ, Kiswahili
método abstrato
In programação orientada a objetos, um método que é definido mas não implementado. Pessoas programadoras definem um método abstrato em uma classe base para especificar operações que as classes derivadas devem prover.
Afrikaans, Deutsch, English, Español, Italiano, አማርኛ, اَلْعَرَبِيَّةُ, Bahasa Indonesia

N

numpy
É um pacote Python de código aberto que permite trabalhar com arrays, vetores e matrizes de dimensão N, em um método comparável e com uma sintaxe semelhante ao software Matlab. Você pode encontrar funções e operações sofisticadas, focadas em arrays multidimensionais, álgebra linear, transformada de Fourrier e geração de valores aleatórios.
Python
English, Español
número de linha absoluto
O índice sequencial de uma linha em uma tabela, independente de qual seção da tabela está sendo exibida.
Afrikaans, Deutsch, English, Español, עִברִית, Italiano, አማርኛ, اَلْعَرَبِيَّةُ, Bahasa Indonesia
número de linha relativo
O índice de uma linha em uma parte da tabela em exibição, que pode ou não ser igual ao número de linha absoluto na tabela.
English

P

pandas
É um pacote Python de código aberto que oferece estruturas de dados rápidas, flexíveis e expressivas para tornar o trabalho com dados estruturados e séries temporais fácil e intuitivo. É usado como uma ferramenta poderosa para análise e manipulação de dados.
Python
English, Español
pesquisa reprodutível
A prática de escrever e documentar resultados de pesquisa de forma que outras pessoas pesquisadoras possam executar novamente o código de análise com os mesmos dados para obter os mesmos resultados.
English
programação orientada a objetos (POO)
Um paradigma de programação no qual dados (atributos) e funções (métodos) são encapsulados em objetos que interagem entre si por meio de interfaces bem definidas.
English, Español
Python
Uma popular linguagem de programação interpretada, de código aberto, que depende de indentação para definir a estrutura de controle.
English, Español, Français, Italiano

R

R (linguagem de programação)
Uma linguagem de programação de código aberto usada principalmente para ciência de dados.
English, Français
R base
As funções básicas que compõe a linguagem R. Os pacotes de base podem ser encontrados em src/library e não são atualizados fora do R; eles seguem a numeração de versão do próprio R. Pacotes de base são instalados e carregados junto do R, enquanto pacotes prioritários são instalados com o R base mas precisam ser carregados antes do uso.
Tidyverse
Afrikaans, English, Español, አማርኛ
regra 68-95-99,7
Expressa o fato de que 68% dos valores estão dentro de um desvio padrão da média, 95% estão dentro de dois e 99,7% estão dentro de três. Inversamente, aproximadamente 0,3% dos valores estão mais do que três desvios padrões acima ou abaixo da média na maioria dos casos.
Afrikaans, Deutsch, English, Español, Français, Italiano, አማርኛ, اَلْعَرَبِيَّةُ, Bahasa Indonesia
repositório
Um local onde um sistema de controle de versão armazena os arquivos que compõem um projeto e os metadados que descrevem sua história.
Git, GitHub
English, Español, 日本語

S

sistema de controle de versão
Um sistema para gerenciar as mudanças feitas em um software durante o seu desenvolvimento.
Git
English, Español, Français
Stack Overflow
Um site de perguntas e respostas popular entre pessoas programadoras.
English, Español

T

Tidyverse
Uma coleção de pacotes de R para trabalhar de forma consistente com dados tabulares.
English, Español, Français

V

variável dependente
Uma variável cujo valor dependa do valor de outra variável, que é chamada de variável independente.
English, አማርኛ
viés
Uma estatística é enviesada se estiver sistemática ou consistentemente diferente do parâmetro que deveria estimar.
variance, overfitting, classification, systematic_error
Deutsch, English, Español, Setswana, isiXhosa, አማርኛ

X

XML
Um conjunto de regras para se definir etiquetas similares a HTML e usá-las para formatar documentos (normalmente, dados). XML foi popular no início dos anos 2000, mas sua complexidade fez com que muitas pessoas programadoras adotassem JSON em seu lugar.
Deutsch, English, Español, Français

Y

YAML
Acrônimo recursivo de “YAML Ain’t Markup Language” (YAML não é uma linguagem de marcação), é uma maneira de representar dados aninhados usando recuos (também chamados de indentações) no lugar de parênteses e vírgulas usados em JSON. YAML é frequentemente usado em arquivos de configuração e na definição de parâmetros para vários estilos de documentos em Markdown.
Deutsch, English, Español, Français, Bahasa Indonesia

Â

âncora
Em uma expressão regular, é um símbolo que fixa uma posição sem caracteres correspondentes. ^ identifica o começo de uma linha, enquanto $ indica o fim de uma linha e \b identifica uma quebra entre caracteres que formam e que não formam uma palavra.
Afrikaans, English, Español, Français