А
абсолютний шлях
-
Шлях, який вказує на одне й теж саме місце у файловій системі незалежно від поточного розташування. Абсолютний шлях є аналогом широти та довготи в географії.
алгоритм
-
Алгоритм — це впорядкований набір кроків, інструкцій або правил, яких слід дотримуватися для виконання конкретного завдання. В інформатиці алгоритм - це набір інструкцій у комп’ютерній програмі, який розв’язує обчислювальну задачу.
аргумент
-
Термін не слід плутати з параметром, це не синонім. Аргумент — це фактичне значення, яке передається функції під час її виклику. Параметри та аргументи — це різні, але пов’язані поняття. Параметри — це змінні, а аргументи — це значення, які призначаються цим змінним.
аргумент командного рядка
-
Назва файлу, опція або інша інформація, яку передають програмі під час її запуску через інтерфейс командного рядка.
арифметичне середнє
-
Для набору з n чисел, обчислюється шляхом знаходження їх суми та ділення результату на n. Див. також середнє значення.
асинхронний (неодночасний)
-
Характеристика чогось, що відбувається не одночасно. У програмуванні асинхронна операція - це операція, яка виконується незалежно від інших, запускається або завершується у визначений час без очікування завершення інших операцій.
Б
базовий клас
-
У об’єктно-орієнтованому програмуванні клас, від якого походить дочірній клас.
байт
-
Одиниця цифрової інформації, яка зазвичай складається з восьми двійкових цифр, або бітів.
бінарний
-
Система, яка може мати один з двох можливих станів. В інформатиці часто представлена як 0 або 1. У булевій логіці представлена як хибність (0) або істина (1). Комп’ютери побудовані на системах, які зберігають 0 та 1 як біти.
біт
-
Одиниця інформації, яка представляє дві альтернативи, наприклад: так/ні, істина/хибність, 1 або 0 тощо.
булевий вираз
-
Пов’язаний зі змінною або типом даних, які можуть мати логічне значення істини або хибності. Цей термін походить від імені Джорджа Буля, математика 19-го століття. Двійкові системи, як і всі комп’ютери, будуються на основі системи логічного обчислення між станами істини та хибності (1 або 0).
В
великі дані (big data)
-
Збірки даних, які до недавнього часу були занадто великими для обробки на одному комп’ютері через обмежені можливості апаратного та програмного забезпечення.
верблюдячий регістр (camel case)
-
Стиль написання коду, який передбачає іменування змінних та об’єктів без пробілів, символів підкреслення (_), крапки (.) або тире (-). Кожне слово, іноді, за вийнятком першого слова, пишеться з великої літери, наприклад: CalculateSum та findPattern.
вихідний код
-
Вихідний код, або первинний код - це джерело коду, який виконується за допомогою інтерпретатора або компілятора. Здебільшого, це створена людиною серія команд, з яких складається програма. (Примітка: для деяких застосунків існують автоматичні генератори коду)
віддалений вхід
-
Початок інтерактивного сеансу роботи на одному комп’ютері з іншого комп’ютера, наприклад, за допомогою SSH.
віддалений репозиторій
-
Репозиторій, розташований на іншому сервері або пристрої. За допомогою системи контролю версій, такої як Git, можна синхронізувати локальні та віддалені репозиторії, що дозволяє спільну роботу.
відкрита наука
-
Підхід до створення наукового програмного забезпечення, даних та публікацій, який забезпечує їх наявність у відкритому доступі.
відкритий ідентифікатор дослідника і співавтора
-
ORCID зазначає “Open Researcher and Contributor ID”, тобто “відкритий ідентифікатор дослідника і співавтора”. Він унікально ідентифікує автора наукових праць. ORCID для науковців є еквівалентом DOI для документів.
Г
гармонійне середнє
-
Для набору з n чисел, обчислюється як n, поділене на суму обернених цих чисел. Його також можна обчислити як обернене від арифметичного середнього обернених значень. Гармонійне середнє використовується для оцінки середніх швидкостей зміни або інших коефіцієнтів. Для набору позитивних чисел, які не всі рівні між собою (або одне одному) виконується наступна нерівність: Мінімальне значення < Гармонійне середнє < Геометричне середнє < Арифметичне середнє < Максимальне значення.
гілка
-
Дивіться гілка Git.
гілка Git
-
Відгалуження від основної гілки розробки, що дозволяє ізолювати роботу над певними завданнями, такими як додання нових функцій або виправлення помилок, незалежно від змін в основній гілці чи інших відгалуженнях.
гістограма
-
Графічне представлення розподілу числових даних, де дані згруповані у рівновіддалені інтервали, а висота кожного стовпця відповідає частоті точок даних у цьому інтервалі.
гнучка розробка
-
Методологія розробки програмного забезпечення, яка робить акцент на поступових ітераціях і постійному зворотному зв’язку замість складання довгострокових планів. Дослідницьке програмування часто використовує гнучкий підхід.
графічний процесор
-
Спеціалізований процесор, призначений для паралельного виконання багатьох копій однієї програми. Спочатку розроблений для обробки графіки, але зараз також використовується для загальних обчислень у вигляді обчислювальних шейдерів.
Д
дефект (bug)
-
Несправність або помилка, яка призводить до небажаної поведінки програми.
довірчий інтервал
-
Діапазон, в якому з заданою ймовірністю знаходиться реальне значення оцінки.
дочірній клас
-
У об’єктно-орієнтованому програмуванні клас, що успадковується від іншого класу, який називається базовим класом.
З
звіт про дефект
-
Збірка файлів, журналів або пов’язаної інформації, яка описує або несподіваний результат роботи коду чи програми, або несподівану помилку чи попередження. Ця інформація використовується для допомоги у виявленні та виправленні дефектів у програмі.
зворотна сумісність
-
Властивість системи, апаратного або програмного забезпечення, що дозволяє взаємодіяти зі старішою системою або з вхідними даними, призначеними для такої системи. Наприклад, функція, написана на Python 3, яка може успішно виконуватися у Python 2, є зворотно сумісною.
змінна (програмування)
-
У мовах програмування - імʼя, якє має асоційоване з ним значення. Значення змінної може бути змінено після її створення.
значення, розділені комами
-
Текстовий формат для табличних даних, в якому кожен запис - один рядок, а поля розділені комами. Має багато незначних варіацій, особливо щодо використання лапок навколо рядків.
І
інтерпретатор
-
Програма, завдання якої полягає у виконанні програм, написаних високорівневою інтерпретованою мовою. Інтерпретатори можуть працювати інтерактивно або виконувати команди, збережені у файлі.
інтерпретована мова
-
Мова високого рівня, інструкції якої не виконуються напряму комп’ютером. Натомість її інструкції перекладаються у машинний код безпосередньо під час виконання за допомогою інтерпретатора.
інтерфейс програмування застосунків (API)
-
Набір функцій і процедур, наданих однією програмною бібліотекою або веб-службою, через які інший застосунок може з нею взаємодіяти. API – це не код, база даних чи сервер: це точка доступу.
історія команд
-
Автоматично створений список раніше виконаних команд. Більшість інтерпретаторів командного рядка, у тому числі Unix shell, зберігають історію та дозволяють користувачам відтворювати останні команди.
К
каталог
-
Елемент файлової системи, який може містити файли та інші каталоги. Також відомий як тека.
кеш
-
Програмний або апаратний механізм, що зберігає копії даних, щоб майбутні запити до них могли бути виконані швидше. Центральний процесор в комп’ютері використовує апаратний кеш для зберігання нещодавно доступних значень; багато програм покладаються на програмний кеш для зменшення мережевого трафіку та затримок. Перевірка, чи містить кеш застарілі дані, які потрібно оновити, є однією з двох найскладніших проблем в інформатиці.
кешування
-
Зберігання копії деяких даних у локальному кеші, щоб прискорити майбутній доступ.
клас
-
У об’єктно-орієнтованому програмуванні класи є шаблонами, за якими створюються об’єкти. Вони допомагають групувати разом пов’язані змінні та функції (названі методами). Програмісти зазвичай визначають загальну або спільну функціональність в базових класах, а більш детальну або специфічну функціональність в дочірніх класах.
когнітивне навантаження
-
Обсяг робочої памʼяті людини, необхідний для виконання набору одночасних завдань.
кодування
-
Процес переробки послідовності символів, таких як літери, цифри, знаки пунктуації та інші спеціальні символи, у інший формат, який передбачає їх ефективну передачу чи зберігання.
коефіцієнт кореляції
-
Показник статистичного зв’язку кореляції між двома змінними. Якщо коефіцієнт кореляції між X та Y дорівнює 1.0, то знання значення X дає змогу точно передбачити Y. За коефіцієнта кореляції 0.0 знання X не надає жодної інформації про Y. Якщо ж коефіцієнт дорівнює -1.0, то X прогнозує Y, але зміна X дозволяє передбачити протилежну зміну Y (наприклад, якщо X збільшується, то Y зменшується, і навпаки).
команда
-
Інструкція, яка наказує комп’ютерній програмі виконати певне завдання.
-
Текст, написаний у вихідному коді, який не вважається кодом для виконання, а описує що цей код робить. Зазвичай цей текст - короткі нотатки, які часто починаються з символу
#
(у багатьох мовах програмування).
коміт
-
Зробити коміт - зберегти набір змін до бази даних або репозиторію системи контролю версій. У цьому випадку, збережені зміни називаються комітом.
компільована мова
-
Мова програмування, яка компілюється у машинний код (як, наприклад, C та Fortran) або байт-код (як, наприклад, Java) перед виконанням програми. На відміну від компільованих мов, інтерпретовані мови, такі як Python, компілюються у машинний код безпосередньо під час виконання.
компілювати
-
Перетворювати текст або програмний код в іншу форму. Програми у компільованих мовах перетворюються на машинні інструкції для виконання комп’ютером, а текст у форматі Markdown зазвичай перетворюється у HTML для відображення на вебсторінках.
конфлікт Git
-
Ситуація, в якій несумісні або конфліктуючі зміни були внесені до різних гілок і виявлені під час їх об’єднання.
кореляція
-
Статистична взаємозалежність або співвідношення між двома випадковами змінними. Кореляція зазвичай вимірюється за допомогою коефіцієнта кореляції, і не передбачає причинно-наслідкового зв’язку.
М
машинне навчання
-
Дослідження або використання алгоритмів, продуктивність яких покращується із зростанням кількості оброблених даних. Алгоритми машинного навчання часто використовують навчальні дані для побудови моделі. Їх ефективність вимірюється здатністю прогнозувати властивості тестових даних.
мова розмітки гіпертексту (HyperText Markup Language)
-
Стандартна мова розмітки, що використовується для створення та структурування вебсторінок. HTML представлено у пам’яті за допомогою DOM (об’єктна модель документа).
Н
навігаційні стежки (хлібні крихти)
-
Група навігаційних посилань на багатьох веб-сайтах, які знаходяться на багатьох веб-сайтах та зазвичай містяться у верхній частині сторінки. Навігаці́йні стежки показують користувачам, де вони знаходяться відносно решти веб-сайту. Термін походить від казки “Гензель і Гретель”, в якій діти залишають за собою слід з хлібних крихт, щоб знайти дорогу додому.
налагодження
-
В комп’ютерному середовищі “налагодження” відноситься до процесу пошуку та виправлення помилок (також відомих як дефекти, або, неформально, “баги”) в комп’ютерних програмах або системах.
недруковані символи
-
У текстових процесорах - символи, які займають місце, але не створюють видимої позначки, такі як пробіл, новий рядок, розрив рядка або горизонтальна чи вертикальна табуляція.
нотація об'єктів JavaScript
-
Спосіб представлення даних шляхом комбінування значень у базових форматах (числа, рядки символів тощо) у структурах даних, таких як списки та словники. JSON розшифровується як “JavaScript Object Notation”; на відміну від більш чітко визначених стандартів, наприклад, XML, цей формат не ускладнений синтаксисом для коментарів або методами визначення схеми.
О
об'єктно-орієнтоване програмування
-
Стиль програмування, в якому функції та дані об’єднуються разом в об’єкти, які взаємодіють між собою тільки через чітко визначені інтерфейси.
обернене число
-
Обернене число для числа x дорівнює 1 / x, або, еквівалентно, x в степені -1.
обчислювальні шейдери
-
Шейдер загального призначення для використання у паралельній обробці. Часто використовується для машинного навчання, симуляцій та інших галузей, які отримують вигоду від паралельних обчислень.
П
параметр
-
Змінна, визначена в оголошенні функції та значення якої функція отримає під час її виклику. Параметри та аргументи — це різні, але пов’язані поняття. Параметри — це змінні, а аргументи — це значення, які призначаються цим змінним.
перегляд коду
-
Перевірка програми або змін у ній шляхом дослідження її вихідного коду.
перехопити (помилку)
-
Можливість перехопити помилку або інші несподівані події та обробити інформацію про них. У R рекомендується обробляти помилки за допомогою попередньо визначених умов, тоді як в інших мовах, таких як Python, помилки та повідомлення про них використовуються свідомо для спрощення вирішення проблем. Часто, крім типу помилки, збираються також додаткові дані для визначення можливих причин.
повідомлення коміту
-
Коментар, доданий до коміту, який пояснює, які зміни було зроблено та чому.
покриття коду (в тестуванні)
-
Показник, який визначає, наскільки велика частина бібліотеки або програми виконується під час виконання тестів. Зазвичай виражається у відсотках від кількості рядків коду: наприклад, якщо під час тестування виконується 40 з 50 рядків у файлі, то покриття коду становить 80%.
припущення
-
Булевий вираз, який повинен бути істинним під час його обчислення у програмі. Припущення можуть бути вбудованими в мову програмування (наприклад, оператор
assert
у Python) або надаватися як функції (наприклад, stopifnot
в R). Припущення часто використовуються розробниками під час тестування, але також можуть бути постійно залишені у коді для перевірки подальшої правильності його виконання. У багатьох мовах програмування припущення не слід використовувати для перевірки даних, оскільки компілятори та інтерпретатори можуть їх пропускати під час оптимізації. Використання припущень для перевірки даних може, таким чином, створити ризики безпеки. Але на відміну від багатьох мов, R не має оператора assert
, який можна вимкнути, тому використання такого пакета як assertr
для перевірки даних є безпечним.
Р
репозиторій
-
Місце, де система контролю версій зберігає файли, що складають проект, та метадані, які описують їхню історію.
рядок
-
У мовах програмування — блок тексту, тобто послідовність символів, яка використовується для зберігання та маніпуляції текстовими даними.
С
середнє значення
-
Середнє значення набору даних, більш відоме як арифметичне середнє, що відрізняється від геометричного та гармонічного середнього.
система контрою версій
-
Система для запису історїї змін, внесених до програмного забезпечення під час його розробки.
словник
-
Структура даних, яка містить пари ключ-значення. Кожна пара у словнику зіставляє ключ із пов’язаним значенням. Словники також іноді називаються асоціативними масивами, та часто реалізуються за допомогою геш-таблиць.
стандартне відхилення
-
Показник того, наскількі широко значення в наборі даних відрізняються від середнього. Обчислюється як квадратний корінь із дисперсії.
стек викликів
-
Структура даних, яка зберігає інформацію про підпрограми, що виконуються в даний момент, включаючи параметри, локальні змінні та інструкції повернення.
Т
тека
-
Синонім каталогу.
тестові дані
-
Частина набору даних, яка використовується для оцінки коректності алгоритму машинного навчання після його тренування. Тестові дані завжди повинні бути відокремлені від тренувальних даних, щоб гарантувати, що модель належним чином протестована на даних, які не використовувалися раніше.
точність
-
Статистична міра класифікаційної моделі, яка показує частку правильних прогнозів серед загальної кількості випадків. Обчислюється за формулою: Точність = (ІП + ІН) / (ІП + ІН + ХП + ХН). - ІП = істинно позитивні - ІН = істинно негативні - ХН = хибно негативні - ХП = хибно позитивні
трекер дефектів
-
Система для обліку виявлених дефектів у програмному забезпеченні, яка допомагає їх виправленню.
тренувальні дані
-
Частина набору даних, яка використовується для тренування алгоритму машинного навчання, щоб розпізнувати схожі дані. Тренувальні дані завжди мають бути відокремлені від тестових даних, щоб гарантувати, що модель протестована на даних, які не використовувалися раніше.
Ф
файлова система
-
Частина операційної системи, яка відповідає за зберігання та доступ до файлів. Також використовується для посилання на конкретний спосіб їх зберігання (наприклад, “файлова система Unix”).
Ц
центральний процесор
-
Основний апаратний компонент будь-якого цифрового комп’ютера. Центральний процесор складається з базових електронних схем, які інтерпретують і виконують інструкції з програмного або іншого апаратного забезпечення. Також називається головним процесором або мікропроцесором.
цикл
-
Структура у програмі, яка повторно виконує фрагмент коду, доки не буде виконана умова виходу.
цифровий ідентифікатор об'єкта
-
DOI, або Digital Object Identifier (цифровий ідентифікатор об’єкта) - це унікальний і постійний ідентифікатор книги, статті, звіту, набору даних, релізу програмного забезпечення або іншого цифрового носія.
Ш
шейдер
-
Програма, призначена для виконання на GPU. Загалом, використовується у графіці для розрахунку освітлення або позиціонування вершин у сцені, також може використовуватися для більш загального програмування за допомогою обчислювальних шейдерів.
штучний інтелект (ШІ)
-
Інтелект, який демонструють машини, на відміну від людей або інших тварин. ШІ може проявлятися через сприйняття, синтезування та виведення інформації. Серед завдань можна виділити обробку природної мови, комп’ютерний зір та машинне навчання.
A
Anaconda
-
Anaconda - це дистрибутив програмного забезпечення для мов програмування R та Python. Це також репозиторій програм з відкритим кодом в Python та R для аналізу даних, побудований на базі менеджеру пакетів conda. Після встановлення, Anaconda створює Anaconda Navigator, набір інструментів для робочого столу, включаючи [IDE] (#ide) та застосунок Jupyter Notebook.
ASCII
-
Стандартний спосіб представлення символів, які зазвичай використовуються в західноєвропейських мовах, у вигляді 7- або 8-бітних цілих чисел. Зараз замінений на Unicode.
G
Git
-
Система контролю версій для запису історїї змін у проєкті.
Git clone
-
Копіює (і зазвичай завантажує) віддалений репозиторій Git на локальну файлову систему.
Git fork
-
Копія існуючого репозиторію Git, власник якої може незалежно працювати над кодом, не впливаючи на оригінальний репозиторій.
Git merge
-
Злиття гілок у Git об’єднує історії розробки двох гілок в одну. Якщо зміни були внесені в ті ж самі частини коду в обох гілках, виникне конфлікт, який необхідно вирішити перед завершенням злиття.
Git pull
-
Отримує зміни з віддаленого репозиторію до локального репозиторію.
Git push
-
Надсилає зміни з локального репозиторію до віддаленого репозиторію.
Git remote
-
URL-адреса, що вказує на віддалений репозиторій, яка дозволяє надсилати локальні зміни або отримувати оновлення для проекту. Часто встановлюється з коротким ім’ям, таким як “origin”, для зручності. Іменування віддаленого репозиторію спрощує використання повторюваних команд, замість введення повного URL кожного разу.
GitHub
-
Хмарна платформа, побудована навколо Git, яка дозволяє зберігати версії вашого проекту онлайн і співпрацювати з іншими користувачами Git.
M
Markdown
-
Мова розмітки для полегшення написання та читання тексту у структурованому форматі. Markdown також дозволяє легко конвертувати текст у HTML. Markdown має простий синтаксис, та часто використовується для файлів README, а також є основою для R markdown.
P
pandas
-
Бібліотека з відкритим вихідним кодом для мови Python, призначена для обробки та аналізу даних. Вона надає такі структури даних, як Series та DataFrame. Series представляє собою одновимірний масив (список) з індексами, а DataFrame — двовимірну таблицю, подібну до електронної таблиці або бази даних, з рядками та стовпцями. Ця бібліотека дозволяє легко та інтуїтивно працювати зі структурованими даними та часовими рядами.
R
README (прочитай мене)
-
Файл у текстовому форматі, який містить важливу інформацію стосовно проєкту або пакета програмного забезпечення.
S
Secure Shell
-
Протокол і програма, яка його реалізує, що дозволяє віддалений доступ до сервера через захищений канал, де вся інформація шифрується.
SSH-ключ
-
Рядок випадкових бітів, збережений у файлі, який використовується для ідентифікації користувача в SSH. Кожен SSH-ключ має окремі публічну та приватну частини; публічну частину можна безпечно поширювати, але якщо приватна частина стає відомою, ключ вважається скомпрометованим.
U
Unicode
-
Промисловий стандарт і специфікація, розроблені для забезпечення цифрового представлення символів усіх писемностей світу та спеціальних символів. Unicode надає кожному символу його унікальний код. Специфікації Unicode постійно переглядаються й оновлюються для додавання нових мов і символів. Стандарт не визначає, як ці числові коди зберігаються в пам’яті комп’ютера; для цього існують інші стандарти збереження, такі як UTF-8.
UTF-8
-
Cпосіб зберігання числових кодів, що представляють символи Unicode в пам’яті. UTF-8 є системою кодування зі змінною довжиною, що використовує від одного до чотирьох байтів на символ. Якщо символ належить до перших 127 символів кодування ASCII, він кодується одним байтом, забезпечуючи повну сумісність з ASCII. Для інших символів використовуються два, три або чотири байти, залежно від конкретного символу. Це дозволяє ефективно зберігати тексти різних мов, хоча розмір памʼяті, потрібної для зберігання тексту, може збільшуватися.