Навчальний заклад: Тернопільська загальноосвітня школа I–III ступенів № 11 Тернопільської міської ради Тернопільської області
Автор: Бабій Софія Андріївна
Відділення: Математика
Секція: Прикладна математика
Область: Тернопільська
Опис:
У науково-дослідницькій роботі досліджено вплив вибору метрики відстані на ефективність алгоритму класифікації k-найближчих сусідів (k-NN) у системах штучного інтелекту. Метою роботи було експериментально визначити, як різні способи вимірювання відстані між об’єктами впливають на точність класифікації. Для цього проведено порівняльний аналіз чотирьох метрик: евклідової, манхеттенської, Чебишова та косинусної. У процесі дослідження розроблено програмний комплекс мовою Python, який автоматизує тестування алгоритму k-NN з різними параметрами. Експерименти виконувалися на кількох наборах різної складності: Iris, Wheat Seeds, Dry Bean та Breast Cancer Wisconsin. Для кожного з них здійснювався підбір кількості сусідів і обчислювалися показники точності класифікації. Отримані результати показали, що універсальної метрики відстані не існує, а її ефективність залежить від структури вибірки. Для простого набору Iris усі метрики продемонстрували подібну точність. Для задачі з менш чіткими межами класів Wheat Seeds найкращий результат показала манхеттенська метрика. У масштабному наборі Dry Bean найбільш стабільною виявилася евклідова метрика, а у задачі медичної діагностики Breast Cancer найвищу точність забезпечила косинусна подібність. Практична цінність роботи полягає у формулюванні рекомендацій щодо вибору метрик відстані для підвищення точності моделей машинного навчання.