Чи думали ви коли-небудь про створення людської особи висотою 10 метрів або когось, хто прожив 500 років? Звучить абсурдно, правда? Але саме таке трапляється при створенні синтетичних наборів даних без належних обмежень.



Ось пастка: якщо ви не встановите реалістичні межі для діапазонів даних, ви визначите їх занадто широко. Наслідок? Ваш набір даних для навчання наповнюється сміттям — крайні випадки, яких ніколи не може бути в реальному світі.

Потім ви подаєте весь цей шум у вашу модель штучного інтелекту. Результат: витрати обчислювальних ресурсів, довші цикли навчання і модель, яка вчиться на неправильних прикладах замість корисних даних. Це все одно, що навчати когось керувати автомобілем, використовуючи інструкції з керування як автомобілями, так і літаками одночасно.

Урок? При створенні синтетичних даних для навчання моделі жорсткі обмеження, засновані на реальності, не просто корисні — вони критичні. Спершу визначте, що дійсно можливо. Все інше — це просто сміття.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити